别太信任ChatGPT：大模型“一本正经地胡说八道”风险与应对

如今，我们很多人都被 ChatGPT 的强大能力震惊过。它能续写你的句子，撰写整篇文章，建议代码修复方案，甚至在你心情糟糕时扮演你的私人心理咨询师。它流畅、快速，有时甚至令人惊异地有用。然而，问题也恰恰在于此：我们开始过度信任它，这正是OpenAI首席执行官Sam Altman反复强调的——大模型 仍然会“一本正经地胡说八道”，即产生幻觉。本文将深入探讨 ChatGPT 及其他 大模型 的幻觉问题，分析其成因、潜在风险，并提供相应的应对策略，帮助大家在使用这些强大工具的同时，保持批判性思维。

幻觉：AI的固有缺陷

幻觉并非 ChatGPT 或其他 大模型 的 Bug，而是其工作方式的必然结果。这些模型通过消化海量的互联网数据并预测下一个词语来运作，它们并不真正“知道”任何事情，不会进行自我验证，也并不关心答案是否正确。当模型缺乏真实答案，或者答案模糊不清、罕见或在训练数据中 representation 不佳时，它就会即兴发挥，创造出听起来合理的答案，例如捏造的引用、虚构的引言、编造的法律，甚至是不存在的科研论文。

这种幻觉的存在是由 大模型 的底层架构决定的。它们依赖于统计概率，而非逻辑推理。这意味着，即使模型生成的文本在语法和风格上完美无瑕，也并不保证其内容的真实性。例如，笔者在撰写一篇关于技术主题的报告时，利用 大模型 进行深度研究，却发现30%的结果含糊不清，甚至存在事实性错误。

信任的蔓延：从谨慎试探到盲目依赖

最初，人们对 ChatGPT 持谨慎态度，尝试各种奇怪的 prompt，测试其能力极限，并对结果进行事实核查。这是一种有趣、实验性且略带不可预测性的过程，就像给一只非常聪明的鹦鹉戴上扩音器。

然而，现在人们开始使用 ChatGPT 撰写法律文件、起草政策、总结数百页的论文、解释税法，甚至回答医疗问题。信任度也从最初的“也许”变成了“默认”。这才是危险所在。

一个典型的案例是法律行业的应用。一些律师事务所开始使用 ChatGPT 来辅助法律研究，但由于模型可能产生幻觉，导致律师引用不存在的判例或法律条文，从而造成严重的法律风险。又比如，在医疗领域，如果患者完全依赖 ChatGPT 提供的医疗建议，而忽视了专业医生的诊断，可能会延误病情，甚至危及生命。

不止是ChatGPT：所有大模型的通病

并非只有 ChatGPT 存在幻觉问题，所有主流 大模型，包括 Claude、Gemini、LLaMA 和 DeepSeek 等，都存在同样的问题。它们都以相同的方式进行训练：消化互联网数据并预测下一个词语。它们不“知道”事情，不会进行自我验证，也不关心自己是否犯错。

因此，仅仅因为内容清晰易懂，并不意味着它是正确的。这是 AI 最大的错觉：清晰度伪装成真理。例如，Google 的 Gemini 在图像生成方面就曾出现过 “一本正经地胡说八道” 的情况，比如生成了穿着二战时期德军制服的不同种族的人，引发了不小的争议，也使得Google暂停了 Gemini 的图像生成功能。

常见的幻觉陷阱

如果你经常使用 ChatGPT，你可能已经遇到过以下几种幻觉：

捏造参考文献：当你要求它提供参考文献时，它经常会生成一些看起来很学术，但实际上并不存在的论文。
歪曲事实的摘要：给它一篇article，它可能会以一种完全改变原文含义的方式进行总结。
虚假的自信：它从不说“我不确定”，而是用权威的口吻来掩盖不确定性。
过度简化：它会抹平细微差别，忽略极端情况，并将复杂的问题呈现为非黑即白。
重复偏见：如果互联网上存在对某个话题的偏见（剧透：确实存在），模型也会受到影响。

生产力的假象

还有一个陷阱：仅仅因为 ChatGPT 快速地给你一些东西，并不意味着它是有用的。

有时它会写出语法优美但内容错误的文本。有时它会给你五个自信满满的 bullet point，但它们都略有偏差。但因为它的速度很快，而且看起来很精致，你的大脑会放松下来。你感觉自己在取得进展。这就是危险所在。

试想一下，你正在撰写一份市场营销计划， ChatGPT 快速地为你生成了一份看似完美的报告，其中包含详细的数据和分析。然而，由于模型产生了幻觉，报告中引用的市场数据实际上是捏造的，导致你基于错误的信息制定了错误的营销策略，最终导致营销活动的失败。

幻觉的后果

不加验证地使用 ChatGPT 可能会导致以下后果：

错误的决策：无论是招聘、商业策略还是健康问题，错误的信息都可能造成实际损害。
尴尬的局面：想象一下，你在会议上引用了一项虚假的研究，或者在报告中引用了一个编造的判例。
信任的丧失：一旦人们意识到你是在未经检查的情况下从 AI 复制粘贴，就很难重建信任。
思维的惰性：你越依赖它，就越不会质疑。你的批判性思维被外包出去。

例如，一家公司在招聘过程中使用 ChatGPT 来筛选简历，但由于模型存在偏见，错误地过滤掉了一些优秀的候选人，导致公司错失了宝贵的人才。又比如，一位医生在诊断疾病时依赖 ChatGPT 的建议，但由于模型产生了幻觉，给出了错误的诊断，导致患者延误了治疗。

如何有效利用大模型，避免幻觉陷阱

这并不意味着我们不应该使用 AI。这只是意味着我们应该把它当作一个有帮助但不可靠的助手：

Double-check everything：特别是事实、数字、链接和名称。
使用基于检索的模型：像 Perplexity 或带有网页浏览插件的 ChatGPT 这样的工具可以给你提供来源。
交叉提问：在两个不同的模型中尝试相同的问题。差异通常能说明问题。
不要依赖语气：仅仅因为它听起来平静和消息灵通，并不意味着它知道自己在说什么。
要求它验证之前生成的回应。

可以尝试以下方法来验证 ChatGPT 生成的内容：

独立验证：通过搜索引擎、学术数据库或其他可靠来源，独立验证模型提供的任何事实、数据或引用。
来源审查：仔细检查模型提供的任何链接或参考文献，确保它们是真实存在的，并且与模型声称的内容相符。
逻辑推理：评估模型提供的论证是否合理，是否存在逻辑漏洞或矛盾之处。
专业咨询：对于涉及专业领域的问题，向相关领域的专家进行咨询，以验证模型提供的答案是否准确。

谁该为AI的谎言负责？

是你。

这是你的工作。你的名字。你的决定。

如果 AI 犯错，而你重复了它，那是你的责任——不是模型，不是制造它的公司。我们不会让 GPS 应用程序驾驶我们的汽车。我们不会让自动更正来写我们的小说。为什么我们要让 LLM 在未经质疑的情况下做出实际决策？

结论：信任，但要质疑

ChatGPT 很好。有时好得吓人。它可以节省时间、激发创意，并减轻空白页的压力。但它不是真理的来源。它不是魔法。而且它绝对不能幸免于失败。

把它当作一个自以为无所不知的聪明实习生——但绝对需要一个事实核查员在他们身后盯着。

使用它。与它合作。印象深刻。只是不要在这样做的时候关掉你的大脑。在使用 ChatGPT 和其他 大模型 的过程中，保持批判性思维，积极验证模型生成的内容，才能真正发挥这些工具的潜力，避免潜在的风险。记住，即使是看起来最智能的 AI，也需要我们人类的智慧来指导和监督。

别太信任ChatGPT：大模型“一本正经地胡说八道”风险与应对