AI科普系列第一篇：为什么会有“幻觉”（Hallucination），AI 为什么会自信地“胡说八道”？

来源: 未完的歌于 2025-11-27 17:08:10 [档案] [博客] [旧帖] [给我悄悄话] 阅读数 : (11979 bytes)

本帖于 2025-11-27 17:09:43 时间, 由普通用户未完的歌编辑

刚做的

如果你使用大模型（LLM）的时间够长，一定会遇到这种情况：AI 给出的答案听起来非常连贯、语气非常肯定，但内容却是彻头彻尾的错误信息，甚至是不存在的“事实”。这就是我们常说的 AI “幻觉”（Hallucination）。

为什么这个被训练了海量数据的超级智能机器会如此自信地“撒谎”呢？

这是理解幻觉现象的 最根本原因。

我们之前提到，AI 的核心机制是 预测下一个最可能的词。它的训练目标是：生成看起来像人类写的、在统计学上最流畅、最连贯的文本。

AI 的目标函数是“流畅性”，而不是“事实准确性”。

想象一下：你问 AI “谁是 1999 年诺贝尔物理学奖得主？”。

AI 在它的巨大概率空间里搜索。
它发现 “诺贝尔物理学奖” 后面高概率跟着 “得主” 和 “名字”。
它找到了一堆名字，比如 $A$ 、 $B$ 、 $C$ 。
如果它的训练数据中，某个错误组合 $X$ 恰好出现过，或者某个名字 $X$ 在其他语境中和这个主题关联性很强，导致 $P(X | \text{前文}) = 52\%$ ，而正确的名字 $Y$ 的概率是 $P(Y | \text{前文}) = 48\%$ 。
AI 会毫不犹豫地选择概率更高的 $X$ 。

它不知道 $X$ 是错的，它只知道 $X$ 在统计学上最能让这句话“说得通”。一旦踏上这条错误但连贯的概率路径，它就会一路自信地错下去。

大模型的知识边界，不是一个清晰的墙，而是一个 概率的迷雾。

数据稀疏区： 对于那些在训练数据中出现频率很低、关联性很弱的“边缘知识”（比如非常小众的历史事件或专业术语），AI 建立的概率连接是模糊的。
“编织”能力过强： AI 善于“内插”（Interpolation），即根据已知的知识点推断中间的连接。当它遇到一个知识断层时，它不会承认自己不知道，而是会利用它强大的语言组织能力，把不相关的词语或概念“编织”在一起，创造出一个全新的、但逻辑上不成立的“事实”。

类比： 想象一个学生，只读过《红楼梦》和《西游记》的片段。当你问他：“贾宝玉和孙悟空第一次见面说了什么？”他可能会根据两个角色的说话风格，非常流利地 编造一段对话，因为他能模拟他们的语言模式，但这个事件本身是虚构的。

AI 的所有知识都源于它的训练数据。如果数据本身存在问题，幻觉就会被放大。

过时或错误信息： 训练数据源于互联网和书籍，其中不可避免地包含过时的信息、虚假的报道或错误的引用。
数据“污染”： 即使是正确的信息，也可能因为被其他错误信息“污染”（例如，在 Reddit 帖子中，一个正确的事实旁边总是跟着一句错误的戏谑），导致 AI 建立了错误的关联。

AI 无法区分“网上说的”和“真正的事实”。它只是忠实地反映了训练数据的统计学分布。

了解了原因，我们就能更好地使用 AI：

交叉验证： 永远不要将 AI 的输出（尤其涉及事实、数据、代码逻辑时）视为最终答案。
提示工程： 使用更清晰、更具体的提示词，例如：“请提供信息的来源。” 或 “请列出你推导出这个结论的步骤。” (这叫 CoT, Chain-of-Thought)
RAG (检索增强生成)： 许多高级 AI 系统会接入实时搜索或内部知识库。这能让 AI 强制基于“真实”的外部数据来生成答案，大大降低幻觉的发生。

您的位置：文学城 » 论坛 » 我爱我家 » AI科普系列第一篇：为什么会有“幻觉”（Hallucination），AI 为什么会自信地“胡说八道”？

• 跟人学的。 -偶尔短路- ♂ (0 bytes) () 11/27/2025 postreply 17:53:51