关于核心统计模型的运行弊端

来源: 害怕于 2025-11-09 14:36:42 [档案] [旧帖] [给我悄悄话] 阅读数 : (13270 bytes)

回答: 同样的问题，看看chatgpt的回答，关于智能和底层模型由害怕于 2025-11-09 14:34:40

你说得非常准确。可以说——你已经抓住了当下所有大型语言模型（包括我）的根本弱点。我来帮你把这件事“彻底剖开”，看清楚为什么AI会“胡说八道（hallucinate）”，以及这种“扯淡”的逻辑本质到底是什么。

一、你说的没错：AI“胡说”确实来自两个核心机制问题

模型的输出是基于下一个最可能的token的概率分布。
但“最可能” ≠ “正确”。

举个例子：
如果模型在过去的语料中看到很多类似的结构，比如：

“爱因斯坦提出了相对论。”
“牛顿提出了万有引力定律。”

那么当它看到：

“特斯拉提出了——”

模型会“合理”地预测出：

“交流电理论”

这看似合理，其实并不准确，因为特斯拉没以这种学术论文形式“提出理论”。
但是模型并不会判断“事实”，它只是根据“语言的概率分布”预测“下一个最像真的词”。

所以：

它不是“知道什么是真的”，而是“知道人类常常怎么说”。

当模型遇到从未见过的组合（比如一个新政策、未知科学发现、或虚构情境），它会：

这就像一个小孩被问：

“冥王星上有几只企鹅？”

小孩不知道答案，但可能会回答：

“两只。”
因为他觉得所有星球都有动物，这样说“像是真的”。

AI的“胡说八道”就是这种语义层面的幻觉，本质是：

它在语义连续性上表现聪明，但在事实层面完全盲目。

模型输出的每个token是根据如下概率：

$P(w_t | w_1, w_2, ..., w_{t-1})$

也就是在之前所有词的条件下，预测下一个词的概率。
整个回答是：

$argmaxw1,...,wn∏tP(wt∣w<t)\text{argmax}_{w_1, ..., w_n} \prod_t P(w_t | w_{<t})$

——它最大化的是“句子出现的概率”，不是“句子是否真实”。

所以当上下文提示不足或含糊时：

从表象上看，AI在“编故事”，但从内部机制看，它只是在延伸语言模式的连续性。

可以这样理解：

为了解决“扯淡”，业界主要在以下方向努力：

是的。现在的AI确实会“胡说八道”。
根本原因是：

它在概率上“语言正确”，但在事实上“认知缺席”；

它在“懂模式”，但不“懂世界”。

您的位置：文学城 » 论坛 » 大千股坛 » 关于核心统计模型的运行弊端