目前需要有人去搞评测分数,立即告诉用户:AI的回答每一段话蒙的成分是多少,说对的概率有多少
所有跟帖:
•
这东西就是只能靠搜索。归根到底本身仅仅是个统计模型。而且如果搜索到的信息是混乱的,它的答案就完全是自由放飞了。
-害怕-
♂
(0 bytes)
()
11/23/2025 postreply
09:56:18
•
有自由发挥的空间是好的,但是应当告诉用户:小心啰,这一段是自由发挥的,靠谱性存疑
-大海的声音-
♂
(0 bytes)
()
11/23/2025 postreply
10:03:05
•
他的自由发挥是在搜索到的结果里面的,而且是缺乏基本理性的。
-害怕-
♂
(0 bytes)
()
11/23/2025 postreply
10:06:01
•
那就是说,当下的LLM缺乏自省能力:Self Reflection
-大海的声音-
♂
(0 bytes)
()
11/23/2025 postreply
10:08:48
•
这块儿如果能加强一下,估计比现在更能打
-大海的声音-
♂
(0 bytes)
()
11/23/2025 postreply
10:11:13
•
基于统计模型,这方面无解。
-害怕-
♂
(0 bytes)
()
11/23/2025 postreply
10:12:54