ChatGPT总会有莫名其妙的错误,即使是回答现成的结果。比如让它证明勾股定理

可能你觉得不会证,其实有上百种证明方法,这样的东西对ChatGPT 来说比随机的小学应用题还简单

不就是搜索而已

它给了我利用射影定理的证法。的确是比较简单的,左右两边各用一次,加起来就是勾股定理。

可是,问题是,就这么几行东西,里面也有错,它把线段端点字母写错了

看起来连个基本的自我逻辑检查都没有,纯纯的每个输出都是概率模型加权算出来的

不知道是权重给的不合适还是随机权重,写出来的线段跟证明结果无关

但是结论是对的

 

所有跟帖: 

它会改错的(如果你把你认为它错的地方反馈给它的话)。 -旅行中- 给 旅行中 发送悄悄话 (0 bytes) () 09/08/2025 postreply 10:36:17

就这种改错的能力就比很多(尤其股市里)脑筋僵化的人类要好很多。 -旅行中- 给 旅行中 发送悄悄话 (0 bytes) () 09/08/2025 postreply 10:39:52

这种改错可能是人为故意提供的有目的性的答案, 结果可能更差, 由胡说变成被操纵 -testmobile- 给 testmobile 发送悄悄话 (0 bytes) () 09/08/2025 postreply 10:58:56

当前AI的局限性和资金的追捧不矛盾~ 一方面是看好未来,一方面是资金炒作 -ocliving2005_4ever- 给 ocliving2005_4ever 发送悄悄话 (33 bytes) () 09/08/2025 postreply 10:38:41

你用的是免费版吧,试试ChatGPT 5 thinking,幻觉已经大幅度减少了 -Harp- 给 Harp 发送悄悄话 (0 bytes) () 09/08/2025 postreply 10:40:09

本质上应该没有大区别,不然,应该改名字了。 -TalkToMi- 给 TalkToMi 发送悄悄话 (0 bytes) () 09/08/2025 postreply 10:42:46

在免费版本提供错乱答案, 在付费版本提高正确答案, 这种设计思路本来就是错的, 付费和免费版本的区别应是每天使用次数, -testmobile- 给 testmobile 发送悄悄话 (0 bytes) () 09/08/2025 postreply 10:52:52

所以我不相信付费的ChatGPT 5 thinking幻觉会少, 如果是, 就说明这个产品设计师是个蠢蛋 -testmobile- 给 testmobile 发送悄悄话 (0 bytes) () 09/08/2025 postreply 10:54:08

标准模型就是牺牲准确率提高速度,跟让一个人不思考零秒快答一样,跟蠢蛋无关。 -lanyin0314- 给 lanyin0314 发送悄悄话 (1483 bytes) () 09/08/2025 postreply 11:01:01

more detailed mode不是提高了正确性, 而是提供更多细节, 现在我的感觉就是说更多废话 -testmobile- 给 testmobile 发送悄悄话 (0 bytes) () 09/08/2025 postreply 11:05:05

GPT5出来以后,连个大点水花都看不见,就知道这个版本目前为止,没有质的变化. 大家还在炒作AI, 不过 -ocliving2005_4ever- 给 ocliving2005_4ever 发送悄悄话 (77 bytes) () 09/08/2025 postreply 11:03:09

跟版本无关。很显然,你以为它在推导,其实它的每一步都在抄袭。所以即使部分有错甚至已经错的离谱,下一步抄的是正确答案就回来 -害怕- 给 害怕 发送悄悄话 (498 bytes) () 09/08/2025 postreply 11:11:19

请您先登陆,再发跟帖!