AI象棋比赛在比什么

这个象棋比赛是对比现在市面上主要的几款通用大模型,在关键的Chain of Thought上的推理能力。这些模型不是那种专门设计的象棋比赛模型,是没有针对象棋进行过训练的。就类似于,一个大学生,每人看过几本象棋知识书,然后就开始比赛。这个比的就是对未知情况下,对逻辑的推理能力。
这个比赛是Google蹿搓的,本来他是想证明一下它的最新模型的能力,现在被严重打脸丢人…因为它最powerful的大模型,只和openAI的一个快速小模型相当。这个实在是差呀。
Musk的grok 4也干不过openAI的o3, 更别说快要上市的GPT5。 所以,老马也不要随便吹牛了。

所有跟帖: 

就是业余棋手下着玩 -zaocha2002- 给 zaocha2002 发送悄悄话 zaocha2002 的博客首页 (0 bytes) () 08/07/2025 postreply 12:12:33

请您先登陆,再发跟帖!