这个象棋比赛是对比现在市面上主要的几款通用大模型,在关键的Chain of Thought上的推理能力。这些模型不是那种专门设计的象棋比赛模型,是没有针对象棋进行过训练的。就类似于,一个大学生,每人看过几本象棋知识书,然后就开始比赛。这个比的就是对未知情况下,对逻辑的推理能力。
这个比赛是Google蹿搓的,本来他是想证明一下它的最新模型的能力,现在被严重打脸丢人…因为它最powerful的大模型,只和openAI的一个快速小模型相当。这个实在是差呀。
Musk的grok 4也干不过openAI的o3, 更别说快要上市的GPT5。 所以,老马也不要随便吹牛了。
AI象棋比赛在比什么
所有跟帖:
•
就是业余棋手下着玩
-zaocha2002-
♀
(0 bytes)
()
08/07/2025 postreply
12:12:33