我当时就说:计算机围棋仍有严重问题。后来美国有业余棋手发现高水准计算机围棋的很多低级错误。
现在的计算机围棋没逼近最优解吧!
能快速试错成功的,准入门槛是否不高?
亚里斯多德建立动物分类法,欧几里得写The Elements。但两千年后拉瓦锡元素表却错误严重,有什么智力上难度或原因?
了解这些智力上的问题对理解人工智能的缺陷有帮助。
北京大学做了个语言模型的化学测试方案:越高级的知识,测试难度越大,跟测试人类一样,这也是语言模型测试包括医学测试普遍采用的模式。但这种测试方法无法正确测试人工智能。
其实人工智能连幼儿的智力都没有,连鼠、猫的智力都没有。年纪越小的人能通过的测试,如果人工智能却无法通过,这种测试题才是难度高的测试题。跟测试人的难度等级不同。黄仁勋先生五年内实现通用人工智能AGI的愿景也应该这样测试。
所以,现在的人工智能医生只能记一些知识,没有人类智力,靠得住吗?
而elements和元素的问题,只是中学生知识。