Nature报道ChatGPT打破图灵测试,并说寻找评估人工智能新方法的竞赛开始了。
事实上ChatGPT问题很多很明显,所以这只能进一步证明图灵测试无效。
如果以前很多人不理解为什么GRE是研究生入学能力考试、跟能力有什么关系,现在面对大数据语言模型的问题,应该理解了。这是最新科技问题,跟未来的重要能力相关。
语言是数学、哲学、科学的基础。但光测试语言智力不行,还需要逻辑测试,需要科学逻辑的测试,需要测试未来更重要、更基础的数学。
Boston University有个叫奚宏伟的学者,GRE分数比我还要高一点。他懂一些逻辑,但应该不懂科学逻辑,没有其他人研究科学逻辑成功。不知道他近年是否还在研究逻辑。
文学城有个叫骆远志的工科研究生中的高材生,GRE分数好像比奚宏伟还高一点。但他不懂逻辑。实际上也不真懂数学。他想谈逻辑和数学的关系,但有点驴头不对马嘴。
Gerard't Hooft这样的科学家也不懂逻辑,不懂有无数种数学逻辑和哲学逻辑,但没有一种适用于自然语言和科学。也不懂逻辑和自由意志的关系。
这就是为什么GRE考试需要改进。近年GRE考试已经有了些改进,但远远不够。
现在GRE考试得高分的,无法回答出我提出的一些科学逻辑和数学的基础问题,语言智力测试也需要改进。看主流人工智能教科书和人工智能发展动态就知道现在主流学术界里没有答案。
但需要先完成一些基础研究,才能展开GRE的相关研究。