Nature报道ChatGPT打破图灵测试,并把寻找评估人工智能新方法当作竞赛新焦点,就反映了这样的趋势。
ChatGPT问题很多很明显,这只能进一步证明图灵测试无效。AlphaGo Zero的superhuman performance也不对。但Deepmind早就宣布AlphaGo Zero退休,没法用新方法评估。是Deepmind理亏。
Google的Driverless car项目和Waymo的无人汽车涉及公共安全,但只由公司自己测试、自己申报。这样的程序当然有问题。要考虑到人类智力的模式演变高度不稳定,与人类智力互动和竞争的无人汽车在大规模部署较长时间后,其特性和缺陷会被普通人了解而产生新问题,包括严重的问题。
工程技术更新很快。我刚来美国时就听说计算机技术方面的教材两、三年就不得不更新。否则很快会落伍。
所以现在的人工智能教材,特别是测试方法,成了大问题。
这些正是科学逻辑研究和教育的主要目的,包括正确设计和分析规范科学实验和测试人工智能技术。
再提醒一下,生命科学的盲法试验,包括双盲试验,实际上基于一些心理学概念。这跟图灵测试用屏蔽测试者和被测试的人和人工智能的方法是在同一层次。
按照我的智力科学理论,生物学、生理医学、心理学都是动物生理层次的,无法正确测试、分析人类特有智力。物理科学、生命科学、智力科学也需要不同的参照系,不能停留在广义相对论的参照系理论上。
科学教育需要从不同的角度不断重复基本原理,以加深理解。这比小说、电影要枯燥一些。但对基本原理熟悉、透彻后,才能有更进一步的认识。
有人用诗描述治学三境界:“独上高楼,望尽天涯路”是第一境。“衣带渐宽终不悔,为伊消得人憔悴”是第二境。“众里寻他千百度,蓦然回首,那人却在,灯火阑珊处”是第三境。
评估人工智能不会像开发人工智能那样对公众造成威胁,所以是安全、和平的基础研究。
当然基础科学挣钱不多,但能引领未来趋势的智力科学基础研究新方向,说不定会在学生一辈中催生出未来的科技领袖。也会对教育、司法、人类在太空中的基因和智力演变产生很大影响。