第一版的阿尔法用棋谱,改进后的不靠棋谱,靠自己和自己下,叫阿尔法-零。就是从零开始,通过强化学习逐步改进,然后无敌天下。

来源: 2025-09-25 10:48:15 [博客] [旧帖] [给我悄悄话] 本文已被阅读: