第一版的阿尔法用棋谱,改进后的不靠棋谱,靠自己和自己下,叫阿尔法-零。就是从零开始,通过强化学习逐步改进,然后无敌天下。
来源:
湖西
于
2025-09-25 10:48:15
[
博客
] [
旧帖
] [
给我悄悄话
] 本文已被阅读:次