请教一下AlphaGo程式的算法

来源: fourwaves 于 2016-03-13 09:15:49 [旧帖] [给我悄悄话] 本文已被阅读：次

它用蒙地卡罗模拟许多可能，再用算法决定最好的一步。所以这一步是唯一的。那它开局应该每手棋都一样啊？当然据说它会从下过的棋学习。那第四盘它输了它怎么知道是那几手下错了？前三盘李输了，它也能知道李那几手下错了？