请教一下AlphaGo程式的算法

来源: 2016-03-13 09:15:49 [旧帖] [给我悄悄话] 本文已被阅读:

它用蒙地卡罗模拟许多可能,再用算法决定最好的一步。所以这一步是唯一的。那它开局应该每手棋都一样啊?当然据说它会从下过的棋学习。那第四盘它输了它怎么知道是那几手下错了?前三盘李输了,它也能知道李那几手下错了?