请教一下AlphaGo程式的算法

来源: fourwaves 2016-03-13 09:15:49 [] [旧帖] [给我悄悄话] 本文已被阅读: 次 (320 bytes)

它用蒙地卡罗模拟许多可能,再用算法决定最好的一步。所以这一步是唯一的。那它开局应该每手棋都一样啊?当然据说它会从下过的棋学习。那第四盘它输了它怎么知道是那几手下错了?前三盘李输了,它也能知道李那几手下错了?

所有跟帖: 

AlphaGo的思路可能已经不是人类可以理解和可以解释清楚的了。 -宇之道- 给 宇之道 发送悄悄话 宇之道 的博客首页 (133 bytes) () 03/13/2016 postreply 12:56:16

第四局前十一手与第二局完全相同,李第十二手下对了 -fourwaves- 给 fourwaves 发送悄悄话 (68 bytes) () 03/13/2016 postreply 13:35:12

既然,AlphaGo已经赢了。Google会不会关掉它的几个模块,进行一下科学实验。 -宇之道- 给 宇之道 发送悄悄话 宇之道 的博客首页 (50 bytes) () 03/13/2016 postreply 14:12:00

不符合西方人最重視的運動精神 -fourwaves- 给 fourwaves 发送悄悄话 (0 bytes) () 03/13/2016 postreply 14:15:44

符合科学探索精神。 -宇之道- 给 宇之道 发送悄悄话 宇之道 的博客首页 (0 bytes) () 03/13/2016 postreply 15:16:16

围棋是运动 -fourwaves- 给 fourwaves 发送悄悄话 (0 bytes) () 03/13/2016 postreply 15:40:33

如果AlGo团队有优秀的数学和控制论人才,在算法的研究上估计问题不会太大,但算法变成电脑程序的过程中要做到完美无瑕极不容易 -RCHZ- 给 RCHZ 发送悄悄话 (698 bytes) () 03/13/2016 postreply 21:49:46

它选择获胜几率最大的那一步棋,按概率来说,从狗的胜率就可以反推出它估算的胜利域值是多少。 -天方化戟- 给 天方化戟 发送悄悄话 天方化戟 的博客首页 (0 bytes) () 03/14/2016 postreply 06:40:21

看来它的问题还是很大 -fourwaves- 给 fourwaves 发送悄悄话 (92 bytes) () 03/14/2016 postreply 12:10:27

蒙特卡罗树这种算法本身就缺陷很大,电脑下围棋应该走一条不同的路子。 -天方化戟- 给 天方化戟 发送悄悄话 天方化戟 的博客首页 (65 bytes) () 03/14/2016 postreply 16:58:56

同意。应该使用...... -宇之道- 给 宇之道 发送悄悄话 宇之道 的博客首页 (238 bytes) () 03/15/2016 postreply 05:11:42

请您先登陆,再发跟帖!