它用蒙地卡罗模拟许多可能,再用算法决定最好的一步。所以这一步是唯一的。那它开局应该每手棋都一样啊?当然据说它会从下过的棋学习。那第四盘它输了它怎么知道是那几手下错了?前三盘李输了,它也能知道李那几手下错了?
请教一下AlphaGo程式的算法
所有跟帖:
•
AlphaGo的思路可能已经不是人类可以理解和可以解释清楚的了。
-宇之道-
♀
(133 bytes)
()
03/13/2016 postreply
12:56:16
•
第四局前十一手与第二局完全相同,李第十二手下对了
-fourwaves-
♂
(68 bytes)
()
03/13/2016 postreply
13:35:12
•
既然,AlphaGo已经赢了。Google会不会关掉它的几个模块,进行一下科学实验。
-宇之道-
♀
(50 bytes)
()
03/13/2016 postreply
14:12:00
•
不符合西方人最重視的運動精神
-fourwaves-
♂
(0 bytes)
()
03/13/2016 postreply
14:15:44
•
符合科学探索精神。
-宇之道-
♀
(0 bytes)
()
03/13/2016 postreply
15:16:16
•
围棋是运动
-fourwaves-
♂
(0 bytes)
()
03/13/2016 postreply
15:40:33
•
如果AlGo团队有优秀的数学和控制论人才,在算法的研究上估计问题不会太大,但算法变成电脑程序的过程中要做到完美无瑕极不容易
-RCHZ-
♂
(698 bytes)
()
03/13/2016 postreply
21:49:46
•
它选择获胜几率最大的那一步棋,按概率来说,从狗的胜率就可以反推出它估算的胜利域值是多少。
-天方化戟-
♂
(0 bytes)
()
03/14/2016 postreply
06:40:21
•
看来它的问题还是很大
-fourwaves-
♂
(92 bytes)
()
03/14/2016 postreply
12:10:27
•
蒙特卡罗树这种算法本身就缺陷很大,电脑下围棋应该走一条不同的路子。
-天方化戟-
♂
(65 bytes)
()
03/14/2016 postreply
16:58:56
•
同意。应该使用......
-宇之道-
♀
(238 bytes)
()
03/15/2016 postreply
05:11:42