从deepmind公司那个alpha go/zero 看,就是大量试错,缺少人类直觉, 但靠强大的计算,试错的算路长速度快。

来源: inosine 2019-06-10 06:28:55 [] [旧帖] [给我悄悄话] 本文已被阅读: 次 (0 bytes)
回答: AI就是统计学?外乡人2019-06-10 05:39:03

所有跟帖: 

据我粗略的了解,你说了一半--搜索树, deepmind的发明是结合了策略树; -SwiperTheFox- 给 SwiperTheFox 发送悄悄话 SwiperTheFox 的博客首页 (0 bytes) () 06/10/2019 postreply 06:34:16

策略也是人为的,不是AI自己的 -inosine- 给 inosine 发送悄悄话 (0 bytes) () 06/10/2019 postreply 06:37:36

Master的策略是通过机器学习人类棋谱, 有人类的input; -SwiperTheFox- 给 SwiperTheFox 发送悄悄话 SwiperTheFox 的博客首页 (93 bytes) () 06/10/2019 postreply 06:39:53

不错啊,还是试错,不过不是从人类经验而是AI自己之间。但方案还是人类提供的。部分是中国人的一个论文 -inosine- 给 inosine 发送悄悄话 (0 bytes) () 06/10/2019 postreply 06:44:01

应该是黄博士的论文吧~~~~ -SwiperTheFox- 给 SwiperTheFox 发送悄悄话 SwiperTheFox 的博客首页 (0 bytes) () 06/10/2019 postreply 06:53:18

不是,是这篇: -inosine- 给 inosine 发送悄悄话 (691 bytes) () 06/10/2019 postreply 07:04:22

查了Master 的文献, -SwiperTheFox- 给 SwiperTheFox 发送悄悄话 SwiperTheFox 的博客首页 (261 bytes) () 06/10/2019 postreply 07:32:34

是Alpha go zero的文献 -inosine- 给 inosine 发送悄悄话 (0 bytes) () 06/10/2019 postreply 07:40:08

Alpha0早就不是这个路子了,而是强劲的自学习。从零开始(不输入任何人类棋谱)下20盘就超过人类,下40盘超过Alpha狗 -味苦- 给 味苦 发送悄悄话 味苦 的博客首页 (98 bytes) () 06/10/2019 postreply 06:58:39

自学习也是试错啊,另外再想了想,人类直觉也是在有限试错基础上经验总结,只有少数“蒙”对了,大张旗鼓宣传出来了。 -inosine- 给 inosine 发送悄悄话 (0 bytes) () 06/10/2019 postreply 07:09:39

请您先登陆,再发跟帖!