棋手是如何战胜AI 的

所有跟帖: 

我七年前就说不用adversarial policies就可以设计实验找出计算机围棋的问题,但需要规范实验环境 -ScottGu- 给 ScottGu 发送悄悄话 ScottGu 的博客首页 (191 bytes) () 03/23/2023 postreply 20:04:09

像下棋这样有固定规则和有限空间(围棋19x19)AI 最终一定赢。 -WaldenPond- 给 WaldenPond 发送悄悄话 (0 bytes) () 03/23/2023 postreply 20:07:55

是的,计算是电脑的强项,需要的是找出计算方法。 -yddad- 给 yddad 发送悄悄话 yddad 的博客首页 (0 bytes) () 03/23/2023 postreply 20:14:28

这需要验证。我早就提出用计算机围棋做智能技术实验工具,并告诉过一些人。以此可以寻找人工智能更精确的上限 -ScottGu- 给 ScottGu 发送悄悄话 ScottGu 的博客首页 (184 bytes) () 03/23/2023 postreply 20:15:43

AI 不会在同样的情况下输二次。 这要一直下, AI 一定胜利。 -WaldenPond- 给 WaldenPond 发送悄悄话 (0 bytes) () 03/23/2023 postreply 20:19:14

那个业余围棋手胜了十四盘。当然完全一样的局面,计算机第二次会知道上次走错了,但未必知道该怎么走赢 -ScottGu- 给 ScottGu 发送悄悄话 ScottGu 的博客首页 (105 bytes) () 03/23/2023 postreply 20:25:10

那位大概就是设计如何测试程序的, 知道AI 的软肋。 -WaldenPond- 给 WaldenPond 发送悄悄话 (0 bytes) () 03/23/2023 postreply 20:27:51

他公布的方法不复杂,直觉性很强 -ScottGu- 给 ScottGu 发送悄悄话 ScottGu 的博客首页 (0 bytes) () 03/23/2023 postreply 20:37:40

如果, alphago 马上把输的结果归纳进测试程序进行再训练, AI 就补上了那个缺陷。 -WaldenPond- 给 WaldenPond 发送悄悄话 (0 bytes) () 03/23/2023 postreply 20:44:27

如果这样不能解决问题, 那么 alphago 设计有缺陷。这样的反馈学习成本非常高。 -WaldenPond- 给 WaldenPond 发送悄悄话 (0 bytes) () 03/23/2023 postreply 20:47:35

据说是知道了上次的错误,光凭此经验仍可能不知道正确的走法,除非训练过程作大的改变 -ScottGu- 给 ScottGu 发送悄悄话 ScottGu 的博客首页 (155 bytes) () 03/23/2023 postreply 21:51:11

请您先登陆,再发跟帖!