如果, alphago 马上把输的结果归纳进测试程序进行再训练, AI 就补上了那个缺陷。

来源: WaldenPond 2023-03-23 20:44:27 [] [旧帖] [给我悄悄话] 本文已被阅读: 次 (0 bytes)
本文内容已被 [ WaldenPond ] 在 2023-03-23 20:45:19 编辑过。如有问题,请报告版主或论坛管理删除.
回答: 他公布的方法不复杂,直觉性很强ScottGu2023-03-23 20:37:40

所有跟帖: 

如果这样不能解决问题, 那么 alphago 设计有缺陷。这样的反馈学习成本非常高。 -WaldenPond- 给 WaldenPond 发送悄悄话 (0 bytes) () 03/23/2023 postreply 20:47:35

据说是知道了上次的错误,光凭此经验仍可能不知道正确的走法,除非训练过程作大的改变 -ScottGu- 给 ScottGu 发送悄悄话 ScottGu 的博客首页 (155 bytes) () 03/23/2023 postreply 21:51:11

请您先登陆,再发跟帖!

发现Adblock插件

如要继续浏览
请支持本站 请务必在本站关闭/移除任何Adblock

关闭Adblock后 请点击

请参考如何关闭Adblock/Adblock plus

安装Adblock plus用户请点击浏览器图标
选择“Disable on www.wenxuecity.com”

安装Adblock用户请点击图标
选择“don't run on pages on this domain”