如果这样不能解决问题, 那么 alphago 设计有缺陷。这样的反馈学习成本非常高。

请您先登陆,再发跟帖!