现在的大语言模型还没有包括Reinforcement learning,怎么会每次用应用都是它学习的过程呢?

回答: 说AI还不那么好使的,一个重要原因是凊荷2026-02-05 16:13:54

模型训出来一个版本,参数都不会变了啊。你是说公司把人类和AI的互动都记下来,作为下一次training的input?

请您先登陆,再发跟帖!