v3.1不怎么样。上下文窗口太小,实用性低。要是比测试,gpt-4都有胜过gpt-5的地方,更不用说可以刷题训练模型。

来源: 2025-08-30 14:47:53 [博客] [旧帖] [给我悄悄话] 本文已被阅读: