GPT5 来了

来源: 2025-08-07 13:50:00 [博客] [旧帖] [给我悄悄话] 本文已被阅读:

经济价值型任务表现

在 OpenAI 内部一个评估基准上,GPT5 同样表现卓越,该测试专门评估模型在复杂、经济价值知识型工作上的表现。在启用推理功能时,GPT?5 在大约半数案例中的表现达到或超越人类专家水平,同时在法律、物流、销售、工程等 40 多个职业领域的综合任务表现上全面优于 o3 模型和 ChatGPT Agent。