OpenAI 最强 AI 智能体编程模型：GPT-5.3-Codex 登场，基准测试全面霸榜

2026-02-06 发布浏览175次点赞0次收藏0次

感谢网友 Domado、alahu帅天、补药吖、西窗的线索投递！

2 月 6 日消息，OpenAI 昨日（2 月 5 日）发布公告，宣布推出 GPT-5.3-Codex，宣称这是其迄今最强的 AI 智能体编程模型。

附上相关基准测试结果如下：

在 SWE-bench Pro（公开版）测试中，该模型得分 56.8%，超越了前代的 56.4%；
在 Terminal-Bench 2.0 测试中，其得分从前代的 64.0% 大幅跃升至 77.3%；
最为显著的是在 OSWorld-Verified 智能体计算机操作基准测试中，得分从 38.2% 飙升至 64.7%，表明其在复杂环境下的操作能力实现了质的飞跃。
官方数据显示，该模型不仅在多项编程基准测试中创下新高，运行速度也比前代 GPT-5.2-Codex 提升了 25%。

OpenAI 最强 AI 智能体编程模型：GPT-5.3-Codex 登场，基准测试全面霸榜

OpenAI 致力于将 GPT-5.3-Codex 打造为更优秀的开发者协作工具。新模型支持用户在任务执行过程中进行“引导与交互”，且不会导致上下文丢失。

在 Codex 应用中，模型会高频更新工作进度，允许开发者实时提问、讨论方案并修正方向。官方博文指出，Codex 正从单一的编程智能体演变为更通用的计算机协作者，大幅降低了构建应用的门槛。

GPT-5.3-Codex 目前已全面向 ChatGPT 付费用户开放，涵盖 Plus、Team 及 Enterprise 等订阅计划。用户可通过 Codex 应用、命令行工具（CLI）、IDE 扩展插件及网页端立即访问，API 版本也将在近期上线。

ChatGPT IDE AI 测试 4 OpenAI GPT

声明：本文转载自IT 之家，转载目的在于传递更多信息，并不代表本社区赞同其观点和对其真实性负责，本文只提供参考并不构成任何建议，若有版权等问题，点击这里。