Codex
2 月 5 号 OpenAI 发布了 GPT-5.3-Codex,相比之前 GPT-4 之后发布的版本,这次社区反馈效果要好很多,下面主要聊聊 GPT-5.3-Codex 的主要功能和使用场景。
在深入 GPT-5.3-Codex 之前,我们先回答一个基础问题:
什么是 Codex?
Codex 是 OpenAI 推出的软件工程智能体(Coding Agent)。
它的定位不是简单的代码生成模型,而是一个可以参与完整软件生命周期的 AI 工程系统。
简单理解有几层能力:
自然语言 → 代码
Codex 可以理解人类语言描述,并生成对应程序代码。
例如你写一句注释:
// 计算数组移动平均值
它就能生成完整实现逻辑。支持主流编程语言包括:Python,JavaScript 等
软件工程任务自动化
Codex 不只是写代码,还能执行工程任务:
修复 Bug、代码 Review、重构项目、编写测试、生成文档、它本质是一个 AI 软件工程师。
多任务并行执行
Codex 是云端工程智能体,可同时处理多个任务。
例如:写新功能、分析代码库、提 PR、跑测试,每个任务在独立沙箱运行,互不干扰。
这点和主流智能IDE,比如 Trae、Cursor、Antigravity ,使用下来还是有很大区别,针对同一个项目可以同时进行多个任务,并且可以对不同项目同时进行多任务处理。
Agent 工作方式
Codex 的核心不是“对话”,而是“委派”。
开发者可以:给它任务让它后台执行,完成后提交结果,这种模式被称为:Agentic Coding(智能体编程)
Codex 几个概念
New thread
New Thread(新对话):就像“开一个新聊天窗口”,每次点击它,就等于你重新打开一个空白的聊天页面,开始一个全新的、独立的话题。之前的聊天记录不会干扰这里,非常适合开启一个新任务、新问题或新项目

Automations
Automations(自动化工作流):在后台自动执行重复性任务。Codex 会将调查结果添加到收件箱,如果没有需要报告的内容,则会自动归档任务
可以理解为“智能流水线”或“一键自动处理”

你提前设置好一个指令(比如“总结这篇长文章”),以后只需提供新文章,Codex 就会自动执行你预设的完整操作。它能帮你把重复性的多步任务打包,一键搞定。
Skills
Skills(技能集):赋予 Codex 新的能力和专业知识。使用代理技能可以为 Codex 添加特定任务的功能。技能包含指令、资源和可选脚本,使 Codex 能够可靠地执行工作流程。
就像是给 AI 安装的“专属工具包”或“外挂能力”

你可以为 Codex 添加或定制一些特定能力,比如:
联网搜索(让它能获取最新信息)
长文本处理(处理超长文档)
专业领域知识(如编程、写作优化)
通过添加 Skills,你可以扩展和强化 Codex 在特定场景下的能力。
Threads
Threads(对话线程):就是“你的聊天历史记录夹”

你每次的对话(包括“New Thread”开始的)都会被自动保存为一个单独的 Thread。你可以把它看作是一个对话档案,随时可以点开回顾、修改或继续之前的聊天。方便你管理不同主题的对话。
Settings
配置 Codex 应用的行为和偏好设置,这里就不具体介绍了

Codex 能力全面跃迁
GPT-5.3-Codex 是目前最强的 Codex 模型。
它融合两大能力体系:
GPT-5.3-Codex 的前沿编码性能
GPT-5.3 的推理与专业知识能力
并带来 25% 性能提速。这使它可以承担:
长时间研发任务
多工具协作流程
复杂系统执行
像一个可以持续工作的工程同事。从“写代码”到“完成项目”,过去 Codex 能做:写函数、修 Bug、Review 代码
现在 GPT-5.3-Codex 能做:调试系统、部署服务、监控运行、写 PRD、做用户研究、分析数据、制作演示文稿。
一句话总结:几乎覆盖开发者在电脑上的全部工作。
基准测试,全面刷新纪录
SWE-Bench Pro
行业最先进水平
覆盖 4 种语言
更接近真实工程

Terminal-Bench 2.0
- 77.3% 准确率

终端操作能力大幅领先
OSWorld

64.7%
人类约 72%(已接近)
GDPval
覆盖 44 种职业知识任务,这意味着它不仅是 Coding Agent,更是通用技术智能体。
交互模式升级:实时协作
新 Codex 工作方式发生改变,这是我理解它和其他智能终端的主要区别。
我们可以:
实时查看进度
讨论技术方案
中途调整方向
监督执行过程
不再是“等结果”,而是:与 AI 一起做项目。
结语
Codex 的演进路径非常清晰:
最初:代码生成模型
现在:软件工程智能体
未来:通用技术协作伙伴
GPT-5.3-Codex 整体使用下来主要的两个感受:
GPT-5.3“智力“ 的大幅提升Codex在智能 IDE 作为统一范式流行的今天,给出了更优的工程交互方案。
