Codex

2 月 5 号 OpenAI 发布了 GPT-5.3-Codex,相比之前 GPT-4 之后发布的版本,这次社区反馈效果要好很多,下面主要聊聊 GPT-5.3-Codex 的主要功能和使用场景。

在深入 GPT-5.3-Codex 之前,我们先回答一个基础问题:

什么是 Codex?

CodexOpenAI 推出的软件工程智能体(Coding Agent)。

它的定位不是简单的代码生成模型,而是一个可以参与完整软件生命周期的 AI 工程系统。

简单理解有几层能力:

自然语言 → 代码

Codex 可以理解人类语言描述,并生成对应程序代码。

例如你写一句注释:

// 计算数组移动平均值

它就能生成完整实现逻辑。支持主流编程语言包括:Python,JavaScript 等

软件工程任务自动化

Codex 不只是写代码,还能执行工程任务:

修复 Bug、代码 Review、重构项目、编写测试、生成文档、它本质是一个 AI 软件工程师。

多任务并行执行

Codex 是云端工程智能体,可同时处理多个任务。

例如:写新功能、分析代码库、提 PR、跑测试,每个任务在独立沙箱运行,互不干扰。

这点和主流智能IDE,比如 TraeCursorAntigravity ,使用下来还是有很大区别,针对同一个项目可以同时进行多个任务,并且可以对不同项目同时进行多任务处理。

Agent 工作方式

Codex 的核心不是“对话”,而是“委派”。

开发者可以:给它任务让它后台执行,完成后提交结果,这种模式被称为:Agentic Coding(智能体编程)

Codex 几个概念

New thread

New Thread(新对话):就像“开一个新聊天窗口”,每次点击它,就等于你重新打开一个空白的聊天页面,开始一个全新的、独立的话题。之前的聊天记录不会干扰这里,非常适合开启一个新任务、新问题或新项目

Automations

Automations(自动化工作流):在后台自动执行重复性任务在新窗口打开。Codex 会将调查结果添加到收件箱,如果没有需要报告的内容,则会自动归档任务

可以理解为“智能流水线”或“一键自动处理”

你提前设置好一个指令(比如“总结这篇长文章”),以后只需提供新文章,Codex 就会自动执行你预设的完整操作。它能帮你把重复性的多步任务打包,一键搞定。

Skills

Skills(技能集):赋予 Codex 新的能力和专业知识在新窗口打开。使用代理技能可以为 Codex 添加特定任务的功能。技能包含指令、资源和可选脚本,使 Codex 能够可靠地执行工作流程。

就像是给 AI 安装的“专属工具包”或“外挂能力”

你可以为 Codex 添加或定制一些特定能力,比如:

  • 联网搜索(让它能获取最新信息)

  • 长文本处理(处理超长文档)

  • 专业领域知识(如编程、写作优化)

通过添加 Skills,你可以扩展和强化 Codex 在特定场景下的能力。

Threads

Threads(对话线程):就是“你的聊天历史记录夹”

你每次的对话(包括“New Thread”开始的)都会被自动保存为一个单独的 Thread。你可以把它看作是一个对话档案,随时可以点开回顾、修改或继续之前的聊天。方便你管理不同主题的对话。

Settings

配置 Codex 应用的行为和偏好设置,这里就不具体介绍了

Codex 能力全面跃迁

GPT-5.3-Codex 是目前最强的 Codex 模型。

它融合两大能力体系:

  • GPT-5.3-Codex 的前沿编码性能

  • GPT-5.3 的推理与专业知识能力

并带来 25% 性能提速。这使它可以承担:

  • 长时间研发任务

  • 多工具协作流程

  • 复杂系统执行

像一个可以持续工作的工程同事。从“写代码”到“完成项目”,过去 Codex 能做:写函数、修 Bug、Review 代码

现在 GPT-5.3-Codex 能做:调试系统、部署服务、监控运行、写 PRD、做用户研究、分析数据、制作演示文稿。

一句话总结:几乎覆盖开发者在电脑上的全部工作。

基准测试,全面刷新纪录

关键成绩如下在新窗口打开

SWE-Bench Pro

  • 行业最先进水平

  • 覆盖 4 种语言

  • 更接近真实工程

Terminal-Bench 2.0

  • 77.3% 准确率

终端操作能力大幅领先

OSWorld

  • 64.7%

  • 人类约 72%(已接近)

GDPval

覆盖 44 种职业知识任务,这意味着它不仅是 Coding Agent,更是通用技术智能体。

交互模式升级:实时协作

新 Codex 工作方式发生改变,这是我理解它和其他智能终端的主要区别。

我们可以:

  • 实时查看进度

  • 讨论技术方案

  • 中途调整方向

  • 监督执行过程

不再是“等结果”,而是:与 AI 一起做项目。

结语

Codex 的演进路径非常清晰:

  • 最初:代码生成模型

  • 现在:软件工程智能体

  • 未来:通用技术协作伙伴

GPT-5.3-Codex 整体使用下来主要的两个感受:

  • GPT-5.3 “智力“ 的大幅提升
  • Codex 在智能 IDE 作为统一范式流行的今天,给出了更优的工程交互方案。
上次更新:
贡献者: Joe