Codex

2 月 5 号 OpenAI 发布了 GPT-5.3-Codex，相比之前 GPT-4 之后发布的版本，这次社区反馈效果要好很多，下面主要聊聊 GPT-5.3-Codex 的主要功能和使用场景。

在深入 GPT-5.3-Codex 之前，我们先回答一个基础问题：

什么是 Codex？

Codex 是 OpenAI 推出的软件工程智能体（Coding Agent）。

它的定位不是简单的代码生成模型，而是一个可以参与完整软件生命周期的 AI 工程系统。

简单理解有几层能力：

自然语言 → 代码

Codex 可以理解人类语言描述，并生成对应程序代码。

例如你写一句注释：

// 计算数组移动平均值

它就能生成完整实现逻辑。支持主流编程语言包括：Python,JavaScript 等

软件工程任务自动化

Codex 不只是写代码，还能执行工程任务：

修复 Bug、代码 Review、重构项目、编写测试、生成文档、它本质是一个 AI 软件工程师。

多任务并行执行

Codex 是云端工程智能体，可同时处理多个任务。

例如：写新功能、分析代码库、提 PR、跑测试，每个任务在独立沙箱运行，互不干扰。

这点和主流智能IDE，比如 Trae、Cursor、Antigravity ,使用下来还是有很大区别，针对同一个项目可以同时进行多个任务，并且可以对不同项目同时进行多任务处理。

Agent 工作方式

Codex 的核心不是“对话”，而是“委派”。

开发者可以：给它任务让它后台执行，完成后提交结果，这种模式被称为：Agentic Coding（智能体编程）

Codex 几个概念

New thread

New Thread（新对话）：就像“开一个新聊天窗口”，每次点击它，就等于你重新打开一个空白的聊天页面，开始一个全新的、独立的话题。之前的聊天记录不会干扰这里，非常适合开启一个新任务、新问题或新项目

Automations

Automations（自动化工作流）：在后台自动执行重复性任务在新窗口打开。Codex 会将调查结果添加到收件箱，如果没有需要报告的内容，则会自动归档任务

可以理解为“智能流水线”或“一键自动处理”

你提前设置好一个指令（比如“总结这篇长文章”），以后只需提供新文章，Codex 就会自动执行你预设的完整操作。它能帮你把重复性的多步任务打包，一键搞定。

Skills

Skills（技能集）：赋予 Codex 新的能力和专业知识在新窗口打开。使用代理技能可以为 Codex 添加特定任务的功能。技能包含指令、资源和可选脚本，使 Codex 能够可靠地执行工作流程。

就像是给 AI 安装的“专属工具包”或“外挂能力”

你可以为 Codex 添加或定制一些特定能力，比如：

联网搜索（让它能获取最新信息）
长文本处理（处理超长文档）
专业领域知识（如编程、写作优化）

通过添加 Skills，你可以扩展和强化 Codex 在特定场景下的能力。

Threads

Threads（对话线程）：就是“你的聊天历史记录夹”

你每次的对话（包括“New Thread”开始的）都会被自动保存为一个单独的 Thread。你可以把它看作是一个对话档案，随时可以点开回顾、修改或继续之前的聊天。方便你管理不同主题的对话。

Settings

配置 Codex 应用的行为和偏好设置，这里就不具体介绍了

Codex 能力全面跃迁

GPT-5.3-Codex 是目前最强的 Codex 模型。

它融合两大能力体系：

GPT-5.3-Codex 的前沿编码性能
GPT-5.3 的推理与专业知识能力

并带来 25% 性能提速。这使它可以承担：

长时间研发任务
多工具协作流程
复杂系统执行

像一个可以持续工作的工程同事。从“写代码”到“完成项目”，过去 Codex 能做：写函数、修 Bug、Review 代码

现在 GPT-5.3-Codex 能做：调试系统、部署服务、监控运行、写 PRD、做用户研究、分析数据、制作演示文稿。

一句话总结：几乎覆盖开发者在电脑上的全部工作。

基准测试，全面刷新纪录

关键成绩如下在新窗口打开：

SWE-Bench Pro

行业最先进水平
覆盖 4 种语言
更接近真实工程

Terminal-Bench 2.0

77.3% 准确率

终端操作能力大幅领先

OSWorld

64.7%
人类约 72%（已接近）

GDPval

覆盖 44 种职业知识任务，这意味着它不仅是 Coding Agent，更是通用技术智能体。

交互模式升级：实时协作

新 Codex 工作方式发生改变，这是我理解它和其他智能终端的主要区别。

我们可以：

实时查看进度
讨论技术方案
中途调整方向
监督执行过程

不再是“等结果”，而是：与 AI 一起做项目。

结语

Codex 的演进路径非常清晰：

最初：代码生成模型
现在：软件工程智能体
未来：通用技术协作伙伴

GPT-5.3-Codex 整体使用下来主要的两个感受：

GPT-5.3 “智力“ 的大幅提升
Codex 在智能 IDE 作为统一范式流行的今天，给出了更优的工程交互方案。

# Codex

# 什么是 Codex？

# 自然语言 → 代码

# 软件工程任务自动化

# 多任务并行执行

# Agent 工作方式

# Codex 几个概念

# New thread

# Automations

# Skills

# Threads

# Settings

# Codex 能力全面跃迁

# 基准测试，全面刷新纪录

# SWE-Bench Pro

# Terminal-Bench 2.0

# OSWorld

# GDPval

# 交互模式升级：实时协作

# 结语