为什么是 Codex · Codex 橙皮书

1.1 一个寓言：会动手的实习生

想象你刚招了一个新实习生。

第一天，你跟他说："帮我把这份合同里的关键条款摘出来。"他认真地看了半天，给你写了一段总结。你说写得不错，但格式不对，要做成表格。他重新做了表格。你又说，里面有些数字算错了，重算一下。他重算。你又说，对了，这份合同的第三条要跟另一份合同对比。他翻出另一份，对比完了。

一个下午过去了。这个实习生没有任何抱怨，没有走神，没有刷手机，没有问"今天能不能早走"。第二天他会带着昨天的所有上下文继续工作。

更妙的是：这个实习生会同时在十台电脑上为你工作。

这个寓言里的"实习生"，就是 Codex。

而你过去想"招"这种实习生，要付出什么代价？月薪一万的应届生，还得手把手带；外包一个程序员，每小时 300 元，且只能做你说清楚的需求；找一个秘书，能整理文件但不会写代码。

而 Codex，每个月只要一个 ChatGPT Plus 的订阅费——人民币 150 元左右。

1.2 我们为什么需要这种工具

人在工作中，时间花在三类事情上：

类型	占比	例子	是否值得人来做
创造性工作	10%	想策略、做决策、谈判、写真正的好文章	必须人来做
协作沟通	30%	开会、写文档、回邮件、对齐进度	部分可优化
重复性劳动	60%	整理数据、汇总报表、查资料、写模板化文档、调样式	极大可外包

注意那个 60%。它不是"难"，是"烦"。它消耗着你最宝贵的精力，但又是工作的必要环节。过去我们没有办法，只能硬着头皮做；偶尔写个 Excel 公式自动化一下，就觉得自己很聪明。

而 Codex 出现之后，那 60% 里的大部分都可以"外包"。不是外包给人，是外包给一个永不疲倦、不需要培训、按月计费的 AI。

这就是 2026 年最值得每个职场人投资的事情之一：学会让 AI 替你做那 60%。

1.3 不只是"AI 编程助手"

有人会说："Codex 不是给程序员用的吗？我又不写代码。"

这是个误解。让我们看一下"代码"到底是什么。

代码本质上是"让计算机精确做事的指令"。但在 Codex 这里，"指令"可以是中文，也可以是带图的截图。Codex 内部会把你的中文指令翻译成它要执行的具体动作——可能是写一段 Python 脚本，可能是调用一个 API，可能是修改一个 Excel 文件。

也就是说：对于使用者来说，Codex 没有"编程"和"非编程"的区分。它只有"任务"。

下面是普通人完全不写代码就能让 Codex 做的事：

把桌面上一堆 PDF 整理成 Excel 表
把微信聊天记录导出，分析最近一个月谁找你最多
给 100 张商品图批量加水印、改尺寸
每天早上自动从 36 氪、虎嗅抓 5 条 AI 新闻发到你邮箱
写一个简易的家庭账本网页，全家人都能用
把一份英文论文翻译并做成 PPT 大纲
自动归类下载文件夹，按月份和类型分文件夹
监控某个商品的电商价格，降价就提醒你

这些事 Codex 都能做。它做的过程会写代码，但这些代码你不需要看。你只需要验收结果。

1.4 Codex 跟 ChatGPT 有什么不一样

很多人困惑：我已经在用 ChatGPT 了，为什么还要 Codex？它们都是 OpenAI 的产品。

最关键的区别只有一句话：ChatGPT 能"说"，Codex 能"做"。

┌──────────────────────┬──────────────────────┐
│      ChatGPT         │       Codex          │
├──────────────────────┼──────────────────────┤
│ 给你写一段 Python 代码│ 帮你跑通这段代码     │
│ 教你 Excel 公式怎么写 │ 直接修改你的 Excel 文件│
│ 解释 PDF 里的内容    │ 把 PDF 拆解后存到数据库│
│ 帮你想流程            │ 直接执行这个流程     │
│ 给你建议              │ 替你完成             │
└──────────────────────┴──────────────────────┘

更具体地说，Codex 比 ChatGPT 多了三个核心能力：

第一个能力：读写你电脑上的文件。 ChatGPT 看不到你电脑里有什么，Codex 在你授权后可以看到、可以修改。

第二个能力：执行命令。 Codex 可以在你的电脑上运行命令——安装一个 Python 库、跑一段脚本、查询数据库。每一步它都会告诉你它在做什么，并请求你授权。

第三个能力：操作你的浏览器和应用。 2026 年的 Codex 桌面版集成了 Computer Use 和 In-App Browser，可以直接打开你的浏览器，登录某个网站，填表，点击按钮，截图反馈。它真的能"操作"你的电脑。

合起来一句话：ChatGPT 是聊天助手，Codex 是动手助手。

1.5 为什么是 2026 年这个时间点

如果你是 2024 年读到这本书，我会劝你别折腾——那时候的 AI 编程工具还在初级阶段，错误率高，需要懂技术的人才能玩转。

但 2026 年完全不一样。三件事让 Codex 真正进入了"人人可用"的时刻：

模型本身变强了。 GPT-5 系列模型（包括专门的 GPT-5-Codex）在代码理解、长上下文、工具调用上的能力远超前代。SWE-bench 这个业界公认的"AI 写代码能力测试"，2024 年最强模型才 30%，2026 年已经突破 80%。这不是数字游戏，意味着 AI 第一次能稳定完成"端到端的真实任务"。

Codex 加入了"动手"能力。 2026 年初的更新引入了 Computer Use（操作桌面）、In-App Browser（操作网页）、Image Generation（生成图片）。Codex 不再是只能给建议的"参谋"，而是能直接执行的"特种兵"。

生态成熟了。 AGENTS.md 标准化、Skills 商店、111+ 插件、跨工具兼容。你今天写的 AGENTS.md，明天可以同时给 Codex、Cursor、Claude Code 用。这意味着你的学习成本可以摊薄到所有 AI 工具上。

这三件事缺一不可。少了第一件，AI 不够聪明，做不好事；少了第二件，AI 只能说不能做，价值有限；少了第三件，每个工具都要重新学一遍，门槛太高。

而 2026 年，三件事齐了。这是普通人入场的最佳时机。

1.6 学会 Codex 的三种红利

第一种：直接红利——时间。 学会 Codex 后，你每天能省下 1-3 小时。这些时间你可以用来做更有创造性的工作，可以用来陪家人，可以用来提升自己。一年算下来，相当于多了一个半月的可支配时间。

第二种：杠杆红利——能力。 过去你不会的事情，现在通过 Codex 可以做。你不会做爬虫了？让 Codex 写一个。你不会 Excel 公式了？让 Codex 处理。你不会做网页了？让 Codex 帮你搭一个。你的能力边界，在 Codex 加持下，可以扩大 5-10 倍。

第三种：思维红利——视角。 这一点最深刻。当你开始把"任务"而不是"工具"作为思考单元，你看待工作的方式会变。你不再问"这个 Excel 怎么用"，而是问"这件事我想要什么结果"；你不再问"这段代码什么意思"，而是问"它为什么这样做"。这是一种"指挥官思维"对"操作工思维"的升级。

1.7 谁不适合用 Codex

我不想把 Codex 包装成万能药。它不是。下面这些情况，可能 Codex 帮不到你（或者不该用）：

极度敏感的工作。 国密级别的数据、未公开的财报、医院的患者隐私，这些数据不应该上传到任何云端 AI（无论是 Codex 还是别的）。
需要法律责任的决策。 AI 可以辅助，不能替代。律师文书的最终署名、医生的诊断结论、财务的税务申报，必须由有资质的人完成并负责。
创造性的核心工作。 真正原创的研究、独特的艺术创作、深度的人际理解，AI 目前还做不到。它能给你建议，但替代不了。
对"过程"本身有要求的事。 比如学习——做数学题的目的就是锻炼思维，让 AI 替你做就失去了意义。

记住：Codex 是工具，不是答案。用工具的目的，是把你解放出来去做更有价值的事，而不是把你变成"按钮按得更快的人"。

1.8 本章小结

Codex = "ChatGPT 的会动手版"，能读写文件、执行命令、操作浏览器
它能帮你处理工作中那 60% 的重复性劳动
不需要会写代码，用人话指挥即可
2026 年是普通人入场的最佳时机：模型强了、动手能力到位了、生态成熟了
学会它能拿到时间、能力、思维三层红利
但它不是万能药，敏感数据、法律责任、创造性核心、学习过程不要过度依赖

下一章，我们详细看看 Codex 到底是什么——它的四种形态、它的工作原理、它和别的 AI 工具的关系。

第一章 为什么是 Codex