ORANGE BOOK · CODEX

第一章 为什么是 Codex

1.1 一个寓言:会动手的实习生

想象你刚招了一个新实习生。

第一天,你跟他说:"帮我把这份合同里的关键条款摘出来。"他认真地看了半天,给你写了一段总结。你说写得不错,但格式不对,要做成表格。他重新做了表格。你又说,里面有些数字算错了,重算一下。他重算。你又说,对了,这份合同的第三条要跟另一份合同对比。他翻出另一份,对比完了。

一个下午过去了。这个实习生没有任何抱怨,没有走神,没有刷手机,没有问"今天能不能早走"。第二天他会带着昨天的所有上下文继续工作。

更妙的是:这个实习生会同时在十台电脑上为你工作。

这个寓言里的"实习生",就是 Codex。

而你过去想"招"这种实习生,要付出什么代价?月薪一万的应届生,还得手把手带;外包一个程序员,每小时 300 元,且只能做你说清楚的需求;找一个秘书,能整理文件但不会写代码。

而 Codex,每个月只要一个 ChatGPT Plus 的订阅费——人民币 150 元左右。

1.2 我们为什么需要这种工具

人在工作中,时间花在三类事情上:

类型 占比 例子 是否值得人来做
创造性工作 10% 想策略、做决策、谈判、写真正的好文章 必须人来做
协作沟通 30% 开会、写文档、回邮件、对齐进度 部分可优化
重复性劳动 60% 整理数据、汇总报表、查资料、写模板化文档、调样式 极大可外包

注意那个 60%。它不是"难",是"烦"。它消耗着你最宝贵的精力,但又是工作的必要环节。过去我们没有办法,只能硬着头皮做;偶尔写个 Excel 公式自动化一下,就觉得自己很聪明。

而 Codex 出现之后,那 60% 里的大部分都可以"外包"。不是外包给人,是外包给一个永不疲倦、不需要培训、按月计费的 AI。

这就是 2026 年最值得每个职场人投资的事情之一:学会让 AI 替你做那 60%。

1.3 不只是"AI 编程助手"

有人会说:"Codex 不是给程序员用的吗?我又不写代码。"

这是个误解。让我们看一下"代码"到底是什么。

代码本质上是"让计算机精确做事的指令"。但在 Codex 这里,"指令"可以是中文,也可以是带图的截图。Codex 内部会把你的中文指令翻译成它要执行的具体动作——可能是写一段 Python 脚本,可能是调用一个 API,可能是修改一个 Excel 文件。

也就是说:对于使用者来说,Codex 没有"编程"和"非编程"的区分。它只有"任务"。

下面是普通人完全不写代码就能让 Codex 做的事:

  • 把桌面上一堆 PDF 整理成 Excel 表
  • 把微信聊天记录导出,分析最近一个月谁找你最多
  • 给 100 张商品图批量加水印、改尺寸
  • 每天早上自动从 36 氪、虎嗅抓 5 条 AI 新闻发到你邮箱
  • 写一个简易的家庭账本网页,全家人都能用
  • 把一份英文论文翻译并做成 PPT 大纲
  • 自动归类下载文件夹,按月份和类型分文件夹
  • 监控某个商品的电商价格,降价就提醒你

这些事 Codex 都能做。它做的过程会写代码,但这些代码你不需要看。你只需要验收结果。

1.4 Codex 跟 ChatGPT 有什么不一样

很多人困惑:我已经在用 ChatGPT 了,为什么还要 Codex?它们都是 OpenAI 的产品。

最关键的区别只有一句话:ChatGPT 能"说",Codex 能"做"。

┌──────────────────────┬──────────────────────┐
│      ChatGPT         │       Codex          │
├──────────────────────┼──────────────────────┤
│ 给你写一段 Python 代码│ 帮你跑通这段代码     │
│ 教你 Excel 公式怎么写 │ 直接修改你的 Excel 文件│
│ 解释 PDF 里的内容    │ 把 PDF 拆解后存到数据库│
│ 帮你想流程            │ 直接执行这个流程     │
│ 给你建议              │ 替你完成             │
└──────────────────────┴──────────────────────┘

更具体地说,Codex 比 ChatGPT 多了三个核心能力:

第一个能力:读写你电脑上的文件。 ChatGPT 看不到你电脑里有什么,Codex 在你授权后可以看到、可以修改。

第二个能力:执行命令。 Codex 可以在你的电脑上运行命令——安装一个 Python 库、跑一段脚本、查询数据库。每一步它都会告诉你它在做什么,并请求你授权。

第三个能力:操作你的浏览器和应用。 2026 年的 Codex 桌面版集成了 Computer Use 和 In-App Browser,可以直接打开你的浏览器,登录某个网站,填表,点击按钮,截图反馈。它真的能"操作"你的电脑。

合起来一句话:ChatGPT 是聊天助手,Codex 是动手助手。

1.5 为什么是 2026 年这个时间点

如果你是 2024 年读到这本书,我会劝你别折腾——那时候的 AI 编程工具还在初级阶段,错误率高,需要懂技术的人才能玩转。

但 2026 年完全不一样。三件事让 Codex 真正进入了"人人可用"的时刻:

模型本身变强了。 GPT-5 系列模型(包括专门的 GPT-5-Codex)在代码理解、长上下文、工具调用上的能力远超前代。SWE-bench 这个业界公认的"AI 写代码能力测试",2024 年最强模型才 30%,2026 年已经突破 80%。这不是数字游戏,意味着 AI 第一次能稳定完成"端到端的真实任务"。

Codex 加入了"动手"能力。 2026 年初的更新引入了 Computer Use(操作桌面)、In-App Browser(操作网页)、Image Generation(生成图片)。Codex 不再是只能给建议的"参谋",而是能直接执行的"特种兵"。

生态成熟了。 AGENTS.md 标准化、Skills 商店、111+ 插件、跨工具兼容。你今天写的 AGENTS.md,明天可以同时给 Codex、Cursor、Claude Code 用。这意味着你的学习成本可以摊薄到所有 AI 工具上。

这三件事缺一不可。少了第一件,AI 不够聪明,做不好事;少了第二件,AI 只能说不能做,价值有限;少了第三件,每个工具都要重新学一遍,门槛太高。

而 2026 年,三件事齐了。这是普通人入场的最佳时机。

1.6 学会 Codex 的三种红利

第一种:直接红利——时间。 学会 Codex 后,你每天能省下 1-3 小时。这些时间你可以用来做更有创造性的工作,可以用来陪家人,可以用来提升自己。一年算下来,相当于多了一个半月的可支配时间。

第二种:杠杆红利——能力。 过去你不会的事情,现在通过 Codex 可以做。你不会做爬虫了?让 Codex 写一个。你不会 Excel 公式了?让 Codex 处理。你不会做网页了?让 Codex 帮你搭一个。你的能力边界,在 Codex 加持下,可以扩大 5-10 倍。

第三种:思维红利——视角。 这一点最深刻。当你开始把"任务"而不是"工具"作为思考单元,你看待工作的方式会变。你不再问"这个 Excel 怎么用",而是问"这件事我想要什么结果";你不再问"这段代码什么意思",而是问"它为什么这样做"。这是一种"指挥官思维"对"操作工思维"的升级。

1.7 谁不适合用 Codex

我不想把 Codex 包装成万能药。它不是。下面这些情况,可能 Codex 帮不到你(或者不该用):

  • 极度敏感的工作。 国密级别的数据、未公开的财报、医院的患者隐私,这些数据不应该上传到任何云端 AI(无论是 Codex 还是别的)。
  • 需要法律责任的决策。 AI 可以辅助,不能替代。律师文书的最终署名、医生的诊断结论、财务的税务申报,必须由有资质的人完成并负责。
  • 创造性的核心工作。 真正原创的研究、独特的艺术创作、深度的人际理解,AI 目前还做不到。它能给你建议,但替代不了。
  • 对"过程"本身有要求的事。 比如学习——做数学题的目的就是锻炼思维,让 AI 替你做就失去了意义。

记住:Codex 是工具,不是答案。用工具的目的,是把你解放出来去做更有价值的事,而不是把你变成"按钮按得更快的人"

1.8 本章小结

  • Codex = "ChatGPT 的会动手版",能读写文件、执行命令、操作浏览器
  • 它能帮你处理工作中那 60% 的重复性劳动
  • 不需要会写代码,用人话指挥即可
  • 2026 年是普通人入场的最佳时机:模型强了、动手能力到位了、生态成熟了
  • 学会它能拿到时间、能力、思维三层红利
  • 但它不是万能药,敏感数据、法律责任、创造性核心、学习过程不要过度依赖

下一章,我们详细看看 Codex 到底是什么——它的四种形态、它的工作原理、它和别的 AI 工具的关系。