21.1 这一章的重要性
前 20 章我们一直在讲"怎么用 Codex"。但有一个话题不能回避:有些事 Codex 不应该用。
这一章不是吓唬你,而是帮你建立"什么场景下 AI 工具应该让位给人"的清醒认知。掌握这套认知,你才能长期、安全地使用 Codex。
21.2 三层风险模型
把"用 AI"的风险分成三层:
┌──────────────────────────────────────────┐
│ 第一层:信息层风险(数据泄露) │
│ ── 你给 AI 的数据 → 落到不该看到的人手里 │
└──────────────────────────────────────────┘
│
┌──────────────────────────────────────────┐
│ 第二层:操作层风险(错误执行) │
│ ── AI 替你做了不该做的事 → 损失文件 / 钱 / 信任│
└──────────────────────────────────────────┘
│
┌──────────────────────────────────────────┐
│ 第三层:决策层风险(错误判断) │
│ ── 信了 AI 错的建议 → 重大决策走偏 │
└──────────────────────────────────────────┘
每一层有不同的预防方法。
21.3 第一层:信息层风险
哪些信息不能给 AI
下面这些信息永远不要丢给 Codex(无论它说"绝对保密"):
| 类别 | 例子 |
|---|---|
| 凭据类 | 密码、API Key、SSH 私钥、JWT、OAuth Token、数据库连接字符串 |
| 身份类 | 身份证号、护照号、银行卡号、社保号、医保号 |
| 财务类 | 未公开的财报、预算、薪资明细(含他人)、利润率 |
| 客户隐私 | 客户的全名+联系方式组合、住址、消费习惯、健康状况 |
| 商业机密 | 未发布的产品 / 营销方案、谈判中的合同金额、未签字的协议 |
| 国家相关 | 涉密信息、未公开的政策、军事 / 国防相关 |
| 健康医疗 | 病历、诊断、医保记录、HIV / 性病 / 精神疾病等高敏感 |
| 涉法律 | 未公开的诉讼材料、调查证据、未结案信息 |
为什么不能给
即使 OpenAI 协议写"不用于训练":
- 服务器仍存储 30 天:理论上有 OpenAI 员工能访问
- 可能因法律命令被调取:美国政府的执法请求
- 网络传输有泄露风险:理论上中间人攻击
- 服务故障可能导致泄露:日志意外公开
- 未来政策可能变:今天不用于训练,明天可能改
对待 AI 的态度应该是:"我对外公开发表的内容才能上传"。
怎么"脱敏"再用
很多场景 AI 帮助巨大,但数据敏感。脱敏的几种做法:
做法 1:替换成假数据
# 原始数据
姓名: 张三, 手机: 13812345678, 身份证: 310101199001011234
# 脱敏后
姓名: 用户A, 手机: 138****5678, 身份证: 31010119900101****
让 Codex 自己脱敏:
我有 customers.csv,包含真实客户信息。
脱敏处理:
- 姓名 → 用户A、用户B...(顺序编号)
- 手机号 → 前 3 位 + **** + 后 4 位
- 身份证 → 前 14 位 + ****
- 邮箱 → 用户名前 2 字符 + **** + 域名
输出 customers-anon.csv,保存到本地。
然后基于 customers-anon.csv 做后续分析,
不要把原始 csv 上传给你(即不要让你"读"它)。
做法 2:抽样
不要把全量数据给 AI。抽 1% 的样本:
import pandas as pd
df = pd.read_csv('big-data.csv')
sample = df.sample(frac=0.01) # 抽 1%
sample.to_csv('sample.csv', index=False)
让 AI 看 sample.csv 即可。
做法 3:聚合后再给
不给原始记录,给统计摘要:
# 不给:5000 个客户的全部订单
# 给:
- 总订单数:5000
- 总金额:380 万
- TOP 10 客户:客户A(28w)、客户B(25w)...(脱敏后)
- 类目分布:电子 40%、服装 30%、食品 30%
做法 4:本地处理 + 远程总结
先在本地用脚本把"原始数据 → 摘要",只把摘要给 AI:
# 本地脚本(不联网)
python local_analyze.py raw_data.csv > summary.json
# 把 summary.json 给 Codex 进一步分析
如果不小心传了敏感数据
发生过一次后,立即:
- 在 ChatGPT 里删除该对话(Settings → Data Controls → 删除指定对话)
- 删除指定 OpenAI 账户的全部历史(同上)
- 评估泄露范围:什么数据、谁能看到
- 如果是公司数据,告诉合规 / 安全部门
- 如果涉及客户,按公司流程通知
预防比善后重要 100 倍。 养成"传任何文件前问自己一句:这能登在公开博客上吗"的习惯。
21.4 第二层:操作层风险
Codex 能造成多大的损失
理论上限:取决于你给它的权限。
Read-only 模式: 最大损失 = 0(除非外发数据)
Auto-approve safe: 最大损失 = 你授权过的所有命令的累积影响
Full-auto 模式: 最大损失 = 你账号能做的一切
真实案例
收集几个真实"翻车"案例,让你引以为戒:
案例 1:误删整个项目
某开发者让 Codex "清理项目里的临时文件"。Codex 执行了 rm -rf 命令,参数构造错误,删了整个项目。
教训: 用 rm -rf 必须人审、必须有 git。
案例 2:自动 push 错误代码到生产
某团队让 Codex 自动 fix bug 并 push 到 main 分支(跳过 PR)。Codex 引入了一个新 bug,生产环境挂了 4 小时。
教训: 永远不让 AI 直接 push 到 main。任何改动走 PR + 人审。
案例 3:滥用 API 烧光配额
某用户让 Codex"分析所有 PDF",但有 10 万个 PDF。Codex 在跑的过程中触发某个付费 API 调用,一晚上烧了 $300。
教训: 大批量任务先抽样估算,再全量跑。
案例 4:Computer Use 误操作
某用户让 Codex 用 Computer Use"清理桌面"。Codex 把"看起来不重要"的几个文件夹拖进了废纸篓——其中包含未保存的 Photoshop 工程。
教训: Computer Use 操作敏感目录前必须确认;废纸篓不要太快清空。
案例 5:Skill 误调用
某团队的 customer-faq Skill 被误调用到了"医疗咨询"场景,AI 给了错误的医疗建议(虽然加了"非医疗建议"免责)。客户投诉。
教训: Skill 的"何时调用"和"何时不调用"要写清楚。重大风险领域要白名单。
操作层风险的"五道护栏"
护栏 1:默认权限保守
新手永远从 Read-only 或 Auto-approve safe 开始。建立信任后再放开。
护栏 2:版本控制
任何写代码的项目都用 git。每天 commit 一次。git stash 备好。
护栏 3:备份
重要文件 / 项目,三份备份:
- 本地(git 历史)
- 远程仓库(GitHub / GitLab)
- 离线(外置硬盘 / NAS / 网盘)
护栏 4:分级权限
Codex 跑的环境,按风险分级:
Sandbox(一次性 VM / Docker) → 完全自由
个人工作目录 → Auto-approve safe
项目代码 → Auto-approve safe + git
生产数据库 → 只能读,绝不写
线上服务 → 永远人审
护栏 5:回滚预案
任何不可逆操作前,想清楚"出错了怎么救回来"。没有救回方案的,就不做。
关键的"绝对不"
下面这些事,绝对不要让 Codex 自动做(哪怕它说能):
- 直接 push 到 main / production 分支
- 跑
DROP TABLE、DELETE FROM之类的危险 SQL - 调用付费 API 时不限额度
- 操作生产数据库
- 发邮件给客户(必须人最终确认)
- 转账、付款、订购
- 公开发布内容(必须 Triage)
- 改账号设置 / 安全配置
sudo系统级操作
21.5 第三层:决策层风险
AI 也会"一本正经地胡说"
AI 模型有"幻觉"——它会自信地给出错误信息。比如:
- 引用一篇根本不存在的论文
- 编造一个版本号
- 告诉你 "X 库支持 Y 功能" 但实际上不支持
- 给一个看起来对但其实错的法律 / 医疗建议
GPT-5 系列已经大幅减少幻觉,但没消除。任何重要决策,必须人验证。
哪些决策必须人来做
| 决策类型 | 谁拍板 |
|---|---|
| 法律决策(合同条款、权利义务) | 律师 |
| 医疗决策(诊断、用药、手术) | 医生 |
| 财税决策(投资、报税、债务) | 会计师 / 财务顾问 |
| 心理 / 婚姻 / 家庭 | 心理咨询师 / 你自己 |
| 招聘 / 解雇 | HR + 主管 |
| 重大投资 | 你 + 专业顾问 |
| 公司战略 | 高管会议 |
| 涉及人命的事 | 永远人 |
AI 可以辅助调研、给思路、列选项,但不能替你拍板。
怎么用 AI 做"决策辅助"而非"决策代理"
正确姿势:
1. 让 AI 列出 5 个可选方案,每个的优缺点
2. 让 AI 列出做决策需要的关键信息
3. 你查证 / 思考 / 咨询 → 拍板
4. 让 AI 帮你执行你的决策
错误姿势:
1. 让 AI 直接告诉你"应该做什么"
2. 你不质疑就照做
3. 出问题怪 AI
验证 AI 输出的几种方法
方法 1:交叉验证
让两个 AI(Codex + Claude)独立分析同一个问题,看结论是否一致。不一致的部分重点关注。
方法 2:要求引用来源
回答中所有事实必须有引用,
"X 是 Y" 这种陈述必须给出处链接。
我会去验证。
方法 3:要求"反例"
你刚才的方案有什么风险?什么情况下会失败?
你是不是太乐观了?
让 AI 自己挑刺。
方法 4:找小样本验证
AI 给了 100 条数据分析结果,你抽 5 条人工验证。差错率 > 5% 就别信整体结果。
方法 5:找领域专家审
涉及专业领域的 AI 输出(法律、医疗、财务、技术架构),让人类专家过一遍。
21.6 隐私 vs 效率的权衡
完全的隐私 = 不用 AI(只能本地小模型,效果差很多)。 完全的效率 = 啥都给 AI(隐私崩塌)。
真实做法是平衡。 给一个判断框架:
效率 隐私
完全用 ─→ Codex 桌面 ─→ Codex CLI ─→ 本地小模型 ─→ 纯人工
ChatGPT (含网络) (配代理) (Ollama 等)
不同任务用不同档位:
| 任务 | 推荐档位 |
|---|---|
| 写邮件 / 文档 | Codex(任何模式) |
| 处理工作日志 | Codex Auto-approve |
| 处理客户脱敏数据 | Codex Auto-approve |
| 处理客户原始数据 | 本地小模型 / 不用 AI |
| 处理合同 / 法律 / 医疗 | 人工 / 本地小模型 |
| 处理国密信息 | 永远不用 AI |
21.7 公司 vs 个人
公司用 AI 比个人复杂得多。涉及:
- 数据合规(GDPR、个保法、行业规范)
- 知识产权(AI 输出的代码 / 内容归谁?)
- 审计要求(需要追溯到具体决策)
- 责任归属(AI 出错谁负责)
给团队负责人的建议:
- 明确政策:写一份《AI 工具使用规范》,明确什么能用、什么不能用、违反怎么办
- 培训全员:每个人都要懂"哪些数据不能传"
- 技术控制:用企业版(Codex Business / Enterprise),有审计和数据隔离
- 审计日志:保存所有 AI 调用记录,方便追溯
- 责任协议:员工签 AI 使用承诺书
21.8 知识产权问题
AI 生成的代码 / 内容归谁
简单结论:归你(在你订阅的协议下)。
但有几个 caveat:
- AI 训练用的数据可能含开源代码 / 受版权内容
- 极端情况,AI 输出可能"撞车"现有作品
- 商用前最好用工具检查"是否抄袭"
安全做法
- 不要把 AI 生成的内容直接署名"原创"
- 重要商业作品,让法务审一遍
- 开源项目用 AI 生成的代码,遵守原项目 LICENSE
引用 AI 时的礼貌
公开内容里用了 AI 生成的部分,建议注明:
本文部分内容由 ChatGPT / Codex 协助生成,作者已审核并对最终内容负责。
不是法律要求,是建立读者信任的好做法。
21.9 对孩子 / 学生用 AI 的边界
如果你是家长 / 老师,这一节给你。
适合让孩子用的
- 解释概念(让 AI 当小老师)
- 讨论想法(练逻辑思维)
- 修改作文(不是代写)
- 做创意启发(写故事、画插画)
- 学习外语(练对话)
不适合让孩子用的
- 直接代写作业(剥夺学习过程)
- 替代真人沟通(影响社交能力)
- 无监管的搜索(可能接触不当内容)
- 替代专业辅导(心理 / 学习障碍要找专业人士)
给孩子的"AI 时代素养"
- 教会"怀疑精神":AI 说的不一定对
- 教会"提问能力":好问题比好答案重要
- 教会"独立思考":先有自己想法,再用 AI 验证
- 教会"保护隐私":不要把家人 / 同学的隐私告诉 AI
21.10 一份个人 AI 使用准则
下面这份准则,你可以直接抄到 ~/.codex/AGENTS.md 顶部:
# 我的 AI 使用准则
## 数据
1. 不上传:身份证号、银行卡、密码、未公开财务、客户原始数据
2. 必须脱敏:姓名+联系方式组合、地址、医疗记录
3. 默认假设:传给 AI 的所有内容都可能在某天被人看到
## 操作
1. Read-only 模式作为默认(除非明确知道要写)
2. 任何 rm -rf、git push --force、sudo 必须我亲手批准
3. 不可逆操作前,确认有备份 / 回滚方案
4. 涉及金钱、邮件发送、对外发布的,永远人审
## 决策
1. AI 是参谋,不是决策者
2. 法律 / 医疗 / 财税决策必须有人类专家把关
3. 重要事项交叉验证:让两个 AI 独立判断
4. 不信任"看起来很 confident"的回答,要求引用
## 边界
1. 国密、未公开重大商业、客户原始数据 → 永远不传 AI
2. 创造性核心工作(自己的真正原创)→ 自己想,用 AI 改
3. 专业资质决策(医师、律师、会计签字)→ 人来签
4. 学习场景(孩子作业、自己学习)→ AI 当教练,不当替身
## 习惯
1. 每月清理 Memory,删除过时信息
2. 每月审查 Skills,下架不用的
3. 每季度回顾"用 AI 是否让我更聪明 / 更傻"
4. 每年问自己:还有哪些事我以为只能自己做,其实可以让 AI 做
21.11 AI 不会取代你,除非你不学
很多人因为安全和隐私顾虑,索性不用 AI。这个选择有它的合理性,但代价很大:
- 工作效率不如同辈
- 思维方式更新慢
- 长期看竞争力下滑
正确姿势是"用,但有边界",而不是"完全用"或"完全不用"。
这一章给你的所有规则,本质都是为了让你长期、可持续地用。一个用了三年都没出过事故的 AI 重度用户,比一个"小心翼翼不敢用"的人和一个"出过大事故吓到不用了"的人都强。
21.12 本章小结
- 三层风险:信息层(数据泄露)/ 操作层(错误执行)/ 决策层(错误判断)
- 信息层:8 类数据永远不传 AI,必要时用脱敏 / 抽样 / 聚合 / 本地处理
- 操作层:五道护栏(保守权限 / git / 备份 / 分级 / 回滚预案)
- 决策层:AI 当参谋不当决策者,重要决策交叉验证 + 专家审
- 隐私 vs 效率要平衡,不同任务不同档位
- 公司用 AI 多一层合规:政策 / 培训 / 技术控制 / 审计 / 责任
- 知识产权:归你,但有 caveat,建议署名注明
- 孩子用 AI:当教练不当替身,培养怀疑精神
- 抄一份"个人 AI 使用准则"到自己的 AGENTS.md
最后一章是收尾性的——AI 时代我们该怎么自处。第二十二章 · 未来展望。