ORANGE BOOK

第六章 上下文工程——如何让 AI 真正懂你


6.1 什么是"上下文"——用聊天记录打比方

在第一章我们提过"上下文"是个术语。这一章我们把它讲到底。

上下文(Context) = AI 在和你对话时"能看到"的所有内容。

打个比方:

你和老朋友聊天。你说:"那件事你帮我处理一下吧。"老朋友懂——因为他知道"那件事"是什么(你之前说过)。

但如果你跟一个第一次见面的陌生人说同一句话,他会一脸茫然:

"啥事?"

AI 默认就是那个"陌生人"——它不知道你是谁、不知道你之前说过什么、不知道你今天在烦恼什么。

上下文就是你"喂"给 AI 的所有信息,让它从陌生人变成你的老朋友。

上下文包括什么?

下面这些都属于上下文:

  1. 当前这条对话的所有消息:你说的话 + AI 回的话,从对话开始到现在
  2. 你上传的文件:PDF、图片、Excel、Word⋯⋯
  3. 你设置的"自定义指令":你的身份、偏好、说话风格
  4. AI 的"长期记忆"(如果开了):跨对话记住你的事
  5. 联网搜索的结果:AI 临时查到的新信息
  6. AI 接入的"知识库":你导入的专属资料库

上下文的"长度"是有限的

虽然 AI 看起来什么都"记得",但实际上,它一次能"看到"的内容是有上限的

这个上限就是我们前面提过的"上下文窗口":

模型 上下文长度 大约相当于
GPT-4o 128K Token 10 万字
GPT-5 128K~256K 10~20 万字
Claude 4 200K 15 万字
Gemini 2.5 Pro 1M~2M 75~150 万字
豆包 256K(个别 1M) 20 万字
Kimi 2 2M 150 万字
DeepSeek V3 128K 10 万字

超过这个长度怎么办? 早期消息就会被"挤出去"——AI 会"忘记"对话开头说过什么。

这是为什么有时候你和 AI 聊到第 50 轮,它突然"忘了"你最开始说的话——不是它笨,是上下文满了。

一个关键概念:上下文 = 钱 + 速度

技术细节你不用懂,但要知道:

  • 上下文越长,AI 处理越慢
  • 上下文越长,越容易"丢细节"
  • 付费 API 的话,上下文越长,越贵

所以不是"喂的越多越好"——要"喂得精准"。


6.2 自定义指令——让 AI 永远记住你的偏好

主流 AI(ChatGPT、Claude、豆包、Kimi 等)都有一个叫**"自定义指令"**(Custom Instructions / 个性化设置)的功能。

它的作用是:你设置一次,AI 在每一次新对话里都自动应用

不用每次都告诉 AI "你是 30 岁产品经理"、"我喜欢简洁回答"——设一次就够了。

在哪里设置?

不同 AI 入口不同,但都在"设置"里:

  • ChatGPT:右上角头像 → Personalization → Custom Instructions
  • Claude:左下角设置 → Profile → Custom Instructions
  • 豆包:我的 → 偏好设置 / 个性化设置
  • DeepSeek:右上角设置 → 个性化(部分版本)
  • Kimi:左下角设置 → 个性化指令

一个好的"自定义指令"长啥样

通常自定义指令有两个框:

  1. 关于你(让 AI 了解你是谁)
  2. 关于回答(让 AI 知道怎么回答你)

下面是一份针对普通职场人士的样板,你可以改改用:

第一框:关于我(你)

基本信息:
- 我 30 岁,男,住在上海
- 工作:互联网公司产品经理,5 年经验
- 家庭:已婚,有一个 3 岁的女儿
- 教育:本科一本,理工科背景

偏好与背景:
- 喜欢简洁、直接、有结构的表达
- 不喜欢"鸡汤"、"套话"、"励志"
- 比较理性,重视数据和案例
- 中英文都能看,但日常用中文
- 关心健康、家庭、个人成长

我常用 AI 做的事:
- 写工作邮件、做 PPT 大纲
- 育儿话术、家庭沟通
- 学习新东西(投资、心理学、AI)
- 做决策时听不同角度

第二框:关于回答

请按以下方式回应我:

【风格】
- 直接说要点,不要"首先、其次"这类结构词
- 不要"在 XXX 的大背景下"这种官方腔
- 不要堆 emoji,但适当用 emoji 没问题
- 自然、像朋友聊天的口吻

【格式】
- 默认 Markdown 格式
- 列表用"-"开头
- 重点用粗体标出
- 长答案分小节,加二级标题

【深度】
- 默认给"中等深度"——不需要 5000 字解释,但也不能 1 句话敷衍
- 复杂问题先思考再答,但不要把"思考过程"全展示出来——给我精炼的结论 + 关键推理
- 涉及"事实数据"时,明确标注"知道"还是"推测"

【主动性】
- 如果我的问题信息不够,请反过来问我
- 如果你发现我可能"问错了问题",可以提醒我
- 给建议时,分"必做"、"可做"、"不要做"三档

【红线】
- 涉及健康、法律、金融的具体决策,明确说"以专业人士意见为准"
- 不要假装自己有"个人感受"——你是工具,我是用户

设置完之后,AI 会怎么变化?

前后对比

没设自定义指令,问"如何缓解 30 岁的中年危机":

中年危机是一个常见的现象。很多 30 岁的人会感到迷茫、焦虑、压力大。这是因为⋯⋯(一大段通用鸡汤)

设了之后,同样的问题:

你这种情况其实不是"危机",是"重新定位期"。

必做(这周):

  • 做一份"过去 3 年关键决策"复盘
  • 找一个比你大 5~10 岁的同行业朋友聊一次

可做(一个月内):

  • 重读一本你 25 岁前最受影响的书
  • 给 60 岁的你写一封信

不要做:

  • 不要立刻做"重大决定"(辞职、离婚、移民)
  • 不要在朋友圈宣布"我要重启人生"

想细聊哪一块?

完全不一样——一个是"通用鸡汤",一个是"为你定制"。

一个常用模板(按身份选)

学生模板

我是 [大三 / 高三] 学生,专业是 [XX]。
偏好:用例子讲解、不要太学术、关键概念加粗。
回答时:先给"一句话答案",再展开。涉及计算的题,给完整推导过程。

上班族模板

我是 [行业] [职位],工作 X 年。
偏好:直接、有结构、能立刻用。
回答时:默认中等长度,分小节。涉及"建议"分必做/可做/不做三档。

宝妈模板

我是宝妈,孩子 [X 岁],主要照顾家庭。
偏好:温暖友善、可执行、考虑家庭实际情况。
回答时:避免太"理论",多给"今天就能做"的小步骤。

退休长辈模板

我是 [60 岁] 退休 [职业]。
偏好:简单清楚、不要技术词、字大点(如果支持)。
回答时:用大白话、不要"年轻人黑话"。涉及健康,提醒"具体咨询医生"。

6.3 记忆功能——让 AI "跨对话"记住你

什么是"记忆"?

自定义指令是你手动设的——一次设好,永远生效。

记忆功能是AI 自动"记下来"的——你和它聊天时说的事,AI 会偷偷存起来,下次对话还知道。

哪些 AI 有"记忆"?

  • ChatGPT:默认开启(2024 年起),可在 Settings → Personalization → Memory 管理
  • Claude:2025 年开始支持,需开启"Memories"
  • 豆包:有"豆包记得"功能(最长记忆 1000 条)
  • Kimi:有记忆功能
  • DeepSeek:暂未开放(截至 2026 年 4 月,个人版基本无记忆)
  • Gemini:有记忆,集成在"Saved Info"

怎么用记忆?

方式 1:被动记(让 AI 自动判断哪些值得记)

你正常聊天,AI 自动决定。比如你说:"我对花生过敏。" AI 会自动记下来——下次问菜谱,它会自动避开花生。

方式 2:主动让 AI 记(强烈推荐)

请你记住:
- 我对 [XX] 过敏
- 我家附近有 [XX] 超市
- 我女儿的英文名字叫 [XX]
- 我在用 [XX] 笔记软件

下次聊天,AI 都会"知道"。

方式 3:让 AI 忘记某事

请忘记关于 [某事] 的所有记忆。

或者去设置里手动删除。

记忆能记什么?

下面这些是最值得让 AI 记的事

关于你

  • 年龄、职业、家庭情况、住址(城市级别即可)
  • 兴趣爱好、过敏史、健康状况
  • 长期目标(比如"我在备考 CFA")

关于你常用的工具

  • 你的电脑系统(Windows/Mac)
  • 你用的笔记软件、办公软件、邮箱
  • 你的浏览器偏好

关于你的人际关系

  • 你老板的性格特点("李经理偏严厉,但很讲道理")
  • 你妈妈的口味偏好
  • 你常合作的客户的关注点

关于你的写作风格偏好

  • 喜欢什么样的文风
  • 不喜欢什么句式
  • 经常引用的"对标对象"

记忆的注意事项

⚠️ 隐私警告

  • 不要让 AI 记敏感信息(身份证号、银行卡号、密码、住址精确到门牌号、家人具体信息等)
  • 如果共用账号,定期清理记忆
  • 重要场景前检查——比如你换工作了,要去删除"我在 X 公司"的记忆

⚠️ 记忆不是绝对可靠

  • AI 偶尔会"忘记"你认为它该记的事
  • AI 偶尔会"记错"——把你说过的话记成另一个版本
  • 重要事项,还是要在每次对话里再说一遍

6.4 长对话技巧——什么时候该开新对话

一个常见误区:以为"一直在一个对话里聊就行"

很多人和 AI 聊天的方式是:所有事都在同一个对话里——周一聊工作、周二聊家庭、周三聊学习⋯⋯到了第三个月,这个对话已经几千条了。

这是错的。 三个原因:

  1. 上下文窗口会爆:超过模型上限后,开头的内容会被"挤出去"——AI 突然忘了你最开始说的事。
  2. AI 会"串话":聊学习的时候,可能会突然提到你周一聊过的工作——干扰判断。
  3. 响应越来越慢:上下文越长,AI 处理越慢。

正确做法:按"话题"开新对话

一个话题一个对话。完成一个话题就开新的。

实操示例:

  • 写一封邮件 → 一个对话
  • 做今晚菜谱 → 一个对话
  • 写小红书文案 → 一个对话
  • 学英语口语 → 一个对话(这个可以长期用)
  • 做某个项目方案 → 一个对话(持续多次都在这个里)

判断标准:当你觉得"现在我要换个话题"时,就开新对话。

长对话的"重启"技巧

如果你和 AI 在一个对话里聊了很久,但还想继续这个话题——可以让 AI 总结一次,然后"重新开始":

我们已经聊了很久。请你做一件事:

1. 用 200 字总结我们这次对话的核心内容
2. 列出我们达成的 5 个关键结论
3. 列出还没解决的 3 个问题

完成后,我会把你的总结复制到一个新对话里继续。

然后开个新对话,把这段总结粘贴进去:

背景(来自上次对话的总结):
___(粘贴总结)

现在我们继续:___

这样既"接得上",又"不臃肿"。

长项目:用"主题对话"

如果你在做一个持续 N 周的项目(比如装修、写论文、找工作),建议给这个项目开一个专门的对话——所有相关的事都在这里聊。

定期"重启":每周或每完成一个里程碑,让 AI 总结一次,开个新对话继续。


6.5 文件上传——AI 的"看资料"能力

主流 AI 都能上传什么?

文件类型 大部分 AI 支持? 说明
TXT 都支持 纯文本
PDF 都支持 简历、合同、论文、电子书
Word(doc/docx) 都支持 办公文档
Excel(xls/xlsx) 都支持 表格、数据
CSV 都支持 数据
PPT 多数支持 演示文稿
图片(jpg/png) 都支持 拍照、截图、表格图
Markdown 都支持 笔记
HTML 多数支持 网页
代码文件 都支持 .py、.js、.cpp 等
音频(mp3/wav) 部分支持 录音转文字
视频 Gemini 支持,其他多数不支持 视频内容理解
压缩包(zip) 部分支持 多文件批量上传

怎么上传?

界面上找回形针图标或"上传"按钮——选文件,等几秒(看大小)。

上传后怎么"问"?

最常见的几种方式:

方式 1:让 AI 总结

请总结这份文档,重点关注:
1. 核心结论
2. 关键数据
3. 我应该采取的行动

方式 2:让 AI 找信息

在这份合同里,找出以下内容:
- 付款条款
- 违约责任
- 终止条件
- 任何对我(甲方)不利的条款

方式 3:让 AI 改写

基于这份简历,给我一份改写版:
- 突出 [XX 岗位] 的相关经验
- 简化"流水账式"的工作描述,改成"成果导向"
- 控制在 1 页内

方式 4:让 AI 比较

我上传了 3 份产品方案。请:
1. 用表格对比它们的核心差异
2. 每份方案的最大优势和劣势
3. 推荐一份并说明理由

方式 5:让 AI 学

这是我们公司的"内部话术手册"。请你"学习"一下我们公司的语气和用词,然后用这种风格帮我写一份给客户的邮件。

文件上传的最佳实践

1. 文件不要太大

虽然主流 AI 支持几十 MB 的文件,但越大处理越慢、越容易出错

  • 长 PDF:超过 100 页的,建议先拆成几份
  • 大 Excel:超过 10000 行的,建议先抽样

2. 文件命名要清楚

如果一次上传多个文件,给它们起好懂的名字(比如"合同 v3.pdf"、"修订版.pdf"),AI 可以按文件名引用。

3. 提问时明确"看哪份"

基于"合同 v3.pdf"回答:___

4. 大文件配合"长上下文模型"

如果你要分析一整本书,用 Kimi(2M)、Gemini(1M)这种长上下文模型——其他模型可能"看不完"。


6.6 联网搜索——让 AI 知道"今天的事"

为什么要用联网搜索

AI 模型有"知识截止日期"——比如 GPT-5 的训练数据可能截止到 2025 年某月。那之后的事它都不知道。

典型需要联网的场景

  • 今天的新闻
  • 当前股价、汇率
  • 最新政策、法规
  • 新产品发布信息
  • 实时天气、航班、火车票
  • 当前热搜话题

哪些 AI 有联网搜索

默认开启(无需手动开):

  • Perplexity(专门做 AI 搜索)
  • Grok(默认调用 X 数据)
  • 秘塔 AI 搜索

可手动开启(需要点开关):

  • ChatGPT("Search the web" 按钮)
  • Claude(4 起支持,有 Web Search)
  • Gemini(默认集成 Google Search)
  • 豆包("AI 搜索"按钮)
  • DeepSeek("联网搜索"按钮)
  • Kimi("联网"按钮)
  • 文心一言(默认集成)
  • 通义千问("联网搜索"按钮)

怎么用?

方式 1:直接打开开关

输入框旁边一般有个"联网搜索"或"AI 搜索"按钮——点一下,发问题。AI 会先去搜,再答。

方式 2:在提示词里要求

请联网搜索 [关键词],基于搜索结果回答 [问题]。

方式 3:明确"使用最新信息"

基于 2026 年 4 月的最新信息,回答 [问题]。如有不确定,请联网核实。

联网搜索的关键提示

1. 联网 ≠ 100% 准确

AI 搜来的内容,可能是错的(互联网上本来就有大量错误信息)。重要事实仍要核实

2. AI 搜索也有"幻觉"

有时 AI 会"编"一个网址或一个引用——看起来很真,但不存在。重要引用,自己点开链接核实。

3. 让 AI 引用来源

回答时,每个关键事实后面注明来源(带链接)。

4. 别让 AI 替代严肃搜索

学术论文、法律文献、医学指南——这些专业内容用专门的数据库(知网、Westlaw、PubMed)更可靠。


6.7 私人知识库——AI 的"专属图书馆"

什么是知识库

简单讲:你导入一堆资料,让 AI 基于这些资料回答问题。

比如你做产品经理,可以把自己写过的所有需求文档、行业报告、竞品分析都导入一个"知识库"——以后问 AI 任何相关问题,它优先基于你的资料回答。

技术上,这叫 RAG(Retrieval-Augmented Generation)——"检索增强生成"。普通用户不用懂细节。

哪些工具能做"知识库"

一、对个人用户最简单的

工具 上传类型 容量 特点
NotebookLM(Google) PDF、Word、网页、YouTube 50 个源 / 知识库 能基于资料生成"播客"——AI 主持人讲解
Kimi 知识库 PDF、Word、Excel 等 国内最大之一 支持很大文件
腾讯 IMA 微信文章、PDF、Word 微信生态深度集成 能直接看公众号文章
ChatGPT Projects 各种文件 项目级 适合做"专题项目"
Claude Projects 各种文件 项目级 适合长期协作
Coze(扣子)知识库 各种文件 可搭智能体

二、给团队用的(更专业)

工具 特点
Dify 开源、可自部署
FastGPT 开源、对中文友好
Ragflow 开源、专注 RAG
Microsoft Copilot Studio 企业级

一个完整使用案例:用 NotebookLM 做"考研专题库"

假设你在备考研究生,要看几十篇论文 + 几本教材。

步骤

  1. 打开 NotebookLM(notebooklm.google.com),新建一个 Notebook,命名"考研复习"。
  2. 把所有 PDF(论文、教材章节)一个个导入——最多 50 个。
  3. 在右侧问问题:
基于所有我导入的资料,给我做一份"考点速览":
- 列出 10 个最重要的考点
- 每个考点配 1~2 句解释
- 附"来自哪份资料的第几页"

NotebookLM 会基于你的资料给出答案——比通用 AI 准确得多,因为它只用你给的资料。

  1. 点击"生成 Audio Overview"(音频概览)—— NotebookLM 会生成一段两个 AI 主持人讨论你的资料的"播客"——你可以边走路边听。

普通人什么时候需要"知识库"

不一定每个人都要建知识库。但下面这些场景非常值得:

  • 学生:把所有教材、笔记、错题导入——做"专属学霸 AI"
  • 专业人士:把行业报告、案例、模板导入——做"专属顾问 AI"
  • 写作者:把自己写过的文章导入——保持文风一致
  • 研究者:把读过的论文导入——做"文献 AI"
  • 管理者:把团队历史决策、复盘导入——做"决策助理"
  • 家庭管理:把家里的水电气合同、保险单、产品说明书导入——以后查任何家庭事务都方便

6.8 把所有"上下文"工具组合用——一个"个人 AI 操作系统"

一个高手的"AI 配置"长什么样

我给你一个模范配置,你可以参考着搭:

1. 主力 AI(一个)

选 1 个综合型 AI 作为日常用——比如豆包(国内)或 ChatGPT(国外)。

设置

  • ✅ 自定义指令(按 6.2 模板写好)
  • ✅ 开启记忆功能
  • ✅ 开启联网搜索

2. 推理 AI(一个,按需)

复杂问题用——DeepSeek-R2、Claude Thinking、GPT-5 Thinking 等。

3. 知识库(按需建几个)

  • "工作专题"知识库:放工作相关资料
  • "学习专题"知识库:放学习材料
  • "家庭"知识库:放家庭事务材料

用 NotebookLM、Kimi 知识库或 Claude Projects。

4. 创作工具(按需)

画图、视频、音乐——按需用。

一个高手的"日常工作流"

早上 9 点(开始工作)

  • 打开主力 AI 的"今天的工作对话"
  • 让 AI 总结昨天遗留的事 + 列今天的优先级

白天(执行任务)

  • 写邮件、做 PPT、回信息——直接用主力 AI
  • 涉及"专题"内容(比如客户 X 的项目)—— 用对应的"项目对话"
  • 复杂决策——用推理 AI 多视角分析

下午 5 点(收尾)

  • 让主力 AI 做"今日复盘"
  • 把重要事项加到记忆里

晚上(个人时间)

  • 学习用"学习专题"知识库
  • 创作用专门的创作工具
  • 陪聊用主力 AI 的"心情对话"

这就是真正"用 AI 用得透"的人的日常。


6.9 上下文工程的 5 大原则

总结一下,让 AI 真正懂你的 5 个原则:

原则 1:每一次提问都是"上下文设计"

不要把 AI 当百度。每一次提问都要思考:

  • AI 需要哪些信息才能答好?
  • 这些信息我提供了吗?

原则 2:信息要"恰到好处"

不是越多越好。只给必要的信息

原则 3:长期偏好用"自定义指令"

凡是"每次都要说一遍"的事,写到自定义指令里——一次设好,终身受益。

原则 4:跨对话记忆用"记忆功能"

凡是"AI 应该记住但场景临时"的事,让它记到记忆里。

原则 5:大量资料用"知识库"

凡是"持续要查、不能放进单次对话"的资料,建知识库。


本章小抄

上下文工程速查
──────────────

什么是上下文?
└─ AI 在对话时"能看到"的所有内容(你的话+AI 的回答+文件+记忆+联网+知识库)

让 AI 长期懂你的 4 个工具:

1. 自定义指令(一次设好)
   └─ 你的身份、偏好、说话风格

2. 记忆功能(自动累积)
   └─ AI 跨对话记住你

3. 文件上传(临时喂资料)
   └─ PDF、Excel、图片、合同⋯⋯

4. 知识库(永久专属图书馆)
   └─ NotebookLM、Kimi 知识库、Claude Projects

什么时候开新对话?
└─ 换话题就开。判断:当你觉得"要换个话题"时

什么时候用联网?
└─ 任何"时效性"问题(新闻、价格、政策、新产品)

5 大原则:
1. 每次提问都设计上下文
2. 信息恰到好处(不多不少)
3. 长期偏好 → 自定义指令
4. 跨对话记忆 → 记忆功能
5. 大量资料 → 知识库

5 分钟动手实验

任务:给你的主力 AI 设置"自定义指令" + "记忆"。

步骤

  1. 打开你的主力 AI 设置(找"个性化"或"Custom Instructions")

  2. 第一框(关于你)——填以下信息(参考 6.2 节的模板):

    • 你的基本信息(年龄、职业、家庭)
    • 你的偏好(语言风格、不喜欢什么)
    • 你常用 AI 做的事
  3. 第二框(关于回答)——填回答风格:

    • 直接 / 友好 / 专业 三选一
    • 默认长度
    • 是否要 Markdown 格式
  4. 保存

  5. 测试:开个新对话问:

我想了解一个新东西:[随便挑一个你最近感兴趣的话题]。
请按你了解到的"我"的偏好回答。

对比设置前后的差别——你会立刻感受到"自定义指令"的威力。

  1. 如果你的 AI 有记忆功能,再补一句:
请记住:
- 我的常用电脑系统是 [Windows/Mac]
- 我的常用工具是 [钉钉/飞书/微信/WPS/Office]
- 我经常需要写 [邮件/报告/文案]
- 我有 [家人/宠物/特殊情况]

下次对话时,AI 已经"记得"你了。


第二部分小结:你已经会"和 AI 沟通"了

恭喜!读完第 4、5、6 章,你已经掌握了和 AI 沟通的全部核心技能

  • 第四章:基础提示词(角色、任务、格式、约束)
  • 第五章:进阶 10 大技巧(思维链、少样本、迭代、对抗示范⋯⋯)
  • 第六章:上下文工程(自定义、记忆、文件、知识库)

接下来 4 章,我们进入实战场景——把这些技能真正用到生活、学习、工作、创作中。


下章预告

下一章 第七章 生活场景实战,进入"AI 在生活中"四大场景的第一章:

  • 写各种"难写的话"(道歉信、求助信、家庭沟通话术)
  • 看懂各种"看不懂的报告"(体检、合同、说明书)
  • 做菜、健身、健康咨询
  • 旅游攻略一次搞定
  • 购物决策助手
  • 育儿与家庭关系话术

20+ 个真实场景,每个都有完整提示词,复制就能用