序言 · RAG 橙皮书

第一个故事：被 3000 份合同压垮的张姐

张姐是某家中型律所的合规专员。

她的日常工作是这样的：律师写完一份合同的修改稿，发给她，让她在 30 分钟内告诉律师——

我们以前的同类合同里，这个条款是怎么写的？
上一次签这个客户时，他们对这种付款方式的反应是什么？
这种"违约金不超过合同金额 30%"的条款，监管最近有没有新的解释？
三年前我们打过的那个官司，对方的律师函里是怎么反驳类似条款的？

听起来像是 30 分钟能搞定的事。

但实际上，张姐每周都要为这件事加班到 11 点。

为什么？

因为她要查的"以前的资料"，分散在：

公司共享盘的「2018-2025 已签合同」文件夹（3147 份 PDF，按客户分类，有的连命名都不对）
邮件里的「客户来往函件」（8 万多封，最早的还在 outlook 的 PST 备份文件里）
OA 系统的「内部审批意见」（每份合同都有 5-15 条审批批注）
律师们各自电脑里的「私人备忘录」（这一档她没法翻，只能去问人）
国家法律法规库（每个月都在更新，光最近一年就出了 200 多份新解释）

她的"工作流"是这样的：

收到律师的需求 → 在脑子里想"以前哪个合同有类似条款" → 凭印象去文件夹翻；
翻 3-5 个文件夹之后想起来"哦对，这个客户在某年签过类似的"，去客户文件夹翻；
找到了，但是 PDF 里 80 多页，Ctrl+F 也搜不出来——因为是图片型 PDF，文字根本不能选；
只能一页一页翻，翻到第 47 页找到了相关条款，截图发给律师；
律师看完说："你帮我对比一下，这个条款和我现在改的有没有冲突。"
张姐再去找现在的修改稿，在 Word 里手动比对，做 Excel 表格汇总；
律师又说："对了，你帮我看看监管去年是不是出过新规。"
张姐去国家法规库的搜索框输关键词，跳出 200 条结果，每条都得点开看；
最后她加班加到 11 点，做出来的对比表，律师 5 分钟看完说"挺好的，发给客户"。

她做得越久，越绝望。

不是因为活多——而是因为她做的几乎全部是"找东西"，真正"思考"的时间不到 10%。

她试过用 ChatGPT。

她把律师的问题原原本本贴进去："请帮我对比……"

ChatGPT 一本正经地给了她一份"模板答案"——条款写得比她还像那么回事。

但律师扫一眼就笑了："你这个条款是 ChatGPT 编的吧？我们公司从来没用过这种表述。"

张姐愣住了。

是啊，ChatGPT 是聪明，但它不知道她公司。

它没读过那 3147 份合同。它不知道公司的话术习惯。它不知道这个客户上次是怎么咬牙妥协的。它甚至不知道公司去年才刚刚被监管谈过话，所以现在所有合同都不能再写"违约金 30%"。

它只是一个**"读完了全人类公开知识、但完全不认识你公司"的实习生**。

"那我把所有合同都贴进 ChatGPT 不就行了？"张姐问。

她试过。

3147 份合同，全部加起来，至少 5000 万字。

ChatGPT 一次能读的，最多 100 万字（Claude / Gemini 1.5 / GPT-4o 长上下文版）。

她一次只能贴几十份。

而且每次贴，token 费用就要烧十几块。

而且每次开新窗口，AI 就忘了。

她试到第三天就放弃了。

直到 2026 年 3 月的一天，张姐的同事丢给她一句话：

"你不是一直在找资料吗？你试试搭一个知识库？"

那个晚上，张姐花了一个半小时，把 3147 份合同上传到一个免费的工具里（NotebookLM），让它自动 OCR、自动切片、自动建索引。

第二天，她做了一件她自己都不敢相信的事：

她对着那个工具说："请告诉我，我们公司过去三年里，所有提到『违约金不超过合同金额 30%』这一条款的合同，分别在第几条，签订日期是什么时候，违约金最终的金额是不是真的卡在 30%。"

15 秒之后，工具给了她一张表格：

合同编号	签订日期	客户	条款位置	实际违约金
HT-2023-0412	2023-04-12	XX 集团	第 11.3 条	28%
HT-2024-0117	2024-01-17	YY 公司	第 9.2 条	30%（封顶）
……（共 47 条）	……	……	……	……

每一条都附了原始合同的引用页码——点开就能跳到 PDF 第 11.3 条、第 47 页、第 X 行。

那一刻，张姐觉得自己不是在用 AI，而是在用一个24 小时不睡觉、读完了她公司全部 3147 份合同、还会做 Excel 表格的实习生。

她又问："这 47 份合同里，最终实际违约金真的达到 30% 的，有几份？是因为什么原因谈崩的？"

工具又给了她答案。所有引用都来自她自己公司的合同，没有一句是 AI 编的。

那个周末，张姐把同样的方法，复制到了：

律所的「2014 年至今所有判例库」（4 万多份）；
公司的「客户来往邮件归档」（8 万多封）；
OA 系统导出的「内部审批意见」（10 万多条）；
国家司法部、银保监、证监最新的「政策法规」（每周自动同步）。

从此，律师再问她"以前我们怎么处理的"，张姐 30 秒就给出答案——而且每条都有原文引用。

三个月后，她升职了。理由是"一个人完成了过去三个人的工作量"。

她在升职申请里写了一句话：

"我没有变得更聪明，我只是给我的 AI 助手装上了我们公司的大脑。"

第二个故事：凌晨三点翻爸妈病例本的李哥

李哥是个 35 岁的程序员。

他爸今年 67，三年前查出冠心病，2024 年又添了糖尿病。

他妈今年 65，2023 年中过一次小风，现在每天要吃 6 种药。

李哥不在父母身边——爸妈在四川老家，他在深圳。

老两口都不会用智能手机的复杂功能，看病也不愿意麻烦他："你忙你的工作，我们自己能搞定。"

但他始终睡不踏实。

每次老两口去医院复查，回来电话里就是这种对话：

"李医生说我血压控制得还行，让我把那个'氯沙坦'减半。"
"等等，妈，你说的氯沙坦是早上吃的那个，还是晚上吃的那个？"
"我也不记得，反正就是那个白色的，小小的，圆的。"
"……那你现在打开药盒看一眼？"
"药盒早就扔了，我把药都倒进一个大瓶子里了。"

那一晚李哥血压都飙了。

他想起来，去年他妈提到过一次"医生说有种降压药跟我中风后吃的某种药不能一起吃"，但他完全不记得是哪两种药。

他翻出爸妈过去三年所有的看病记录——

手写的病历本：3 本，每本 80 多页，他爸的字像鬼画符；
化验单：100 多张，杂乱地塞在抽屉里；
CT/MRI 报告：20 多份，全是 PDF 扫描件；
出院小结：8 次住院，每次都有 5-10 页的小结；
微信里的医生嘱咐：他爸妈跟主治医生有微信，3 年的聊天记录，12000 多条。

李哥打算花一个周末把这些"全部录入 Excel"，做成一份"父母健康档案"。

他做了一上午，做出了一份 800 行的表格。

然后他突然意识到：

就算他做完这张表，下一次接到电话，他还是要现场翻表，临时找答案。

他爸妈不会查表。他在地铁上、在开会、在睡觉，都不能立刻打开 Excel 翻 800 行。

而且最要命的是——新的报告还在不停产生。每个月都有新的就诊、新的化验、新的用药调整。

他做了三天 Excel，第四天就放弃了。

那天晚上，他刷到一篇文章，叫《我把爸妈所有病例丢进了 NotebookLM》。

他半信半疑，照着文章的步骤做：

把那 3 本手写病历本，用手机扫描成 PDF（他妈帮他扫的，扫了一下午）；
化验单、CT、出院小结，全部扫成 PDF；
微信跟主治医生的聊天记录，用一个小工具导出成 TXT；
全部上传到一个本地的工具（Cherry Studio + DeepSeek）——因为他不放心把爸妈的隐私上传云端；
工具自动 OCR、自动切片、自动建索引——他什么都没干，只是泡了壶茶。

一个小时后，他试着问：

"我妈现在每天吃哪些药？分别是什么时候开始吃的，是哪个医生开的，是为了治什么病？"

工具几秒钟内给了他答案——

药名	开始时间	剂量	开药医生	适应症	引用
氯沙坦钾片	2023-08-15	早晚各 25mg	张主任	高血压（中风后二级预防）	病历 P12
阿司匹林肠溶片	2023-08-15	每日 100mg	张主任	中风二级预防	病历 P13
阿托伐他汀钙片	2023-08-15	每晚 20mg	张主任	高脂血症	病历 P14
二甲双胍缓释片	2024-03-20	早晚各 500mg	王医生	糖尿病	病历 P28
格列美脲片	2024-06-12	早 1mg	王医生	糖尿病	病历 P31
银杏叶片	2025-01-10	一日 3 次	自己买	改善记忆	微信 2025-01-10

每一条都有出处。

李哥看完，眼睛红了。

他问的第二个问题是："这 6 种药里，有没有任何两种之间存在相互作用的禁忌？"

工具几秒钟告诉他："银杏叶片与阿司匹林联用，理论上会增加出血风险。建议咨询主治医生。该信息基于公开药品说明书，请以专业医生意见为准。"

那一晚他打了 4 个电话——给爸妈、给主治医生、给老家的姐姐。

确认了银杏叶片不能再吃了。

那一晚他睡了三年来最踏实的一觉。

后来，他每次给爸妈复查前，都会先问那个工具："我妈这次复查重点应该问医生哪些事？"

工具会基于过去三年所有的化验单趋势，给他一份"建议问诊清单"——比一张体检表还细。

他还把这套东西复制了一份送给自己的姐姐，姐姐从此再也不需要每周给爸打电话问"今天血压量了没"。

李哥写了一篇博文：

"我以前以为 AI 离我很远。直到我把爸妈三年的病例本喂给它的那个晚上，

我才意识到——AI 唯一离普通人近的方式，不是它有多聪明，而是它有多懂你的事。

而让它懂你的事，只需要一件东西：你自己的知识库。"

这两个故事告诉你什么？

张姐和李哥，一个是大公司里被流程压垮的"信息工人"，一个是离家千里的"远程子女"。

他们俩的处境，看起来八竿子打不着。

但他们的"痛苦本质"是同一个：

他们都拥有大量"对自己很重要"的资料，但他们没有能力让 AI"读懂"这些资料。

张姐的痛苦是：3147 份合同、8 万封邮件，AI 没法一次性吞下去。李哥的痛苦是：3 本病例本、12000 条微信，AI 不知道是不是"自己家"的事。

更可怕的是——他们身边几乎所有人，都有同样的痛苦：

销售小赵，电脑里有 5 年的客户聊天记录、200 个项目案例，每次写新方案还得从头翻；
HR 小钱，手里有 3000 份简历、500 份面试评价、200 份录用意向，找一个"今年 25 岁、做过医疗、会一点 Python"的人要翻 3 小时；
学生小孙，电脑里 200 G 的网课视频、500 篇论文、20 本电子书，复习到一半想找"那段讲 Transformer 注意力机制的视频"——找不到；
老板小李，办公室里 5 个柜子的纸质合同、内部 SOP、客户档案，每次开会引用上一次的决议都靠"我记得当时谁说过……"
自由职业者小周，自己写过 200 篇文章、做过 50 期播客，想"把我自己的文风教给 AI"，结果 AI 写出来的还是"千篇一律的 ChatGPT 体"；
阿姨大妈大叔，家里柜子塞满了说明书、保修卡、化验单——出问题了不知道找哪本；
你的爸妈、你的伴侣、你的小孩——他们每个人都在用着 ChatGPT 之类的 AI，但 AI 对他们的回答永远停留在"通用建议"层面。

所有这些人，本质上需要的都是同一件东西——AI 知识库。

英文叫 RAG（Retrieval-Augmented Generation，检索增强生成）。

中文你怎么叫都行——AI 知识库、外挂大脑、私人图书管理员、自家书柜里的 ChatGPT、第二大脑、企业 GPT、个人 GPT、家庭 GPT……

它们说的都是同一件事：

让 AI 在回答你之前，先翻一翻你给它的资料，然后基于资料作答。

仅此而已。

但就这么简单的一件事，会让 AI 从"通用聊天机器人"，瞬间变成"懂你的事的私人顾问"。

为什么是 2026 年？为什么是现在？

你可能会问：RAG 这个词，2023 年就有了，为什么这本书 2026 年才出？

因为直到 2026 年，RAG 才真正变成了"普通人能用得起、能学得会、能持续维护"的东西。

我们对比一下时间线：

2023：RAG 的"程序员专属期"

工具：LangChain、LlamaIndex（全是英文文档，纯代码）
大模型：GPT-3.5、Claude 1（贵、慢、效果一般）
嵌入模型：OpenAI ada-002（国内不能直连）
向量数据库：Pinecone、Chroma、Weaviate（全要自己装）
普通人体感：完全没法用。一句"先 pip install langchain"就劝退 99%。

2024：RAG 的"早期 SaaS 期"

工具：Coze、Dify、Notion AI 开始内置知识库
大模型：GPT-4、Claude 3、文心一言、通义、Kimi 出来了
嵌入模型：开源 BGE 模型可用，国内能跑
体验：好了一点，但还要懂"chunk size"、"top-k"、"rerank" 这些黑话
普通人体感：勉强能用，但搭出来的东西经常答非所问。

2025：RAG 的"零代码爆发期"

工具：Google 推出 NotebookLM（免费、零配置、效果惊人）；腾讯推出 ima、字节推出豆包知识库、阿里推出通义灵码知识库
大模型：DeepSeek R1 把推理价格砍到 1/100，Claude 3.5 / Gemini 2.0 长上下文
嵌入模型：国内可用的多模态嵌入（jina-clip）成熟
桌面工具：Cherry Studio、AnythingLLM Desktop 开始流行
普通人体感：第一次"3 分钟搭出一个能用的知识库"成为可能。

2026：RAG 的"全民工具年"

工具：NotebookLM 推出了 Audio Overview 中文版；Google Notebooks 整合到 Gemini 主线；ima 加入 Lecture Mode；几乎所有国内 AI 助手都内置了"知识库"功能
大模型：GPT-5、Claude 4、Gemini 3、DeepSeek V3、文心 5、豆包 1.6、通义 3——每一家都把上下文窗口拉到 100 万-1000 万 token
嵌入：BGE-M3、jina-v3、Qwen-Embed 全部开源、免费
部署：本地跑 RAG 的硬件门槛降到"一台 M3 / M4 MacBook"或"一张 RTX 4070"
普通人体感：RAG 已经不是技术活了，是人人都该会的"AI 基本功"。

这本书诞生的意义就是：把"2026 年这个最佳学习窗口"打包成一本你跟着做就能学会的手册。

如果你 2024 年读 RAG 的书，你会被淹死在术语里。如果你 2028 年才学，那时已经是"AI 知识库 2.0"——人人都会，你还在零起步。

2026 年是普通人学 RAG 性价比最高的一年。

这本书会怎么带你走

我们不会让你"先搞懂原理再动手"。

我们会让你第一章就动手——5 分钟搭出一个能用的知识库。

之后我们再回头讲：

它为什么能跑（第三章原理）；
你还能选哪些工具（第四章全景图）；
你的资料怎么准备会更好用（第六章数据准备）；
你怎么提问才能让它好好回答（第七章提问技巧）；
你怎么把它用到生活、工作、学习里（第 8、9、10 章实战）；
你怎么把它"装在自己电脑上"，永远不上传云端（第十一章本地部署）；
你怎么避免新手最容易掉的坑（第十二章避坑与安全）；
你怎么把这件事变成自己的产品和副业（第十二章末尾）。

不需要预备知识。不需要花一分钱（除非你愿意升级到付费档）。不需要会写代码。

你只需要：

一台电脑（Mac / Windows / Linux 都行）；
一个浏览器；
一些"对你来说重要"的资料——可以是合同、可以是病例、可以是笔记、可以是会议纪要、可以是学习笔记，任何东西都可以；
一个周末的时间。

一句话开场白

2024 年，AI 还在比谁更聪明。 2026 年，AI 已经在比谁更"懂你"。让 AI 懂你的钥匙，叫做"知识库"。而钥匙，今天就在你手上。

翻开第一章 AI 知识库到底是什么（用大白话讲清楚 RAG），我们开始吧。

本章一图回顾

flowchart LR
    A[普通人手里有海量资料] --> B[但 ChatGPT 不知道]
    B --> C[于是 AI 只能给通用建议]
    C --> D[AI 知识库 RAG 出现]
    D --> E[让 AI 先翻你的资料]
    E --> F[再基于资料作答]
    F --> G[AI 第一次真的懂你]

下一章预告

下一章我们会用 4 个比喻、1 张对比表、20 件普通人能做的事，把"AI 知识库（RAG）到底是什么"彻底讲清楚——讲到你能用一句话向爸妈解释为止。