ORANGE BOOK · RAG

序言:为什么每个人都需要自己的 AI 知识库


第一个故事:被 3000 份合同压垮的张姐

张姐是某家中型律所的合规专员。

她的日常工作是这样的:律师写完一份合同的修改稿,发给她,让她在 30 分钟内告诉律师——

  • 我们以前的同类合同里,这个条款是怎么写的?
  • 上一次签这个客户时,他们对这种付款方式的反应是什么?
  • 这种"违约金不超过合同金额 30%"的条款,监管最近有没有新的解释?
  • 三年前我们打过的那个官司,对方的律师函里是怎么反驳类似条款的?

听起来像是 30 分钟能搞定的事。

但实际上,张姐每周都要为这件事加班到 11 点。

为什么?

因为她要查的"以前的资料",分散在:

  • 公司共享盘的「2018-2025 已签合同」文件夹(3147 份 PDF,按客户分类,有的连命名都不对)
  • 邮件里的「客户来往函件」(8 万多封,最早的还在 outlook 的 PST 备份文件里)
  • OA 系统的「内部审批意见」(每份合同都有 5-15 条审批批注)
  • 律师们各自电脑里的「私人备忘录」(这一档她没法翻,只能去问人)
  • 国家法律法规库(每个月都在更新,光最近一年就出了 200 多份新解释)

她的"工作流"是这样的:

  1. 收到律师的需求 → 在脑子里想"以前哪个合同有类似条款" → 凭印象去文件夹翻;
  2. 翻 3-5 个文件夹之后想起来"哦对,这个客户在某年签过类似的",去客户文件夹翻;
  3. 找到了,但是 PDF 里 80 多页,Ctrl+F 也搜不出来——因为是图片型 PDF,文字根本不能选;
  4. 只能一页一页翻,翻到第 47 页找到了相关条款,截图发给律师;
  5. 律师看完说:"你帮我对比一下,这个条款和我现在改的有没有冲突。"
  6. 张姐再去找现在的修改稿,在 Word 里手动比对,做 Excel 表格汇总;
  7. 律师又说:"对了,你帮我看看监管去年是不是出过新规。"
  8. 张姐去国家法规库的搜索框输关键词,跳出 200 条结果,每条都得点开看;
  9. 最后她加班加到 11 点,做出来的对比表,律师 5 分钟看完说"挺好的,发给客户"。

她做得越久,越绝望。

不是因为活多——而是因为她做的几乎全部是"找东西",真正"思考"的时间不到 10%

她试过用 ChatGPT。

她把律师的问题原原本本贴进去:"请帮我对比……"

ChatGPT 一本正经地给了她一份"模板答案"——条款写得比她还像那么回事。

但律师扫一眼就笑了:"你这个条款是 ChatGPT 编的吧?我们公司从来没用过这种表述。"

张姐愣住了。

是啊,ChatGPT 是聪明,但它不知道她公司

它没读过那 3147 份合同。它不知道公司的话术习惯。它不知道这个客户上次是怎么咬牙妥协的。它甚至不知道公司去年才刚刚被监管谈过话,所以现在所有合同都不能再写"违约金 30%"。

它只是一个**"读完了全人类公开知识、但完全不认识你公司"的实习生**。

"那我把所有合同都贴进 ChatGPT 不就行了?"张姐问。

她试过。

3147 份合同,全部加起来,至少 5000 万字。

ChatGPT 一次能读的,最多 100 万字(Claude / Gemini 1.5 / GPT-4o 长上下文版)。

她一次只能贴几十份。

而且每次贴,token 费用就要烧十几块。

而且每次开新窗口,AI 就忘了。

她试到第三天就放弃了。

直到 2026 年 3 月的一天,张姐的同事丢给她一句话:

"你不是一直在找资料吗?你试试搭一个知识库?"

那个晚上,张姐花了一个半小时,把 3147 份合同上传到一个免费的工具里(NotebookLM),让它自动 OCR、自动切片、自动建索引。

第二天,她做了一件她自己都不敢相信的事:

她对着那个工具说:"请告诉我,我们公司过去三年里,所有提到『违约金不超过合同金额 30%』这一条款的合同,分别在第几条,签订日期是什么时候,违约金最终的金额是不是真的卡在 30%。"

15 秒之后,工具给了她一张表格

合同编号 签订日期 客户 条款位置 实际违约金
HT-2023-0412 2023-04-12 XX 集团 第 11.3 条 28%
HT-2024-0117 2024-01-17 YY 公司 第 9.2 条 30%(封顶)
……(共 47 条) …… …… …… ……

每一条都附了原始合同的引用页码——点开就能跳到 PDF 第 11.3 条、第 47 页、第 X 行。

那一刻,张姐觉得自己不是在用 AI,而是在用一个24 小时不睡觉、读完了她公司全部 3147 份合同、还会做 Excel 表格的实习生

她又问:"这 47 份合同里,最终实际违约金真的达到 30% 的,有几份?是因为什么原因谈崩的?"

工具又给了她答案。所有引用都来自她自己公司的合同,没有一句是 AI 编的。

那个周末,张姐把同样的方法,复制到了:

  • 律所的「2014 年至今所有判例库」(4 万多份);
  • 公司的「客户来往邮件归档」(8 万多封);
  • OA 系统导出的「内部审批意见」(10 万多条);
  • 国家司法部、银保监、证监最新的「政策法规」(每周自动同步)。

从此,律师再问她"以前我们怎么处理的",张姐 30 秒就给出答案——而且每条都有原文引用。

三个月后,她升职了。理由是"一个人完成了过去三个人的工作量"。

她在升职申请里写了一句话:

"我没有变得更聪明,我只是给我的 AI 助手装上了我们公司的大脑。"


第二个故事:凌晨三点翻爸妈病例本的李哥

李哥是个 35 岁的程序员。

他爸今年 67,三年前查出冠心病,2024 年又添了糖尿病。

他妈今年 65,2023 年中过一次小风,现在每天要吃 6 种药。

李哥不在父母身边——爸妈在四川老家,他在深圳。

老两口都不会用智能手机的复杂功能,看病也不愿意麻烦他:"你忙你的工作,我们自己能搞定。"

但他始终睡不踏实。

每次老两口去医院复查,回来电话里就是这种对话:

  • "李医生说我血压控制得还行,让我把那个'氯沙坦'减半。"
  • "等等,妈,你说的氯沙坦是早上吃的那个,还是晚上吃的那个?"
  • "我也不记得,反正就是那个白色的,小小的,圆的。"
  • "……那你现在打开药盒看一眼?"
  • "药盒早就扔了,我把药都倒进一个大瓶子里了。"

那一晚李哥血压都飙了。

他想起来,去年他妈提到过一次"医生说有种降压药跟我中风后吃的某种药不能一起吃",但他完全不记得是哪两种药。

他翻出爸妈过去三年所有的看病记录——

  • 手写的病历本:3 本,每本 80 多页,他爸的字像鬼画符;
  • 化验单:100 多张,杂乱地塞在抽屉里;
  • CT/MRI 报告:20 多份,全是 PDF 扫描件;
  • 出院小结:8 次住院,每次都有 5-10 页的小结;
  • 微信里的医生嘱咐:他爸妈跟主治医生有微信,3 年的聊天记录,12000 多条

李哥打算花一个周末把这些"全部录入 Excel",做成一份"父母健康档案"。

他做了一上午,做出了一份 800 行的表格。

然后他突然意识到:

就算他做完这张表,下一次接到电话,他还是要现场翻表,临时找答案。

他爸妈不会查表。他在地铁上、在开会、在睡觉,都不能立刻打开 Excel 翻 800 行。

而且最要命的是——新的报告还在不停产生。每个月都有新的就诊、新的化验、新的用药调整。

他做了三天 Excel,第四天就放弃了。

那天晚上,他刷到一篇文章,叫《我把爸妈所有病例丢进了 NotebookLM》。

他半信半疑,照着文章的步骤做:

  1. 把那 3 本手写病历本,用手机扫描成 PDF(他妈帮他扫的,扫了一下午);
  2. 化验单、CT、出院小结,全部扫成 PDF;
  3. 微信跟主治医生的聊天记录,用一个小工具导出成 TXT;
  4. 全部上传到一个本地的工具(Cherry Studio + DeepSeek)——因为他不放心把爸妈的隐私上传云端
  5. 工具自动 OCR、自动切片、自动建索引——他什么都没干,只是泡了壶茶

一个小时后,他试着问:

"我妈现在每天吃哪些药?分别是什么时候开始吃的,是哪个医生开的,是为了治什么病?"

工具几秒钟内给了他答案——

药名 开始时间 剂量 开药医生 适应症 引用
氯沙坦钾片 2023-08-15 早晚各 25mg 张主任 高血压(中风后二级预防) 病历 P12
阿司匹林肠溶片 2023-08-15 每日 100mg 张主任 中风二级预防 病历 P13
阿托伐他汀钙片 2023-08-15 每晚 20mg 张主任 高脂血症 病历 P14
二甲双胍缓释片 2024-03-20 早晚各 500mg 王医生 糖尿病 病历 P28
格列美脲片 2024-06-12 早 1mg 王医生 糖尿病 病历 P31
银杏叶片 2025-01-10 一日 3 次 自己买 改善记忆 微信 2025-01-10

每一条都有出处。

李哥看完,眼睛红了。

他问的第二个问题是:"这 6 种药里,有没有任何两种之间存在相互作用的禁忌?"

工具几秒钟告诉他:"银杏叶片阿司匹林联用,理论上会增加出血风险。建议咨询主治医生。该信息基于公开药品说明书,请以专业医生意见为准。"

那一晚他打了 4 个电话——给爸妈、给主治医生、给老家的姐姐。

确认了银杏叶片不能再吃了。

那一晚他睡了三年来最踏实的一觉。

后来,他每次给爸妈复查前,都会先问那个工具:"我妈这次复查重点应该问医生哪些事?"

工具会基于过去三年所有的化验单趋势,给他一份"建议问诊清单"——比一张体检表还细。

他还把这套东西复制了一份送给自己的姐姐,姐姐从此再也不需要每周给爸打电话问"今天血压量了没"。

李哥写了一篇博文:

"我以前以为 AI 离我很远。直到我把爸妈三年的病例本喂给它的那个晚上,

我才意识到——AI 唯一离普通人近的方式,不是它有多聪明,而是它有多懂你的事。

而让它懂你的事,只需要一件东西:你自己的知识库。"


这两个故事告诉你什么?

张姐和李哥,一个是大公司里被流程压垮的"信息工人",一个是离家千里的"远程子女"。

他们俩的处境,看起来八竿子打不着。

但他们的"痛苦本质"是同一个:

他们都拥有大量"对自己很重要"的资料,但他们没有能力让 AI"读懂"这些资料。

张姐的痛苦是:3147 份合同、8 万封邮件,AI 没法一次性吞下去。 李哥的痛苦是:3 本病例本、12000 条微信,AI 不知道是不是"自己家"的事。

更可怕的是——他们身边几乎所有人,都有同样的痛苦:

  • 销售小赵,电脑里有 5 年的客户聊天记录、200 个项目案例,每次写新方案还得从头翻;
  • HR 小钱,手里有 3000 份简历、500 份面试评价、200 份录用意向,找一个"今年 25 岁、做过医疗、会一点 Python"的人要翻 3 小时;
  • 学生小孙,电脑里 200 G 的网课视频、500 篇论文、20 本电子书,复习到一半想找"那段讲 Transformer 注意力机制的视频"——找不到;
  • 老板小李,办公室里 5 个柜子的纸质合同、内部 SOP、客户档案,每次开会引用上一次的决议都靠"我记得当时谁说过……"
  • 自由职业者小周,自己写过 200 篇文章、做过 50 期播客,想"把我自己的文风教给 AI",结果 AI 写出来的还是"千篇一律的 ChatGPT 体";
  • 阿姨大妈大叔,家里柜子塞满了说明书、保修卡、化验单——出问题了不知道找哪本;
  • 你的爸妈、你的伴侣、你的小孩——他们每个人都在用着 ChatGPT 之类的 AI,但 AI 对他们的回答永远停留在"通用建议"层面。

所有这些人,本质上需要的都是同一件东西——AI 知识库。

英文叫 RAG(Retrieval-Augmented Generation,检索增强生成)。

中文你怎么叫都行——AI 知识库、外挂大脑、私人图书管理员、自家书柜里的 ChatGPT、第二大脑、企业 GPT、个人 GPT、家庭 GPT……

它们说的都是同一件事:

让 AI 在回答你之前,先翻一翻你给它的资料,然后基于资料作答。

仅此而已。

但就这么简单的一件事,会让 AI 从"通用聊天机器人",瞬间变成"懂你的事的私人顾问"。


为什么是 2026 年?为什么是现在?

你可能会问:RAG 这个词,2023 年就有了,为什么这本书 2026 年才出?

因为直到 2026 年,RAG 才真正变成了"普通人能用得起、能学得会、能持续维护"的东西

我们对比一下时间线:

2023:RAG 的"程序员专属期"

  • 工具:LangChain、LlamaIndex(全是英文文档,纯代码
  • 大模型:GPT-3.5、Claude 1(贵、慢、效果一般)
  • 嵌入模型:OpenAI ada-002(国内不能直连
  • 向量数据库:Pinecone、Chroma、Weaviate(全要自己装
  • 普通人体感:完全没法用。一句"先 pip install langchain"就劝退 99%。

2024:RAG 的"早期 SaaS 期"

  • 工具:Coze、Dify、Notion AI 开始内置知识库
  • 大模型:GPT-4、Claude 3、文心一言、通义、Kimi 出来了
  • 嵌入模型:开源 BGE 模型可用,国内能跑
  • 体验:好了一点,但还要懂"chunk size"、"top-k"、"rerank" 这些黑话
  • 普通人体感:勉强能用,但搭出来的东西经常答非所问

2025:RAG 的"零代码爆发期"

  • 工具:Google 推出 NotebookLM(免费、零配置、效果惊人);腾讯推出 ima、字节推出豆包知识库、阿里推出通义灵码知识库
  • 大模型:DeepSeek R1 把推理价格砍到 1/100,Claude 3.5 / Gemini 2.0 长上下文
  • 嵌入模型:国内可用的多模态嵌入(jina-clip)成熟
  • 桌面工具:Cherry Studio、AnythingLLM Desktop 开始流行
  • 普通人体感:第一次"3 分钟搭出一个能用的知识库"成为可能

2026:RAG 的"全民工具年"

  • 工具:NotebookLM 推出了 Audio Overview 中文版;Google Notebooks 整合到 Gemini 主线;ima 加入 Lecture Mode;几乎所有国内 AI 助手都内置了"知识库"功能
  • 大模型:GPT-5、Claude 4、Gemini 3、DeepSeek V3、文心 5、豆包 1.6、通义 3——每一家都把上下文窗口拉到 100 万-1000 万 token
  • 嵌入:BGE-M3、jina-v3、Qwen-Embed 全部开源、免费
  • 部署:本地跑 RAG 的硬件门槛降到"一台 M3 / M4 MacBook"或"一张 RTX 4070"
  • 普通人体感:RAG 已经不是技术活了,是人人都该会的"AI 基本功"。

这本书诞生的意义就是:把"2026 年这个最佳学习窗口"打包成一本你跟着做就能学会的手册

如果你 2024 年读 RAG 的书,你会被淹死在术语里。 如果你 2028 年才学,那时已经是"AI 知识库 2.0"——人人都会,你还在零起步。

2026 年是普通人学 RAG 性价比最高的一年。


这本书会怎么带你走

我们不会让你"先搞懂原理再动手"。

我们会让你第一章就动手——5 分钟搭出一个能用的知识库。

之后我们再回头讲:

  • 它为什么能跑(第三章原理);
  • 你还能选哪些工具(第四章全景图);
  • 你的资料怎么准备会更好用(第六章数据准备);
  • 你怎么提问才能让它好好回答(第七章提问技巧);
  • 你怎么把它用到生活、工作、学习里(第 8、9、10 章实战);
  • 你怎么把它"装在自己电脑上",永远不上传云端(第十一章本地部署);
  • 你怎么避免新手最容易掉的坑(第十二章避坑与安全);
  • 你怎么把这件事变成自己的产品和副业(第十二章末尾)。

不需要预备知识。不需要花一分钱(除非你愿意升级到付费档)。不需要会写代码。

你只需要:

  • 一台电脑(Mac / Windows / Linux 都行);
  • 一个浏览器;
  • 一些"对你来说重要"的资料——可以是合同、可以是病例、可以是笔记、可以是会议纪要、可以是学习笔记,任何东西都可以
  • 一个周末的时间。

一句话开场白

2024 年,AI 还在比谁更聪明。 2026 年,AI 已经在比谁更"懂你"。 让 AI 懂你的钥匙,叫做"知识库"。 而钥匙,今天就在你手上。

翻开 第一章 AI 知识库到底是什么(用大白话讲清楚 RAG),我们开始吧。


本章一图回顾

flowchart LR
    A[普通人手里有海量资料] --> B[但 ChatGPT 不知道]
    B --> C[于是 AI 只能给通用建议]
    C --> D[AI 知识库 RAG 出现]
    D --> E[让 AI 先翻你的资料]
    E --> F[再基于资料作答]
    F --> G[AI 第一次真的懂你]

下一章预告

下一章我们会用 4 个比喻、1 张对比表、20 件普通人能做的事,把"AI 知识库(RAG)到底是什么"彻底讲清楚——讲到你能用一句话向爸妈解释为止。