没有知识库的AI有多瘸 · RAG 橙皮书

2.1 为什么我们要先讲"AI 不行的时候"

绝大多数 AI 入门书都在讲"AI 多厉害"。

这本书反过来——我们先讲"AI 不行的时候"。

为什么？因为：

你只有先看清"AI 不行"，才知道 RAG 救的是哪部分——不然你会过度依赖 AI，把不该交给它的事也交给它。
你只有体会过"它装作很懂但其实在编"的尴尬，才会真正在乎"答案有没有引用、引用准不准"。
你只有知道"哪些场景必须 RAG"，才不会浪费时间——比如"今天天气怎么样"用 RAG 是大材小用。

所以这一章我们会用 5 个真实痛点，把没有知识库的 AI 的"瘸腿之处"，扒得干干净净。

每个痛点都按这个结构讲：

故事场景：一个具体的人、具体的需求；
没有 RAG 时：AI 是怎么尴尬的；
加上 RAG 后：AI 是怎么变利索的；
底层原因：为什么没有 RAG 就一定会出这个问题。

2.2 痛点一：AI 完全不知道"你的事"

故事：刚换工作的小赵

小赵刚跳槽到一家做医疗器械的销售公司。

入职第一天，老板甩给他一句话："这个月底之前给 X 医院的张主任出一份方案，模仿我们去年给 Y 医院出的那一版。"

小赵打开 ChatGPT，问：

"请按照我们公司给 Y 医院出过的方案模板，给 X 医院张主任出一份采购方案。"

ChatGPT 说：

"您好！我无法访问您公司给 Y 医院的具体方案模板。不过基于一般的医疗器械采购方案常用结构，建议包含以下 8 个部分：1. 项目概述 2. 需求分析 3. 产品方案……"

它给了一份通用模板——和小赵公司的真实模板可能毫无关系。

小赵交上去之后，老板看了 5 秒钟说：

"这是 ChatGPT 写的吧？我们公司从来不写'项目概述'，开头一律写'尊敬的 X 主任'。这种格式我们 5 年前就不用了。"

小赵当场尴尬。

加上 RAG 之后

小赵把公司过去 5 年所有的"医院采购方案"丢进知识库（用 NotebookLM）。

他再问：

"请按照我们公司给 Y 医院出过的方案，套用同样的格式、同样的话术、同样的报价区间，给 X 医院张主任写一份采购方案。"

知识库 2 秒钟翻出了"Y 医院 2023 方案.pdf"，并基于它生成了一份格式、话术、报价都贴着公司风格的方案——每一段都标注了引用自原方案的哪一页哪一段。

老板看完只改了 2 个字。

为什么会这样

ChatGPT、Claude、Gemini、DeepSeek……这些大模型的训练数据来自：

维基百科、网页、新闻、论文、书籍；
GitHub 公开代码；
部分公开的对话语料。

它们的训练数据里，没有"小赵公司的内部方案"——这是物理事实，不是技术问题。

哪怕是 GPT-100、Claude-50，也永远不可能知道你公司的内部方案——因为这些方案根本没出现在它的训练数据里。

这就是 RAG 存在的根本原因——把"AI 不可能知道的事"，告诉它。

一句话总结：AI 的"通用聪明"和"懂你的事"是两件完全不同的事。前者靠模型，后者靠 RAG。

2.3 痛点二：AI 会一本正经地"胡说八道"

故事：写论文的研究生小钱

小钱在读硕士第二年，要写一篇关于"中国新能源车出海现状"的综述论文。

她打开 ChatGPT，问：

"请帮我列出 2024-2025 年关于中国新能源车出海的 5 篇核心学术论文，包括标题、作者、期刊、发表时间、核心观点。"

ChatGPT 给了她一份漂亮的列表：

《中国新能源汽车出海战略研究》，张明等，《管理世界》，2024(7)，提出"三步走"战略……

《BYD 在欧洲市场的渠道下沉路径》，李华等，《国际贸易问题》，2024(12)，认为渠道是核心壁垒……

《中欧电动车贸易摩擦的政策应对》，王刚等，《国际经贸探索》，2025(3)，建议建立预警机制…… ……

5 篇论文，每一篇看起来都像是"真的"——有标题、有作者、有期刊、有期号、有页码。

小钱兴奋地把这 5 篇加到论文参考文献里，准备引用。

她导师审稿时，当场把论文摔在桌子上：

"钱同学，你这 5 篇参考文献，我去知网、维普、中国学术期刊网，一篇都查不到。你是不是用 ChatGPT 编的？"

小钱后背发凉。

她回去查证——果然，5 篇论文里 4 篇是 ChatGPT 编的。作者名是真的（这些教授确实存在），期刊是真的（《管理世界》确实是核心期刊），但**"这两个东西的组合"是 ChatGPT 自己拼凑出来的——根本没这篇论文**。

这种情况在 AI 圈有个专门的词，叫 Hallucination（幻觉）——AI 在不知道答案的时候，会"编"一个看起来很真实的答案。

更要命的是：它编的时候非常自信，不会主动告诉你"我猜的"，反而会说得言之凿凿。

加上 RAG 之后

小钱跑了一个简单的 RAG——把"中国知网"的论文检索 API 接进去，让 AI 回答时只能引用知识库里真实存在的论文。

她再问同样的问题。

这一次 AI 给她的列表里，每一篇都标了知网的 DOI 链接。点进去，每一篇都真实存在。

她又问："给我列 30 篇。"

AI 这次说：

"知识库里关于这个主题的核心论文目前只有 18 篇。是否需要我列出全部 18 篇？"

它不会再编了。它知道就是知道，不知道就说不知道。

为什么会这样

大模型本质上是一个"猜下一个字"的程序（这一点在我们《AI 橙皮书》第一章里讲过）。

它不知道"什么是真什么是假"，它只知道"在这种语境下，下一个字最像什么"。

所以当你问"请列出 5 篇论文"——

它的训练数据里，"列出 X 篇论文"后面通常跟着 像论文标题 的字符串；
它就开始生成一些"看起来像论文标题"的字符串；
它不知道这些"标题"是不是真存在；
它也没法去知网查证。

它在做的事情，是"模仿一个像样的回答"，而不是"找一个真实的答案"。

只要它的"训练里没读过具体的事实"，它就会用编造来填补。

而 RAG 的设计哲学就是：

不要让 AI 自己想。让它从"已经存在的资料里"找答案。找不到就老实说找不到。

一句话总结：AI 编出来的答案像真的，是因为它的工作就是"让答案像真的"。RAG 强迫它"找出处"，编不下去就说不知道。

2.4 痛点三：AI 不知道"最近的事"

故事：做投资的孙阿姨

孙阿姨 56 岁，退休前是一家国企的财务，现在自己在家炒股。

2026 年 4 月某天，她打开 ChatGPT，问：

"请帮我分析一下宁德时代最近一个季度的财务表现，还有最近一个月有什么重大新闻。"

ChatGPT 说：

"宁德时代是中国领先的动力电池生产商。根据 2024 年第三季度财报，公司实现营收 XX 亿元，同比增长 XX%……（巴拉巴拉一大堆）"

孙阿姨愣住了——今天是 2026 年 4 月，怎么 ChatGPT 给的还是 2024 年第三季度的数据？

她追问："最新的一个季度的财报呢？"

ChatGPT 说：

"我的训练数据截至 2024 年 X 月，无法提供之后的财报数据。建议您查阅公司官网或巨潮资讯网。"

孙阿姨翻了一个白眼。

她想看的就是"最近"啊。如果要她自己去巨潮资讯网翻，那她要 ChatGPT 干什么？

加上 RAG 之后

孙阿姨用了一个内置了"实时财经数据"的 AI 工具（比如 ima、文心一言、豆包都有类似的"实时检索"功能，本质上就是一种 RAG）。

她再问：

"请帮我分析一下宁德时代最近一个季度的财务表现，还有最近一个月有什么重大新闻。"

AI 这次给她：

2025 年第四季度财报数据（2026 年 3 月刚发布）；
2026 年 4 月的 5 条重大新闻（带原文链接）；
一份基于这些数据的"快速分析"。

每一条数据都有出处。每一条新闻都点得开。

孙阿姨满意了。

为什么会这样

大模型有一个"知识截止日期"（Knowledge Cutoff）——就是它训练时读到的最新数据是哪天。

模型	当前（2026-04）的训练截止时间
GPT-5	2025 年 10 月
Claude 4	2025 年 12 月
Gemini 3	2025 年 11 月
DeepSeek V3	2025 年 6 月
文心 5	2025 年 9 月
通义 3	2025 年 8 月

这意味着：今天发生的所有事，AI 的"内置大脑"完全不知道。

它要么不回答（正常情况），要么瞎回答（糟糕情况）。

而 RAG 是怎么解决的？

它把实时检索（如 Bing 搜索、Google 搜索、企业内网搜索）接进 AI——AI 答题前先"实时翻一下"互联网或数据库。

这种"实时 RAG"是 2026 年所有主流 AI 助手的标配——

ChatGPT 的"Browse with Bing"；
Claude 的"Web Search"；
Gemini 的"Google Search Grounding"；
文心、通义、豆包、Kimi 的"联网搜索"开关；
ima 的"实时网页"。

它们本质上都是 "实时网页 RAG"：把"今天的新闻"当成知识库来检索。

一句话总结：AI 的内置大脑停在去年某天。要让它知道"今天的事"，必须给它接一个"实时检索"——这也是 RAG。

2.5 痛点四：AI 不会"算"你的私有数据

故事：做电商的周老板

周老板开了一家淘宝店，主营宠物用品。

2026 年 4 月，他想做季度复盘——他下载了 Q1（1-3 月）的所有订单数据，一个 Excel，8 万多行。

他打开 ChatGPT，把 Excel 拖了进去，问：

"请帮我分析这份订单数据，告诉我：

Q1 哪个 SKU 卖得最好？

客单价最高的 10 个客户是谁？

退货率最高的 SKU 是哪个？

复购率最高的客户类型是什么？

周末和工作日的销售差异有多大？"

ChatGPT 思考了一会儿，说：

"感谢您提供数据。基于您上传的 Excel 文件分析（请注意：由于文件较大，部分数据可能未完全加载），结果如下……"

它给了一份"分析报告"。

但周老板细看，发现：

"卖得最好的 SKU 是 S001 — 猫粮 5kg 装"——但他根本没有 S001 这个 SKU！
"客单价最高的客户是张三，平均 800 元"——他打开 Excel 一查，张三客单价才 200 元！
"复购率 23%"——他自己算了一下，实际是 17%！

数据全错。

为什么？

因为 ChatGPT 根本就没"看完"那 8 万行——它只随便读了几百行就开始"猜"。

更要命的是它装作看完了。

加上 RAG 和"代码执行"之后

周老板换了一个工具——Code Interpreter（GPT 的代码解释器） / Claude 的 Analysis 工具 / 通义的"高级数据分析"，这些工具的本质是 "用 RAG + 代码执行"组合处理大数据。

他再上传同样的 Excel，问同样的 5 个问题。

这次 AI 不再"假装看完"，而是：

第一步：写一段 Python 代码，用 pandas 读 Excel；
第二步：运行代码，统计每个 SKU 的销售额；
第三步：把统计结果（真实数据）作为答案；
第四步：附上代码，让你自己也能复算。

每个问题的答案都对得上。

为什么会这样

大模型在"看大段文本"和"算大段数据"上的能力是完全不一样的。

看文本：它擅长（这是它的本职工作）；
算数据：它很差（它本质上是个"猜下一个字"的程序，不是"算下一个数"的程序）。

所以当你直接把一个 8 万行的 Excel 丢给它，它会：

"读"前几百行；
"猜"剩下的；
"编"一个看起来合理的统计结果。

要让 AI 真的"算对"你的私有数据，正确的方式是：

把大段数据存到一个数据库或表格里（你的"知识库"）；
让 AI 写代码去查询数据库（而不是自己心算）；
数据库返回真实结果，AI 基于真实结果作答。

这套组合，就叫 Text-to-SQL RAG / Tabular RAG。

它是 RAG 的一种特化形式——专门给"表格数据"用的 RAG。

一句话总结：AI 自己心算大数据 = 编结果。让 AI 写代码查数据库 = 真结果。后者就是 RAG 的另一种形态。

2.6 痛点五：AI 不会"读"你的扫描件 / 图片 / 视频

故事：要打官司的吴律师

吴律师在帮一个客户打劳动仲裁。

客户提供了 100 多张证据：

30 张"工资条"——是公司打印出来又签字的纸质件，扫成了 PDF；
20 张"考勤记录"——是公司打卡机导出的 PDF（带表格）；
50 张"微信聊天截图"——是 PNG 图片；
5 段"录音"——是 .m4a 文件，每段 30 分钟。

吴律师打开 ChatGPT 4o（号称"多模态"，能看图），把第一张工资条扔进去：

"请帮我提取这张工资条上的所有数据，包括基本工资、绩效、社保、个税、实发金额。"

ChatGPT 看了一眼，说：

"我看到这是一张工资条，包含基本工资、绩效奖金等项目。具体金额请您查阅图片确认。"

它没读出具体金额。它只是"看见了图片，描述了一下表面结构"。

吴律师试了 3 张，全是这种"看是看见了，但读不出数据"的回答。

他绝望地问 ChatGPT："你不是号称能看图吗？为什么读不出工资条上的数字？"

ChatGPT 说："为了保护用户隐私，我不直接读取财务凭证上的具体金额，建议您手动输入。"

——纯粹推卸责任的话。实际上是"它真读不出来"。

加上专业 RAG 之后

吴律师换了一套带 OCR（光学字符识别）的 RAG 系统——比如 MinerU + Cherry Studio，或者直接用 NotebookLM（自带 OCR）。

他把 30 张工资条全部上传。

工具自动：

OCR 识别：把图片里的文字转成可搜索的文本；
表格识别：把工资条的表格结构识别出来；
切片建索引：每张工资条作为一个文档片段；
向量化：把文本转成向量存入数据库。

3 分钟后，他问：

"请把过去 30 个月的实发工资列成表格，并指出哪个月扣了五险一金、哪个月没扣。"

工具给他一份完整的表格——每一行都标着引用自第几张工资条。

他对着客户原件复核，100% 正确。

后来他对录音做了同样的事——用一个带"语音转文字 + RAG"的工具（如 Notta、飞书妙记 + 上传 NotebookLM），把 5 段录音转成文字，再问"对方在录音里有没有承认强制加班"。

工具引用了第 3 段录音 14:32 的原话："我们这周末必须来加班，不来扣绩效。"

吴律师赢了官司。

为什么会这样

大模型的"多模态"能力分两种：

图片描述能力：能"看见"图，描述大致内容（这个 GPT-4o、Claude 4、Gemini 3 都很强）；
图片精确读取能力（OCR）：能精确读取图上的每一个字符（这个通用大模型很弱）。

为什么 ChatGPT 读工资条会拒绝？因为：

它的多模态训练侧重"自然图片描述"（猫狗、风景、艺术品）；
它对结构化文档（工资条、表格、扫描件）的精确识别能力远不如专业 OCR；
它"读不准"的时候，会本能地说"建议您手动输入"——其实是 "我读不出来，但又不能直接说我不行"。

而 RAG 的解决方案是：

用专业的 OCR 工具（PaddleOCR、Tesseract、MinerU、TextIn）先把图片"翻译"成文本；
把文本喂进 RAG；
大模型就能精准回答。

这一类"先 OCR 再 RAG"的工具，2026 年已经非常成熟。NotebookLM、ima、Cherry Studio、AnythingLLM 全部内置了高质量 OCR——你不用自己装，拖文件就能用。

一句话总结：通用大模型"看图"≠"读图"。要让 AI 真正读懂扫描件、图片、视频，必须经过 OCR / ASR 把它们变成文字，再让 RAG 接管。

2.7 5 大痛点的本质——AI 的"五个先天缺陷"

我们把这 5 个痛点放在一张表里，你会看到一个清晰的图景：

痛点	AI 的先天缺陷	RAG 是怎么补的
1. 不知道"你的事"	训练数据里没有你的私人/公司资料	把你的资料挂载成"外部知识源"
2. 一本正经胡说	不知道答案时会"编"，且很自信	强制基于"找到的资料"回答，没找到就承认
3. 不知道"最近的事"	训练有截止日期	实时检索网页 / 数据库
4. 算不对私有数据	不会精确数值计算	让 AI 写代码查数据库
5. 读不懂扫描件	OCR / ASR 能力弱	先用专业工具识别再 RAG

这 5 个缺陷不是哪个模型独有的，是所有大语言模型的共性。

GPT-5、Claude 4、Gemini 3、DeepSeek V3、文心 5、通义 3、豆包 1.6——全部都有。

它们之间只是"程度"差别——比如 Claude 4 的幻觉比 GPT-5 少一些，但都还会有。

要彻底解决，必须靠 RAG。

2.8 一个反例：什么时候你不需要 RAG

为了避免你"过度推销 RAG"，我们也讲一个反例——

当你只是想"通用聊天"时，你不需要 RAG。

具体来说：

"今天写一首关于春天的诗" → 不需要 RAG（这是创作题）；
"帮我把这段话翻译成英文" → 不需要 RAG（这是通用能力）；
"Python 的 for 循环怎么写" → 不需要 RAG（这是公开知识）；
"推荐一些好看的科幻电影" → 不需要 RAG（这是泛化推荐）；
"今天天气怎么样" → 不需要 RAG（这是实时检索，不是知识库）。

什么时候需要 RAG？

当你的问题答案"必须基于某份特定资料"时，就需要 RAG。

"帮我对照公司去年的合同模板写新合同" → 需要 RAG；
"我妈这次复查血糖比上次高吗" → 需要 RAG；
"我们 Q1 哪个 SKU 卖得最好" → 需要 RAG；
"我的客户上次邮件说什么" → 需要 RAG；
"给我列出这本书第三章的核心观点" → 需要 RAG。

判断标准很简单——问"如果不给资料，AI 能不能答对？"，答不对的就需要 RAG。

2.9 RAG 还能解决的"隐藏痛点"

除了上面 5 个最显眼的痛点，RAG 还能顺手解决一些很多人没意识到的"隐藏痛点"。

隐藏痛点 1：每次都要"重新告诉 AI 我是谁"

不用 RAG 的时候——你每次开新对话，都要从头介绍：

"我是一家做医疗器械销售的，公司主营 B2B 业务，主要客户是 X 类医院……"

用 RAG——你把"公司介绍.md"放进知识库，所有对话都自动调用。AI 一上来就知道你是谁。

隐藏痛点 2：长对话窗口里 AI 会"忘"

不用 RAG 的时候——一个对话超过 50 轮，AI 就开始忘记前面的内容。

用 RAG——把"重要信息"沉淀到知识库，AI 永远能查到，永远不会忘。

隐藏痛点 3：换模型就得"重新教一次"

不用 RAG 的时候——你今天用 GPT-5，明天换 Claude 4，所有对你的"了解"都没了。

用 RAG——知识库与模型解耦，换模型不影响知识库。今天 GPT，明天 Claude，知识库还是那个知识库。

隐藏痛点 4：没法多人共享"AI 对我的理解"

不用 RAG 的时候——你和 AI 的对话历史只有你能看到。

用 RAG——团队共享一个知识库，全公司的 AI 都基于同一个"事实库"回答。客服小赵和小钱回答"押金能退吗"用的是同一个 SOP。

隐藏痛点 5：AI 给的建议不会"随你成长"

不用 RAG 的时候——AI 永远给"通用建议"，因为它不知道你过去做过什么、效果如何。

用 RAG——把你过去 3 年的"决策日志"丢进去，AI 能给"贴着你的经验"的建议——它知道你做 A 类决策的成功率、做 B 类决策时常踩什么坑。

2.10 一个有点扎心的真相

讲完 5 个痛点 + 5 个隐藏痛点，我们说一句可能让人难以接受的真相：

2024-2025 年，绝大多数普通人对 AI 的失望，本质上不是因为"AI 太傻"，而是因为"用法不对"。

具体来说——

你失望"AI 不懂你的事"，是因为你没给它你的事；
你失望"AI 在编"，是因为你没强迫它基于资料答；
你失望"AI 不知道最新消息"，是因为你没开它的联网检索；
你失望"AI 算不对数据"，是因为你没让它用代码工具；
你失望"AI 读不懂扫描件"，是因为你没让它先 OCR。

所有这些，本质上都是"你没用 RAG"。

学会 RAG 之后，你会重新认识 AI——你会发现它一直可以"很懂你"，只是过去没人告诉你怎么"教它"。

2.11 本章一图回顾

flowchart TB
    AI[大模型自己]
    AI --> P1[痛点1: 不知道你的事]
    AI --> P2[痛点2: 不知道就编]
    AI --> P3[痛点3: 不知道近期事]
    AI --> P4[痛点4: 算不对私有数据]
    AI --> P5[痛点5: 读不懂扫描件]

    R[RAG 知识库]
    R --> S1[挂外部资料]
    R --> S2[强制基于资料答]
    R --> S3[实时检索网页]
    R --> S4[让 AI 写代码查数据库]
    R --> S5[OCR/ASR 后接管]

    P1 -.补.-> S1
    P2 -.补.-> S2
    P3 -.补.-> S3
    P4 -.补.-> S4
    P5 -.补.-> S5

记住三句话：

AI 的 5 大缺陷是"先天的"——再聪明的模型也有；
RAG 是这 5 大缺陷的"统一解药"——它不是优化模型，而是补上模型的盲区；
不用 RAG 的 AI 有 80% 的潜力是浪费的。

2.12 下一章预告

知道了"为什么需要 RAG"，下一章我们就要讲"它到底是怎么工作的"。

下一章我们会用一个贯穿全程的"图书馆比喻"——从"切书签"到"建索引"到"听问题"到"抽相关页"——5 分钟让你彻底看懂 RAG 的内部流程，零数学讲清 chunk / embedding / 向量库 / Top-K / 重排序这 5 个核心概念。

读完下一章，你就能理解市面上几乎所有 RAG 工具的"工作原理"——再也不会被任何术语吓到。

第二章 没有知识库的 AI 有多"瘸"——5 个真实痛点

2.1 为什么我们要先讲"AI 不行的时候"

2.2 痛点一：AI 完全不知道"你的事"

故事：刚换工作的小赵

加上 RAG 之后

为什么会这样

2.3 痛点二：AI 会一本正经地"胡说八道"

故事：写论文的研究生小钱

加上 RAG 之后

为什么会这样

2.4 痛点三：AI 不知道"最近的事"

故事：做投资的孙阿姨

加上 RAG 之后

为什么会这样

2.5 痛点四：AI 不会"算"你的私有数据

故事：做电商的周老板

加上 RAG 和"代码执行"之后

为什么会这样

2.6 痛点五：AI 不会"读"你的扫描件 / 图片 / 视频

故事：要打官司的吴律师

加上专业 RAG 之后

为什么会这样

2.7 5 大痛点的本质——AI 的"五个先天缺陷"

2.8 一个反例：什么时候你不需要 RAG

2.9 RAG 还能解决的"隐藏痛点"

隐藏痛点 1：每次都要"重新告诉 AI 我是谁"

隐藏痛点 2：长对话窗口里 AI 会"忘"

隐藏痛点 3：换模型就得"重新教一次"

隐藏痛点 4：没法多人共享"AI 对我的理解"

隐藏痛点 5：AI 给的建议不会"随你成长"

2.10 一个有点扎心的真相

2.11 本章一图回顾

2.12 下一章预告

第二章没有知识库的 AI 有多"瘸"——5 个真实痛点