| 项 | 信息 |
|---|---|
| 当前版本 | v1.0.0 |
| 最后更新 | 2026-04-19 |
| 适配工具 | NotebookLM、ima、Google Notebooks、Coze、Dify、Cherry Studio、AnythingLLM、RAGFlow、MaxKB、QAnything 等 2026 年主流方案 |
| 语言 | 简体中文 |
| 许可协议 | CC BY-SA 4.0(署名 + 相同方式共享) |
| 反馈 / 勘误 | 在仓库提 Issue,或邮件至 book@ragbook.community |
如何使用本书:本书允许你免费下载、传播、翻译、改编,但必须署名作者并保持相同协议开源,禁止任何形式的"封装售卖"或"去名转售"。
这本书是写给谁的
- 完全没听过 RAG,但用过 ChatGPT / 豆包 / DeepSeek / Kimi,发现它们"很会聊天,但完全不知道我自己的资料"的人。
- 听过"AI 知识库",被向量数据库、Embedding、Chunking、Reranker、HyDE 这些黑话劝退过的人。
- 每天被 PDF、Word、Excel、微信收藏、Notion 笔记淹没,想"问一句就能找到答案"的上班族。
- 想给爸妈、给伴侣、给小孩配一个"只懂我们家事"的 AI 小助理(家庭账本、病历、菜谱、说明书)的人。
- 销售、客服、市场、HR、法务、财务、行政——想把"重复回答同样的问题"自动化的所有职场人。
- 学生、考研党、考证党、读书人——想把"3000 篇文献 / 200 本笔记 / 全套真题"变成"会问会答的资料库"的人。
- 自媒体、自由职业者、副业玩家——想把自己的素材库、客户案例、写作风格变成"AI 第二大脑"的人。
- 已经在用 Cherry Studio、AnythingLLM、Dify,但只跑通过 Demo、不知道怎么用到生活和工作里的进阶用户。
如果你属于以上任何一类,你来对地方了。
这本书不是什么
- 不是 LangChain、LlamaIndex 的源码导读,也不是 RAG 的学术论文综述。
- 不是面向算法工程师的"高级检索系统架构"。
- 不是堆名词、堆参数、堆截图的"功能罗列"。
- 不是"AI 即将取代你"或"再不学就完蛋了"的焦虑营销。
它是一本实战手册。每一章都让你"打开浏览器跟着做",做完就能立刻看到效果。
为什么是 RAG
2024 年,所有人都在比"哪家大模型聪明"——GPT-4、Claude 3、Gemini 1.5、文心一言、通义千问、DeepSeek…… 2026 年,这一战已经分出了胜负:模型聪不聪明已经不重要了,重要的是它"知不知道你自己的事"。
为什么这么说?
因为再聪明的 AI,如果它不知道:
- 你公司的合同模板长什么样——它写出来的合同不能用;
- 你家小孩对哪种坚果过敏——它给的菜谱可能害人;
- 你客户上一封邮件说了什么——它给的回复像是机器人;
- 你领导上次会议拍板了什么——它写的周报老板看了想骂人;
- 你公司去年同期的销售数据——它给的分析全是编的。
它就只是一个"通用聊天机器人"。
而 RAG(检索增强生成,Retrieval-Augmented Generation),用一句话讲:就是让 AI 在回答你之前先翻一翻你给它的资料,然后基于资料作答。
它的本质就是给一个"读完了全人类公开知识但完全不认识你"的实习生,再额外塞一个"只装着你自己资料"的小书架。
这件事看起来很小,但它是 AI 真正能"嵌入你的生活和工作"的唯一办法。2026 年,几乎所有真正能产生价值的 AI 应用——客服机器人、企业内部 GPT、个人第二大脑、家庭健康助手、考研问答库——本质上都是 RAG。
更重要的是:
- 它免费就能开始——NotebookLM、ima、Coze、Cherry Studio 都有零门槛免费档;
- 它不需要你写代码——拖几个文件就能跑起来;
- 它可以纯本地运行——你的资料一个字都不用上传到云端;
- 它换大模型不需要重学——今天用 DeepSeek,明天换 Claude,知识库不用动。
学会 RAG,是普通人在 2026 年与 AI 共处时性价比最高的一件事——投入 1 个周末,受益至少 3 年。
你将获得什么
读完整本书并跟着做完练习,你会:
- 真正理解 RAG 是什么、和直接问 ChatGPT / 上传 PDF / 微调(Fine-tune) / MCP 的本质差别、它能不能解决你的问题。
- 用 5 分钟在 NotebookLM 里搭出你的第一个知识库,把"3000 份合同里找一句话"从 2 小时缩到 30 秒。
- 看懂 2026 年中外 20+ 主流 RAG 工具(NotebookLM、ima、Coze、Dify、Cherry Studio、AnythingLLM、RAGFlow、MaxKB、QAnything…),知道哪一款最适合你。
- 学会准备好资料——PDF 怎么扫、网页怎么抓、微信收藏怎么导出、视频怎么转录,让"垃圾进垃圾出"变成"金子进金子出"。
- 学会一套提问句式,让 AI 不再"答非所问",每条回答都有"出处可查"。
- 把至少 7 个生活场景 + 8 个工作场景 + 7 个学习创作场景,搬进 RAG。
- 学会把数据"握在自己手里"——用 Cherry Studio + Ollama / AnythingLLM Desktop / Dify 自托管 / RAGFlow 四条路线,搭一个永远不上传云端的私人知识库。
- 知道怎么把 RAG 用得安全:避免 PII 泄露、API Key 被偷、月度账单爆表、过度信任 AI 出错。
- 避开新手最容易踩的 8 大坑(答非所问、引用不准、文档没切好、向量过期……)。
- 如果你愿意,还能把自己的知识库做成产品、做成副业、加入社区。
阅读路径建议
这本书一共 1 个序言 + 12 章正文 + 5 个附录,全书约 25 万字。你不必从头读到尾,下面几条路径任选其一。
路径 A:完全新手(推荐)
按章节顺序从 00 序言 一路读到 12 避坑、安全与从用户到创造者,每章跟着做完再看下一章。预计 1 个周末看完,跑通整套体验。
路径 B:只想立刻用起来
预计 1 小时跑通,先用起来再说。
路径 C:已经会用,想进阶
预计 1 个晚上读完,立刻让生产力翻倍。
路径 D:给爸妈、给团队、给客户挑工具的"决策者"
- 01 RAG 是什么 的"自检清单"
- 04 工具全景图 的"四档对比"
- 08 生活场景实战 的"给爸妈的一键模板"
- 12 避坑、安全与从用户到创造者
路径 E:学生、考研党、内容创作者
完整目录
| 章节 | 你会学到 |
|---|---|
| 00 序言:为什么每个人都需要自己的 AI 知识库 | 张姐 3000 份合同找不到一句话、李哥半夜爬起翻爸妈病例两个真实故事,告诉你 RAG 究竟能改变什么 |
| 第一章 AI 知识库到底是什么(用大白话讲清楚 RAG) | 一句话定义、4 个比喻、与 ChatGPT 直问/长上下文/Fine-tune/MCP 的本质差别、20 件普通人能做的事 |
| 第二章 没有知识库的 AI 有多瘸(5 个真实痛点) | 不知道你的资料、一本正经胡说、不知近期事、不会算公司数据、不会读你的 PDF |
| 第三章 五分钟看懂 RAG 工作原理(图书馆比喻) | 切书签 → 编索引 → 听问题 → 抽相关页 → 写答案;零数学讲清 chunk / embedding / 向量库 / Top-K / 重排序 |
| 第四章 2026 年 AI 知识库工具全景图 | 云端零门槛、低门槛 SaaS、桌面零代码、私有化部署四档共 20+ 款工具详评 |
| 第五章 五分钟搭建你的第一个知识库 | 以 NotebookLM 为主线、ima / Cherry Studio 为备选,端到端跑通"我的合同助手" |
| 第六章 资料是知识库的灵魂(怎么准备数据) | 6 类来源处理(PDF/网页/微信收藏/语音/视频/图片);切片粒度、命名、元数据、清洗 7 步法 |
| 第七章 会问问题的人才能用好知识库(提问技巧) | 知识库提问 ≠ 普通聊天;5 大句式模板;"先 Plan 后查"两步法;引用核对;多轮追问 |
| 第八章 生活场景实战 | 爸妈病历助手、家庭账本、育儿百科、体检报告解读、旅行手册、家电说明书、收藏整理 7 个完整案例 |
| 第九章 工作场景实战 | 销售合同库、客服 FAQ、周报材料库、会议纪要、政策法规问答、内部 SOP、招聘候选人库、项目复盘 8 个案例 |
| 第十章 学习与创作场景实战 | 考证题库、论文文献库、课件笔记、读书卡片、自媒体素材库、写作风格库、灵感卡片箱 7 个案例 |
| 第十一章 本地与私有化部署(4 条路线详细教程) | Cherry Studio + Ollama / AnythingLLM Desktop / Dify 自托管 / RAGFlow 四条详细部署路线 |
| 第十二章 避坑、安全与从用户到创造者 | 10 大坑、4 道安全防线、6 项进阶能力、5 个创业方向、礼物清单与最终一图 |
| 附录 A 50 个常用 RAG 工具速查表 | 5 档 50 款工具的一句话评价 + 用户画像 + 价格速查 |
| 附录 B 30 个开箱即用的知识库提示词 | 10 条 System Prompt + 20 条提问模板,可直接复制粘贴 |
| 附录 C 术语表(用大白话解释 RAG 黑话) | 50+ 个核心术语的"黑话 → 白话"中英对照解释 |
| 附录 D 资源与社区链接 | 100+ 个官方资源、开源项目、中文社区、博主、播客、书单、年度报告 |
| 附录 E 100 项达成清单(7 周计划) | 把全书拆成 100 个可打卡小任务、7 周路线图 |
如何使用这本书
- 先看「30 秒导读」:每一章开头都有一段 30 秒就能读完的导读,告诉你这章在解决什么问题、做完会得到什么。如果不感兴趣,可以直接跳过。
- 跟着「先做这一步」:所有命令、配置、提示词都给了完整可复制版本,建议至少跑通一次,再回头看原理。
- 对照「本章一图回顾」:章末的小结帮你把这章串成一条线,方便日后翻查。
- 遇到报错先翻附录:80% 的常见报错都收录在 第十二章 避坑指南 与 附录 C 术语表 里。
本书使用约定
代码块:可以直接复制到终端、提示词输入框或配置文件里运行的内容。- 「引号」:界面上的按钮、菜单或选项名称。
- 粗体:值得你停下来重点理解的关键词。
- 命令前面的
$表示这是终端里输入的命令,复制时不要带$。 - 出现
~/路径时,~代表你的用户主目录(macOS 是/Users/你的名字/,Windows 是C:\Users\你的名字\)。 - 截图较少,更多依赖文字描述操作路径,方便你在不同工具版本中也能找到对应位置。
本书风格的小约定
- 我们假设你不是程序员,但愿意学一点点新东西。所有名词第一次出现都给"白话解释"。
- 我们不会让你"先理解原理再动手",恰恰相反,我们让你先动手做出一个能跑的东西,再回头讲为什么。
- 我们不会推荐你"先订阅 Pro 再说"。每一章都标注了"用免费档够不够"。
- 我们也不会假装 RAG 没缺点。第十二章会老老实实告诉你它在哪些场景会让你失望。
一句话总结
这本书要做的事情只有一件:让你这个普通人,不靠任何技术背景,也能为自己 / 家人 / 团队搭出一个『只懂自家事』的 AI 顾问——而且越用越好。
准备好了吗?翻开 00 序言 开始吧。
版本与变更
| 版本 | 日期 | 主要变更 |
|---|---|---|
| v1.0.0 | 2026-04-19 | 初版发布:12 章正文 + 5 个附录,覆盖入门到本地部署、从用户到创造者全路径,适配 2026 年主流 RAG 工具生态 |
后续如有新增 / 勘误,会在本表追加,并在每章相关段落加
(v1.x 更新)标注。
通用版工具箱(附录卷)
本书是 RAG(AI 知识库) 的"主题专属指南"。如果你想要一份跨工具、不绑定任何产品的"通用 AI 工具箱"——100 个通用提示词、150+ AI 黑话翻译、30 天通用打卡计划、50 个高频 FAQ、安全红线、家庭 AI 公约——请翻 《AI 橙皮书(附录卷):通用 AI 工具箱》。
它和本书是"互补"的:本书讲 "AI 知识库怎么搭",附录卷讲 "任何 AI 都通用的方法"——换工具不卡壳。
版权与署名
- 本书根据 CC BY-SA 4.0 协议开源,欢迎转载、翻译、改编。
- 转载请注明原书《RAG 橙皮书:上手与进阶指南》及原始仓库地址。
- 改编版本必须保持同一协议开源。
- 商业用途(如纳入付费课程、纸质出版、收费社群)请先联系作者邮箱获取授权。
如果这本书帮到了你,最好的"赞赏"就是把它转发给一位被"AI 不知道我自己事"困扰的朋友——也许下周他就把那 3000 份合同、200 篇笔记、整柜子的体检报告,全部变成"会问会答的私人顾问"。