会问问题的人才能用好知识库 · RAG 橙皮书

7.1 普通聊天 vs 知识库提问，本质不同

先做个对比：

普通聊天（直接问 ChatGPT）

我：今天天气好吗？
AI：根据你所在的城市，今天天气……

普通聊天里，AI 用"它的全部知识"回答——它可以广泛延展、自由发挥、给开放性建议。

知识库提问（问你的 RAG）

我：王阿姨上次复查血压是多少？
RAG：根据「王阿姨复查病历 P3」（2026-04-15），血压为 142/88 mmHg。

知识库提问里，AI 只能用"你给它的资料"回答。它不能自由发挥、不能延展、不能给"猜测"——只能基于资料。

这两种提问方式的"思考方式"完全不同：

维度	普通聊天	知识库提问
答题依据	AI 全部知识	你给的资料
答题自由度	高（可创造）	低（必须有依据）
引用	无	必须有
不知道时	可以猜	必须说"没找到"
你的提问应该	抛个话题	精准描述要找的内容
失败原因	AI 不够聪明	你问得不够好

最后一行很关键：

知识库提问失败 80% 的原因，不是 AI 不行，是你问得不好。

这一章就是教你"问得好"。

7.2 5 大提问句式

句式 1：检索式（找原文）

"请在【知识库】中找出所有关于【主题】的【段落 / 数据 / 条款】，按【时间 / 重要性 / 类别】排序。"

例子：

请在合同库中找出所有关于"违约金"的条款原文，按签订时间倒序排列。

请在病历库中找出王阿姨过去 3 年的"血压测量结果"，列出表格：日期、收缩压、舒张压、医生建议。

请在客户邮件库中找出腾讯的所有邮件，按时间倒序列出每封邮件的主题和核心诉求。

特点：要求 AI"原文找"+"结构化输出"。

适合场景：合同条款、用药记录、客户问询。

句式 2：对比式（找异同）

"请对比【A】和【B】在【某个维度】上的异同，并指出【最显著的差异】。"

例子：

请对比 2023 和 2024 年我们公司给"医院类客户"的合同，在"付款方式"上有什么变化？

请对比王阿姨和李叔叔过去 1 年的体检报告，在"血脂指标"上有哪些不同？

请对比公司"销售部 SOP" 1.0 和 2.0 版本，在"客户回访周期"上的差异。

特点：要求 AI"找两边 + 对比 + 找差异"。

适合场景：版本对比、人员对比、时间对比。

句式 3：归纳式（找规律）

"请基于知识库的所有相关资料，总结【某个事物】的【规律 / 趋势 / 特点 / 模式】。"

例子：

请基于过去 5 年所有合同，总结我们公司给"中小企业客户"的"违约金"约定的常见模式。

请基于王阿姨的所有体检报告，总结她在"血压控制"上的整体趋势，是越来越好还是越来越坏？

请基于过去半年的客户投诉，总结最常见的 5 类投诉，并列出每类的占比。

特点：要求 AI"看全局 + 总结规律"。

适合场景：复盘、趋势分析、用户洞察。

句式 4：决策式（找参考）

"我现在需要做一个决定：【描述决定】。请基于知识库，告诉我【过去类似情况】是怎么处理的，给我一些参考。"

例子：

我们现在要给字节跳动报一个"技术服务合同"的方案。请基于过去给同类大客户（百度、腾讯、阿里）的报价历史，告诉我建议的报价区间和谈判底线。

我妈现在要做一个"心脏支架"的手术。请基于她过去的体检报告 + 用药记录，告诉我术前需要重点关注哪些指标？

我现在要写一篇关于"AI 创业"的文章。请基于我过去写过的 50 篇文章，告诉我我惯用的"开篇 / 论证 / 收尾"模式是什么？

特点：要求 AI"基于历史 + 给当下决策建议"。

适合场景：销售报价、医疗决策、投资决策、创作辅助。

句式 5：探索式（找未知）

"请扫描整个知识库，告诉我我可能【忽略 / 没注意到 / 还没意识到】的【某类信息】。"

例子：

请扫描我妈过去 3 年的体检报告，告诉我可能被忽略但需要关注的指标变化。

请扫描我们公司过去 5 年的会议纪要，告诉我反复出现但一直没解决的"老问题"有哪些？

请扫描过去 1 年我所有的微信聊天记录，找出"我答应过别人但还没做"的事。

特点：要求 AI 主动"挖"——发现你没意识到的信息。

适合场景：复盘自检、风险扫描、隐患发现。

5 句式速查表

句式	关键词	输出形式	典型问题
检索式	找出 / 列出	列表 / 表格	"所有违约金条款"
对比式	对比 / 对照	双栏 / 差异表	"23 和 24 年差异"
归纳式	总结 / 规律	段落 / 要点	"客户投诉规律"
决策式	现在要 / 建议	建议 + 参考	"报价该多少"
探索式	扫描 / 发现	清单 / 警告	"我没注意到的事"

记住这 5 句式，你 80% 的提问都能套进去。

7.3 提问黄金公式：4 要素

不管什么句式，一个好的提问都包含 4 要素：

角色 + 任务 + 输出格式 + 约束

例子拆解

"请你以专业法务（角色）的身份，找出我们公司过去 3 年所有合同中"违约金"超过 30% 的条款（任务），用表格输出，列出合同编号、签订日期、客户、违约金条款原文、引用页码（输出格式），只基于知识库回答，不要额外补充信息，不要使用资料外的法律解释（约束）。"

把这个公式记在脑子里——每次问之前问自己 4 个 W：

Who（角色）——AI 应该扮演谁？
What（任务）——具体干什么？
How（输出格式）——以什么形式输出？
Limit（约束）——不该做什么？

为什么 4 要素重要

角色

不同角色的回答风格完全不同：

普通问法：违约金条款怎么写？
带角色：你是一位资深法务，违约金条款应该怎么写？

后者会更专业、更严谨。

任务

模糊的任务会得到模糊的答案：

不好：违约金的事
好：找出违约金超过 30% 的条款，并按时间倒序列出

输出格式

不指定格式 AI 会自由发挥：

不指定：违约金条款怎么样？（AI 可能写一段散文）
指定：用表格输出，列：合同编号、违约金、原文。

后者直接可用。

约束

约束让 AI 不跑题、不胡编：

不约束：违约金的事（AI 可能加上"《合同法》第 X 条规定..."等知识库外内容）
带约束：只基于知识库回答，不要使用资料外的法律解释。

后者保证答案 100% 可追溯。

7.4 "先 Plan 后查"两步法

很多人提问的方式是"一句话问完"——指望 AI 一次给完美答案。

这种期望 80% 时候会失望。

更聪明的做法是 "先 Plan 后查"两步法：

第一步：让 AI 先"规划"

我现在想搞清楚 X 问题。请你先告诉我：
1. 要回答这个问题，需要从知识库的哪些类型的文档里找？
2. 应该按什么步骤分解这个问题？
3. 有没有什么我没意识到但相关的信息？
请先给我"调查计划"，不要急着回答。

第二步：批准计划，让 AI"执行"

你的调查计划很好，请按计划执行，最终给出完整答案。

实战例子

你：我想搞清楚"我们公司过去 5 年违约金条款的演变规律"。请先做调查计划，不要急着回答。

AI：好的，调查计划如下：

数据范围：从 2021-2025 共 5 年，约 800 份合同；

筛选条件：

包含"违约金"关键词

排除"模板""草稿"

按"客户类型"分组（大企业 / 中小企业 / 政府 / 个人）

分析维度：

按时间：每年的"违约金平均比例""最高比例""最低比例"

按客户：不同客户的差异

按金额：合同金额大小与违约金比例的相关性

可能补充信息：

这 5 年监管对"违约金封顶"的政策变化

预期输出：5 张图 + 3 段总结 + 1 个建议清单

是否按此计划执行？

你：很好，请执行。

之后你拿到的报告比你直接问要好 10 倍——因为 AI 是"系统化思考"了之后才答的。

为什么这招有效

AI 不会一上来就编——它先想清楚再做；
你能在"计划"阶段及时纠偏——"哎，你漏了 X 维度"；
答案的覆盖度更全面——避免"只看一个角度就下结论"。

7.5 引用核对 6 步法

RAG 的最大价值之一是"每条都有引用"。

但引用不等于一定对。AI 偶尔会"引用错位"——结论是 A，引用却指向 B。

养成"核对引用"的习惯，是用好 RAG 的安全带。

6 步核对法

1. 看引用数量是否合理

一条结论只配一条引用 → 可疑（孤证）；
一条结论配 5+ 条引用 → 更可信（多源印证）。

2. 看引用来源是否权威

来自"会议纪要"vs 来自"内部 PPT" → 重要性不同；
来自"最新版"vs 来自"3 年前"→ 时效性不同。

3. 点开引用看原文

最重要的一步：把鼠标点到引用 [1] [2]，实际打开原文，对照"AI 的转述"和"原文"是否一致。

90% 的 AI 错误能在这一步被发现。

4. 检查"是不是过度引申"

AI 可能把 A 文档说的"违约金不超过 30%"引申成"我们公司一直主张违约金不超过 30%"——这是过度引申。原文只说一份合同，AI 推广到了"我们公司"。

5. 检查"是不是漏了反例"

AI 找到的"支持结论的引用"可能不全——可能存在"反对的引用"它没看到。

可以追问：

有没有相反的证据？请也列出来。

6. 检查"上下文是否完整"

引用的那一段，前后是不是有"但是""然而""除非"等转折？

AI 可能截取的是"但是"前面那段——丢失了完整意思。

要追问：

请把引用 [1] 的前后 200 字一起给我看。

7.6 多轮追问公式

RAG 的另一个误区是"一问就完"。

优秀的问答是多轮深挖。下面是 5 个经典追问公式：

追问公式 1：要细节

请把 [某条结论] 展开讲，给我具体的数字、日期、人名、引用原文。

追问公式 2：要反例

有没有反过来的情况？请列出与上述结论相反的证据。

追问公式 3：要趋势

按时间维度看，这件事是越来越 [X] 还是越来越 [Y]？请给出每年的数据。

追问公式 4：要建议

基于以上分析，如果我现在要做 [X 决定]，你建议怎么处理？请给出 3 个备选方案 + 推荐理由。

追问公式 5：要核对

请把以上结论的"原文出处"全部列出来，我要逐条核对。

把这 5 个公式打印出来贴在显示器上——每次提问完，至少追问 1-2 轮。

7.7 让 AI 知道"你不知道"——开放式提问

普通人提问的最大误区是：总假设自己已经知道答案是什么。

比如：

"我们公司过去给医院的合同里，违约金都是 30% 吧？"

这种问法是 "诱导式提问"——AI 容易只找支持你假设的证据，忽略反证。

更好的问法是 "开放式提问"：

"我们公司过去给医院的合同里，违约金条款的实际情况是怎样的？请客观描述，不要预设结论。"

或者更激进的：

"我以为我们公司给医院的合同违约金都是 30%。请帮我验证这个假设是否正确。如果有反证，请重点指出。"

主动让 AI 帮你"打脸"——这是高手的提问方式。

7.8 拆解大问题——"积木式"提问

复杂的问题不要一次问。拆成小问题，一个一个搞清楚，最后让 AI 总结。

例子：写一份"客户跟进报告"

❌ 烂问法：

请帮我写一份对腾讯客户的跟进报告。

AI 一上来就开始"瞎写"。

✓ 好问法（5 步）：

第 1 问：列出我们和腾讯过去 1 年的所有交互记录（合同、邮件、会议）。
第 2 问：腾讯过去 1 年提过的所有"诉求"是什么？请按主题归类。
第 3 问：腾讯还没解决的"未决诉求"有哪些？严重性如何？
第 4 问：基于这些信息，腾讯下一阶段最可能的"扩展需求"是什么？
第 5 问：现在请基于以上 4 个回答，写一份完整的跟进报告，结构按"过去-现在-未来"。

最后这份报告远比一次性问出来的好——因为它是"结构化推理"出来的。

7.9 让 AI 帮你"写提问"——元提问

终极懒人技巧——让 AI 帮你写更好的提问。

我想从知识库里问 [某个问题]。但我不知道怎么问最好。请你帮我：

1. 把我的问题改写成 5 个不同角度的提问；
2. 告诉我每个角度能挖出什么；
3. 推荐我先问哪一个。

我的原始问题是：{你的模糊问题}

AI 会给你 5 个版本：

你的原始问题：违约金的事

5 个改写：

检索式：列出过去 5 年所有提到"违约金"的合同条款原文。

统计式：违约金条款的"金额比例分布"是怎样的？

对比式：不同客户类型（大企业 vs 中小企业）的违约金有何差异？

趋势式：违约金条款过去 5 年的变化趋势？

决策式：我现在要起草新合同，建议违约金怎么定？

推荐先问 1（先看清全貌），再问 4（看趋势），再问 5（拿建议）。

这招让你从"不会问"直接进步到"会问"。

7.10 失败提问的 8 种典型错误

提问失败 90% 是这 8 种之一：

错误	例子	修正
1. 太模糊	"合同的事"	"列出所有违约金超过 30% 的合同"
2. 假设错误	"都是 30% 吧"	"实际情况怎样？请客观描述"
3. 没指定输出格式	"告诉我"	"用表格输出，列：A、B、C"
4. 没限定范围	"所有合同"	"2024 年签的、销售部门的合同"
5. 一次问太多	"5 个问题挤一句"	"拆成 5 个分别问"
6. 没要引用	（默认接受 AI 的话）	"请列出每条结论的原文出处"
7. 没核对引用	（直接用结论）	"请把原文 200 字一起给我看"
8. 没追问	（第一答就结束）	"有没有反例？请深挖"

7.11 一些高级技巧

7.11.1 给 AI 一个"思考框架"

请用 SWOT 框架分析这家客户，基于知识库里的所有交互记录。

请用 STAR 法（情境-任务-行动-结果）总结这个项目的复盘，基于会议纪要。

请用 5 Why 法分析这次客户流失的根因，基于客服记录。

AI 用框架思考会比"自由发挥"严谨得多。

7.11.2 让 AI 自己评估"答案的置信度"

请回答以下问题，并在结尾标注你的"置信度"：

- 高置信度：知识库中有充足、明确、一致的证据。
- 中置信度：有证据但不完整 / 存在矛盾。
- 低置信度：证据稀少 / 推断成分多。
- 拒绝回答：知识库中无相关证据。

我的问题：{问题}

AI 会自评——你能立刻知道"这个答案要不要复核"。

7.11.3 多模型交叉验证

把同一个问题问 GPT-5 + Claude 4 + DeepSeek，对比答案。

如果三个都说一样的——基本可靠。

如果分歧大——回到原文人工核实。

Cherry Studio 等工具支持"一句话一次问多个模型"，特别适合这种场景。

7.11.4 让 AI 给"反方观点"

基于知识库，分析这个项目的可行性。先给"支持论据"，再给"反对论据"，最后给"结论 + 风险提示"。

避免"AI 一边倒"。

7.11.5 用 "If" 句式做假设分析

如果我们把违约金从 30% 降到 20%，基于过去合同的成交规律，可能会带来什么影响？

AI 会基于历史数据做"假设推演"。

7.12 提问也要"复盘"

每次提问完，做 30 秒复盘：

复盘项	问自己
答案对吗？	引用核对了没？
答案全吗？	有没有遗漏？
我学到什么？	哪种问法最有效？
下次怎么改？	模板能不能沉淀？

把"好用的提问"沉淀成你的个人 Prompt 库——下次遇到类似问题直接套。

附录 B 我们提供了 30 个开箱即用的提示词，你可以直接复制。

7.13 团队协作的"问得标准化"

如果你的知识库是团队用的，统一提问格式很重要。

举个例子，给客服团队定一个 SOP：

所有客服问 RAG，必须按以下格式：

【场景】用户问的是什么类型问题（产品 / 支付 / 售后 / 投诉）
【证据】用户提供的截图 / 订单号 / 关键词
【需求】用户的具体诉求
【请帮我】
- 找出最相似的 5 个历史案例
- 给出标准回复模板
- 提示我可能踩的坑

这样不同人问出来的提问都规范——RAG 的回答质量也会标准化。

7.14 一段"完美提问"长什么样

我们用一个完整例子收尾——一段"5 星级"的提问：

角色：你是一位资深合同分析师。

任务：请基于知识库中"我们公司过去 5 年（2021-2025）的销售合同"，分析以下问题：

1. 违约金条款的整体趋势（按年）
2. 不同客户类型（大企业 / 中小企业 / 政府 / 个人）的差异
3. 哪些客户在"违约金封顶"上有特殊条款？请列出
4. 基于以上分析，给我们 2026 年新合同的违约金条款 3 条建议

输出格式：
- 第 1、2 部分：表格 + 简短描述
- 第 3 部分：列表 + 原文引用
- 第 4 部分：编号建议 + 每条建议的依据 + 风险提示

约束：
1. 只基于知识库，不要使用资料外的"通用法律意见"
2. 每条结论必须有引用 [文件名 P页码]
3. 如果某部分证据不足，请明确说"证据不足，结论仅供参考"
4. 输出后请自评每部分的置信度（高/中/低）

把这段背下来——你就是"会问 RAG"的高手。

7.15 本章一图回顾

flowchart TB
    Q[要问问题] --> P1[第一步: Plan 让 AI 先做调查计划]
    P1 --> P2[第二步: 用 5 句式中的一种]
    P2 --> P3[第三步: 4 要素 角色任务格式约束]
    P3 --> P4[第四步: AI 给答案]
    P4 --> P5[第五步: 6 步核对引用]
    P5 --> P6[第六步: 至少追问 1-2 轮]
    P6 --> P7[第七步: 沉淀到个人 Prompt 库]

记住三件事：

80% 的失败来自"问得不好"——不是 AI 不行；
"先 Plan 后查"是质量翻倍的杀手锏；
核对引用是 RAG 的"安全带"——养成习惯。

7.16 下一章预告

学完了原理、工具、数据、提问，从下一章开始我们就全面进入实战章节。

第八、九、十章是 22 个完整的实战案例——从家庭到职场到学习创作，每一个都给你完整的搭建步骤、提问模板、避坑提示，做完直接就能用。

我们从"生活场景"开始——爸妈病历助手、家庭账本、育儿百科、家电说明书……让 AI 第一次真正"嵌入"你和家人的日常生活。