ORANGE BOOK · RAG

第七章 会问问题的人才能用好知识库——提问技巧


7.1 普通聊天 vs 知识库提问,本质不同

先做个对比:

普通聊天(直接问 ChatGPT)

我:今天天气好吗?
AI:根据你所在的城市,今天天气……

普通聊天里,AI 用"它的全部知识"回答——它可以广泛延展、自由发挥、给开放性建议。

知识库提问(问你的 RAG)

我:王阿姨上次复查血压是多少?
RAG:根据「王阿姨复查病历 P3」(2026-04-15),血压为 142/88 mmHg。

知识库提问里,AI 只能用"你给它的资料"回答。它不能自由发挥、不能延展、不能给"猜测"——只能基于资料

这两种提问方式的"思考方式"完全不同:

维度 普通聊天 知识库提问
答题依据 AI 全部知识 你给的资料
答题自由度 高(可创造) 低(必须有依据)
引用 必须有
不知道时 可以猜 必须说"没找到"
你的提问应该 抛个话题 精准描述要找的内容
失败原因 AI 不够聪明 你问得不够好

最后一行很关键:

知识库提问失败 80% 的原因,不是 AI 不行,是你问得不好。

这一章就是教你"问得好"。


7.2 5 大提问句式

句式 1:检索式(找原文)

"请在【知识库】中找出所有关于【主题】的【段落 / 数据 / 条款】,按【时间 / 重要性 / 类别】排序。"

例子:

请在合同库中找出所有关于"违约金"的条款原文,按签订时间倒序排列。
请在病历库中找出王阿姨过去 3 年的"血压测量结果",列出表格:日期、收缩压、舒张压、医生建议。
请在客户邮件库中找出腾讯的所有邮件,按时间倒序列出每封邮件的主题和核心诉求。

特点:要求 AI"原文找"+"结构化输出"。

适合场景:合同条款、用药记录、客户问询。

句式 2:对比式(找异同)

"请对比【A】和【B】在【某个维度】上的异同,并指出【最显著的差异】。"

例子:

请对比 2023 和 2024 年我们公司给"医院类客户"的合同,在"付款方式"上有什么变化?
请对比王阿姨和李叔叔过去 1 年的体检报告,在"血脂指标"上有哪些不同?
请对比公司"销售部 SOP" 1.0 和 2.0 版本,在"客户回访周期"上的差异。

特点:要求 AI"找两边 + 对比 + 找差异"。

适合场景:版本对比、人员对比、时间对比。

句式 3:归纳式(找规律)

"请基于知识库的所有相关资料,总结【某个事物】的【规律 / 趋势 / 特点 / 模式】。"

例子:

请基于过去 5 年所有合同,总结我们公司给"中小企业客户"的"违约金"约定的常见模式。
请基于王阿姨的所有体检报告,总结她在"血压控制"上的整体趋势,是越来越好还是越来越坏?
请基于过去半年的客户投诉,总结最常见的 5 类投诉,并列出每类的占比。

特点:要求 AI"看全局 + 总结规律"。

适合场景:复盘、趋势分析、用户洞察。

句式 4:决策式(找参考)

"我现在需要做一个决定:【描述决定】。请基于知识库,告诉我【过去类似情况】是怎么处理的,给我一些参考。"

例子:

我们现在要给字节跳动报一个"技术服务合同"的方案。请基于过去给同类大客户(百度、腾讯、阿里)的报价历史,告诉我建议的报价区间和谈判底线。
我妈现在要做一个"心脏支架"的手术。请基于她过去的体检报告 + 用药记录,告诉我术前需要重点关注哪些指标?
我现在要写一篇关于"AI 创业"的文章。请基于我过去写过的 50 篇文章,告诉我我惯用的"开篇 / 论证 / 收尾"模式是什么?

特点:要求 AI"基于历史 + 给当下决策建议"。

适合场景:销售报价、医疗决策、投资决策、创作辅助。

句式 5:探索式(找未知)

"请扫描整个知识库,告诉我我可能【忽略 / 没注意到 / 还没意识到】的【某类信息】。"

例子:

请扫描我妈过去 3 年的体检报告,告诉我可能被忽略但需要关注的指标变化。
请扫描我们公司过去 5 年的会议纪要,告诉我反复出现但一直没解决的"老问题"有哪些?
请扫描过去 1 年我所有的微信聊天记录,找出"我答应过别人但还没做"的事。

特点:要求 AI 主动"挖"——发现你没意识到的信息。

适合场景:复盘自检、风险扫描、隐患发现。

5 句式速查表

句式 关键词 输出形式 典型问题
检索式 找出 / 列出 列表 / 表格 "所有违约金条款"
对比式 对比 / 对照 双栏 / 差异表 "23 和 24 年差异"
归纳式 总结 / 规律 段落 / 要点 "客户投诉规律"
决策式 现在要 / 建议 建议 + 参考 "报价该多少"
探索式 扫描 / 发现 清单 / 警告 "我没注意到的事"

记住这 5 句式,你 80% 的提问都能套进去。


7.3 提问黄金公式:4 要素

不管什么句式,一个好的提问都包含 4 要素:

角色 + 任务 + 输出格式 + 约束

例子拆解

"请你以专业法务(角色)的身份,找出我们公司过去 3 年所有合同中"违约金"超过 30% 的条款(任务),用表格输出,列出合同编号、签订日期、客户、违约金条款原文、引用页码(输出格式),只基于知识库回答,不要额外补充信息,不要使用资料外的法律解释(约束)。"

把这个公式记在脑子里——每次问之前问自己 4 个 W

  • Who(角色)——AI 应该扮演谁?
  • What(任务)——具体干什么?
  • How(输出格式)——以什么形式输出?
  • Limit(约束)——不该做什么?

为什么 4 要素重要

角色

不同角色的回答风格完全不同:

普通问法:违约金条款怎么写?
带角色:你是一位资深法务,违约金条款应该怎么写?

后者会更专业、更严谨。

任务

模糊的任务会得到模糊的答案:

不好:违约金的事
好:找出违约金超过 30% 的条款,并按时间倒序列出

输出格式

不指定格式 AI 会自由发挥:

不指定:违约金条款怎么样?(AI 可能写一段散文)
指定:用表格输出,列:合同编号、违约金、原文。

后者直接可用。

约束

约束让 AI 不跑题、不胡编:

不约束:违约金的事(AI 可能加上"《合同法》第 X 条规定..."等知识库外内容)
带约束:只基于知识库回答,不要使用资料外的法律解释。

后者保证答案 100% 可追溯。


7.4 "先 Plan 后查"两步法

很多人提问的方式是"一句话问完"——指望 AI 一次给完美答案。

这种期望 80% 时候会失望。

更聪明的做法是 "先 Plan 后查"两步法

第一步:让 AI 先"规划"

我现在想搞清楚 X 问题。请你先告诉我:
1. 要回答这个问题,需要从知识库的哪些类型的文档里找?
2. 应该按什么步骤分解这个问题?
3. 有没有什么我没意识到但相关的信息?
请先给我"调查计划",不要急着回答。

第二步:批准计划,让 AI"执行"

你的调查计划很好,请按计划执行,最终给出完整答案。

实战例子

你:我想搞清楚"我们公司过去 5 年违约金条款的演变规律"。请先做调查计划,不要急着回答。

AI:好的,调查计划如下:

  1. 数据范围:从 2021-2025 共 5 年,约 800 份合同;
  2. 筛选条件
    • 包含"违约金"关键词
    • 排除"模板""草稿"
    • 按"客户类型"分组(大企业 / 中小企业 / 政府 / 个人)
  3. 分析维度
    • 按时间:每年的"违约金平均比例""最高比例""最低比例"
    • 按客户:不同客户的差异
    • 按金额:合同金额大小与违约金比例的相关性
  4. 可能补充信息
    • 这 5 年监管对"违约金封顶"的政策变化
  5. 预期输出:5 张图 + 3 段总结 + 1 个建议清单

是否按此计划执行?

你:很好,请执行。

之后你拿到的报告比你直接问要好 10 倍——因为 AI 是"系统化思考"了之后才答的。

为什么这招有效

  • AI 不会一上来就编——它先想清楚再做;
  • 你能在"计划"阶段及时纠偏——"哎,你漏了 X 维度";
  • 答案的覆盖度更全面——避免"只看一个角度就下结论"。

7.5 引用核对 6 步法

RAG 的最大价值之一是"每条都有引用"。

引用不等于一定对。AI 偶尔会"引用错位"——结论是 A,引用却指向 B。

养成"核对引用"的习惯,是用好 RAG 的安全带。

6 步核对法

1. 看引用数量是否合理

  • 一条结论只配一条引用 → 可疑(孤证);
  • 一条结论配 5+ 条引用 → 更可信(多源印证)。

2. 看引用来源是否权威

  • 来自"会议纪要"vs 来自"内部 PPT" → 重要性不同;
  • 来自"最新版"vs 来自"3 年前"→ 时效性不同。

3. 点开引用看原文

最重要的一步:把鼠标点到引用 [1] [2],实际打开原文,对照"AI 的转述"和"原文"是否一致。

90% 的 AI 错误能在这一步被发现。

4. 检查"是不是过度引申"

AI 可能把 A 文档说的"违约金不超过 30%"引申成"我们公司一直主张违约金不超过 30%"——这是过度引申。原文只说一份合同,AI 推广到了"我们公司"。

5. 检查"是不是漏了反例"

AI 找到的"支持结论的引用"可能不全——可能存在"反对的引用"它没看到。

可以追问:

有没有相反的证据?请也列出来。

6. 检查"上下文是否完整"

引用的那一段,前后是不是有"但是""然而""除非"等转折?

AI 可能截取的是"但是"前面那段——丢失了完整意思。

要追问:

请把引用 [1] 的前后 200 字一起给我看。

7.6 多轮追问公式

RAG 的另一个误区是"一问就完"。

优秀的问答是多轮深挖。下面是 5 个经典追问公式:

追问公式 1:要细节

请把 [某条结论] 展开讲,给我具体的数字、日期、人名、引用原文。

追问公式 2:要反例

有没有反过来的情况?请列出与上述结论相反的证据。

追问公式 3:要趋势

按时间维度看,这件事是越来越 [X] 还是越来越 [Y]?请给出每年的数据。

追问公式 4:要建议

基于以上分析,如果我现在要做 [X 决定],你建议怎么处理?请给出 3 个备选方案 + 推荐理由。

追问公式 5:要核对

请把以上结论的"原文出处"全部列出来,我要逐条核对。

把这 5 个公式打印出来贴在显示器上——每次提问完,至少追问 1-2 轮


7.7 让 AI 知道"你不知道"——开放式提问

普通人提问的最大误区是:总假设自己已经知道答案是什么

比如:

"我们公司过去给医院的合同里,违约金都是 30% 吧?"

这种问法是 "诱导式提问"——AI 容易只找支持你假设的证据,忽略反证。

更好的问法是 "开放式提问"

"我们公司过去给医院的合同里,违约金条款的实际情况是怎样的?请客观描述,不要预设结论。"

或者更激进的:

"我以为我们公司给医院的合同违约金都是 30%。请帮我验证这个假设是否正确。如果有反证,请重点指出。"

主动让 AI 帮你"打脸"——这是高手的提问方式。


7.8 拆解大问题——"积木式"提问

复杂的问题不要一次问。拆成小问题,一个一个搞清楚,最后让 AI 总结

例子:写一份"客户跟进报告"

❌ 烂问法:

请帮我写一份对腾讯客户的跟进报告。

AI 一上来就开始"瞎写"。

✓ 好问法(5 步):

第 1 问:列出我们和腾讯过去 1 年的所有交互记录(合同、邮件、会议)。
第 2 问:腾讯过去 1 年提过的所有"诉求"是什么?请按主题归类。
第 3 问:腾讯还没解决的"未决诉求"有哪些?严重性如何?
第 4 问:基于这些信息,腾讯下一阶段最可能的"扩展需求"是什么?
第 5 问:现在请基于以上 4 个回答,写一份完整的跟进报告,结构按"过去-现在-未来"。

最后这份报告远比一次性问出来的好——因为它是"结构化推理"出来的。


7.9 让 AI 帮你"写提问"——元提问

终极懒人技巧——让 AI 帮你写更好的提问

我想从知识库里问 [某个问题]。但我不知道怎么问最好。请你帮我:

1. 把我的问题改写成 5 个不同角度的提问;
2. 告诉我每个角度能挖出什么;
3. 推荐我先问哪一个。

我的原始问题是:{你的模糊问题}

AI 会给你 5 个版本:

你的原始问题:违约金的事

5 个改写:

  1. 检索式:列出过去 5 年所有提到"违约金"的合同条款原文。
  2. 统计式:违约金条款的"金额比例分布"是怎样的?
  3. 对比式:不同客户类型(大企业 vs 中小企业)的违约金有何差异?
  4. 趋势式:违约金条款过去 5 年的变化趋势?
  5. 决策式:我现在要起草新合同,建议违约金怎么定?

推荐先问 1(先看清全貌),再问 4(看趋势),再问 5(拿建议)。

这招让你从"不会问"直接进步到"会问"。


7.10 失败提问的 8 种典型错误

提问失败 90% 是这 8 种之一:

错误 例子 修正
1. 太模糊 "合同的事" "列出所有违约金超过 30% 的合同"
2. 假设错误 "都是 30% 吧" "实际情况怎样?请客观描述"
3. 没指定输出格式 "告诉我" "用表格输出,列:A、B、C"
4. 没限定范围 "所有合同" "2024 年签的、销售部门的合同"
5. 一次问太多 "5 个问题挤一句" "拆成 5 个分别问"
6. 没要引用 (默认接受 AI 的话) "请列出每条结论的原文出处"
7. 没核对引用 (直接用结论) "请把原文 200 字一起给我看"
8. 没追问 (第一答就结束) "有没有反例?请深挖"

7.11 一些高级技巧

7.11.1 给 AI 一个"思考框架"

请用 SWOT 框架分析这家客户,基于知识库里的所有交互记录。
请用 STAR 法(情境-任务-行动-结果)总结这个项目的复盘,基于会议纪要。
请用 5 Why 法分析这次客户流失的根因,基于客服记录。

AI 用框架思考会比"自由发挥"严谨得多。

7.11.2 让 AI 自己评估"答案的置信度"

请回答以下问题,并在结尾标注你的"置信度":

- 高置信度:知识库中有充足、明确、一致的证据。
- 中置信度:有证据但不完整 / 存在矛盾。
- 低置信度:证据稀少 / 推断成分多。
- 拒绝回答:知识库中无相关证据。

我的问题:{问题}

AI 会自评——你能立刻知道"这个答案要不要复核"。

7.11.3 多模型交叉验证

把同一个问题问 GPT-5 + Claude 4 + DeepSeek,对比答案。

如果三个都说一样的——基本可靠。

如果分歧大——回到原文人工核实。

Cherry Studio 等工具支持"一句话一次问多个模型",特别适合这种场景。

7.11.4 让 AI 给"反方观点"

基于知识库,分析这个项目的可行性。先给"支持论据",再给"反对论据",最后给"结论 + 风险提示"。

避免"AI 一边倒"。

7.11.5 用 "If" 句式做假设分析

如果我们把违约金从 30% 降到 20%,基于过去合同的成交规律,可能会带来什么影响?

AI 会基于历史数据做"假设推演"。


7.12 提问也要"复盘"

每次提问完,做 30 秒复盘:

复盘项 问自己
答案对吗? 引用核对了没?
答案全吗? 有没有遗漏?
我学到什么? 哪种问法最有效?
下次怎么改? 模板能不能沉淀?

把"好用的提问"沉淀成你的个人 Prompt 库——下次遇到类似问题直接套。

附录 B 我们提供了 30 个开箱即用的提示词,你可以直接复制。


7.13 团队协作的"问得标准化"

如果你的知识库是团队用的,统一提问格式很重要

举个例子,给客服团队定一个 SOP:

所有客服问 RAG,必须按以下格式:

【场景】用户问的是什么类型问题(产品 / 支付 / 售后 / 投诉)
【证据】用户提供的截图 / 订单号 / 关键词
【需求】用户的具体诉求
【请帮我】
- 找出最相似的 5 个历史案例
- 给出标准回复模板
- 提示我可能踩的坑

这样不同人问出来的提问都规范——RAG 的回答质量也会标准化


7.14 一段"完美提问"长什么样

我们用一个完整例子收尾——一段"5 星级"的提问:

角色:你是一位资深合同分析师。

任务:请基于知识库中"我们公司过去 5 年(2021-2025)的销售合同",分析以下问题:

1. 违约金条款的整体趋势(按年)
2. 不同客户类型(大企业 / 中小企业 / 政府 / 个人)的差异
3. 哪些客户在"违约金封顶"上有特殊条款?请列出
4. 基于以上分析,给我们 2026 年新合同的违约金条款 3 条建议

输出格式:
- 第 1、2 部分:表格 + 简短描述
- 第 3 部分:列表 + 原文引用
- 第 4 部分:编号建议 + 每条建议的依据 + 风险提示

约束:
1. 只基于知识库,不要使用资料外的"通用法律意见"
2. 每条结论必须有引用 [文件名 P页码]
3. 如果某部分证据不足,请明确说"证据不足,结论仅供参考"
4. 输出后请自评每部分的置信度(高/中/低)

把这段背下来——你就是"会问 RAG"的高手。


7.15 本章一图回顾

flowchart TB
    Q[要问问题] --> P1[第一步: Plan 让 AI 先做调查计划]
    P1 --> P2[第二步: 用 5 句式中的一种]
    P2 --> P3[第三步: 4 要素 角色任务格式约束]
    P3 --> P4[第四步: AI 给答案]
    P4 --> P5[第五步: 6 步核对引用]
    P5 --> P6[第六步: 至少追问 1-2 轮]
    P6 --> P7[第七步: 沉淀到个人 Prompt 库]

记住三件事:

  1. 80% 的失败来自"问得不好"——不是 AI 不行;
  2. "先 Plan 后查"是质量翻倍的杀手锏
  3. 核对引用是 RAG 的"安全带"——养成习惯。

7.16 下一章预告

学完了原理、工具、数据、提问,从下一章开始我们就全面进入实战章节

第八、九、十章是 22 个完整的实战案例——从家庭到职场到学习创作,每一个都给你完整的搭建步骤、提问模板、避坑提示,做完直接就能用

我们从"生活场景"开始——爸妈病历助手、家庭账本、育儿百科、家电说明书……让 AI 第一次真正"嵌入"你和家人的日常生活。