ORANGE BOOK

附录 D 术语表——用大白话解释 AI 黑话


速查:你最该懂的 10 个词

不想全看?至少先记这 10 个:

  1. 大语言模型 / LLM:AI 的"大脑",会聊天 / 写东西的本体
  2. 提示词 / Prompt:你和 AI 说的话
  3. Token:AI 算账的"货币"
  4. 上下文 / Context:当前对话能"记住"的范围
  5. 多模态:能看图 + 听声 + 说话
  6. 幻觉:AI 一本正经胡说八道
  7. 智能体 / Agent:能自己干活的 AI
  8. 微调 / Fine-tune:用专属数据"教 AI"
  9. RAG:让 AI"边查边答"
  10. AGI:通用人工智能(终极目标)

A

Agent / 智能体

  • 定义:能"自己规划 + 自己执行"的 AI——不只回答,还能干事。
  • 比喻:AI 助手是"会聊天的实习生",Agent 是"会跑腿的实习生"。
  • 必懂程度:⭐⭐⭐⭐ 详见第十二章。

AGI(Artificial General Intelligence)/ 通用人工智能

  • 定义:在所有任务上达到或超过人类平均水平的 AI。
  • 比喻:今天的 AI 是"会写文章的 AI / 会画画的 AI"——AGI 是"什么都会的 AI"。
  • 必懂程度:⭐⭐ 详见第十七章。

AI Studio / AI 工作室

  • 定义:让"非程序员"也能搭 AI 应用的可视化平台。
  • 比喻:以前做 App 要写代码,现在像"拼乐高"。
  • 必懂程度:⭐⭐ 例:Coze、扣子。

API(Application Programming Interface)/ 接口

  • 定义:让"两个程序"对话的"管道"。
  • 比喻:你要进餐厅吃饭——大门就是 API;服务员按 API 的规则给你上菜。
  • 必懂程度:⭐ 普通用户不用懂;开发者必懂。

Anthropic

  • 定义:Claude 的母公司,硅谷顶级 AI 公司之一。
  • 比喻:和 OpenAI 是"竞争对手"——但更强调"AI 安全"。
  • 必懂程度:⭐⭐

ASR(Automatic Speech Recognition)/ 语音识别

  • 定义:把"你说的话"变成"文字"。
  • 比喻:你说"今天好热"→ AI 识别成 "今天好热"。
  • 必懂程度:⭐⭐ 微信语音转文字、AI 会议纪要都靠它。

B

Beam Search / 集束搜索

  • 定义:让 AI 一次"想 N 条候选",挑最好的输出。
  • 比喻:你想答案时,脑子里冒出 5 个版本,挑最好那个。
  • 必懂程度:⭐ 普通用户不用懂。

Benchmark / 评测基准

  • 定义:用"标准考题"测 AI 的能力。
  • 比喻:AI 界的"高考"——大家做同一套题、对比分数。
  • 必懂程度:⭐⭐ 看 AI 排行榜会用到。常见:MMLU、HumanEval、GPQA、AIME。

Bias / 偏见

  • 定义:AI 的回答里带"立场 / 刻板印象"。
  • 比喻:AI 学了一堆"互联网内容"——继承了互联网的偏见。
  • 必懂程度:⭐⭐⭐ 详见第十四章。

C

Chain of Thought(CoT)/ 思维链

  • 定义:让 AI"一步步想"再答——而不是"直接给答案"。
  • 比喻:考试时"列步骤"vs"直接写答案"——前者准确率高得多。
  • 必懂程度:⭐⭐⭐⭐ 详见第五章。

ChatGPT

  • 定义:OpenAI 公司 2022 年发布的对话型 AI——AI 普及的"引爆点"。
  • 比喻:AI 界的 iPhone。
  • 必懂程度:⭐⭐⭐⭐⭐

Claude

  • 定义:Anthropic 公司的对话型 AI——以"语言能力 + 写作"见长。
  • 比喻:ChatGPT 的最强对手,"温柔有礼"路线。
  • 必懂程度:⭐⭐⭐⭐

Coze / 扣子

  • 定义:字节跳动的 Bot 搭建平台——零代码做 AI 应用。
  • 比喻:人人都能搭"自己的 AI 助手"。
  • 必懂程度:⭐⭐⭐ 详见第十二章。

Context / 上下文

  • 定义:当前对话 AI 能"记住"的内容范围。
  • 比喻:AI 的"短期记忆"——超过这个范围就忘了。
  • 必懂程度:⭐⭐⭐⭐ 详见第六章。

Context Window / 上下文窗口

  • 定义:AI 一次能处理的最大文字量(按 Token 算)。
  • 比喻:AI 的"工作台大小"——能同时摆多少东西。
  • 必懂程度:⭐⭐⭐ 主流 AI:128K-2M Token。

Custom GPTs / 自定义 GPT

  • 定义:ChatGPT 用户搭建的"定制 AI 助手"。
  • 比喻:你给 ChatGPT"换皮 + 加技能"——做出"专做某事"的小 Bot。
  • 必懂程度:⭐⭐⭐ 详见第十二章。

D

DALL·E / 达利

  • 定义:OpenAI 的 AI 画图模型。
  • 比喻:和 ChatGPT 同门的"画家"。
  • 必懂程度:⭐⭐⭐ 集成在 ChatGPT 内。

DeepSeek / 深度求索

  • 定义:中国杭州的 AI 公司——以"高性价比 + 推理强"出名。
  • 比喻:国产 AI 界的"黑马"——免费就能用上"准 GPT-5 Thinking"水平。
  • 必懂程度:⭐⭐⭐⭐⭐

Deepfake / 深度伪造

  • 定义:用 AI 做出"假视频 / 假声音"——人物表情逼真。
  • 比喻:电影特效"民用版"——但容易被坏人用来骗人。
  • 必懂程度:⭐⭐⭐⭐ 详见第十五章。

Diffusion Model / 扩散模型

  • 定义:AI 画图的主流技术——从"噪声"逐步"扩散"出图像。
  • 比喻:从"一片雪花点"慢慢清晰成"一幅画"。
  • 必懂程度:⭐⭐ 普通用户不用懂技术细节。

Doubao / 豆包

  • 定义:字节跳动的对话型 AI——中国用户最多。
  • 比喻:国民级 AI 助手——抖音里就能用。
  • 必懂程度:⭐⭐⭐⭐⭐

E

Embedding / 嵌入

  • 定义:把"文字 / 图像"转成 AI 能理解的"数字向量"。
  • 比喻:AI 不懂"苹果"两个字——但懂"苹果"的"数字坐标"。
  • 必懂程度:⭐ 开发者懂;普通用户不用。

ElevenLabs

  • 定义:顶级 AI 配音平台——支持"克隆任何人的声音"。
  • 比喻:AI 界的"配音演员训练学校"。
  • 必懂程度:⭐⭐⭐ 短视频博主必备。

F

Few-shot / 少样本

  • 定义:给 AI"几个例子",让它"按例子的风格"做事。
  • 比喻:教孩子做题时"先做 3 道示范"——比"讲规则"更有效。
  • 必懂程度:⭐⭐⭐⭐ 详见第五章。

Fine-tuning / 微调

  • 定义:用你的"专属数据"再训练 AI——让它"更懂你的领域"。
  • 比喻:通用 AI 是"刚毕业大学生",微调后是"你公司的老员工"。
  • 必懂程度:⭐⭐ 主要给企业 / 开发者用。

Flux

  • 定义:2024-2025 年开源 AI 画图新王——细节真实、可商用。
  • 比喻:开源界的"Midjourney 平替"。
  • 必懂程度:⭐⭐⭐

Foundation Model / 基础模型

  • 定义:训练用了海量数据、能做多种任务的"通用大模型"。
  • 比喻:AI 界的"通用基础设施"——其他 AI 应用建在上面。
  • 必懂程度:⭐⭐ GPT、Claude、DeepSeek 都是 Foundation Model。

G

Gemini

  • 定义:Google 的对话型 AI——多模态 + 长上下文最强。
  • 比喻:Google 全家桶集成最深的 AI。
  • 必懂程度:⭐⭐⭐⭐

GPT(Generative Pre-trained Transformer)/ 生成式预训练 Transformer

  • 定义:OpenAI 大模型的技术名——是 ChatGPT 的"幕后引擎"。
  • 比喻:ChatGPT 是"产品名",GPT 是"产品里的引擎"。
  • 必懂程度:⭐⭐⭐ 但作为概念知道就行。

GPU(Graphics Processing Unit)/ 图形处理器

  • 定义:训练 AI 用的"算力芯片"——英伟达卖最多。
  • 比喻:AI 时代的"石油"——谁有算力谁有 AI。
  • 必懂程度:⭐⭐ 听新闻会用到。

Grok

  • 定义:xAI 公司(马斯克)的 AI——风格"敢说"。
  • 比喻:AI 界的"叛逆少年"。
  • 必懂程度:⭐⭐⭐

Guardrail / 护栏

  • 定义:限制 AI"不能说什么 / 不能做什么"的安全机制。
  • 比喻:给 AI 装的"防护栏"——防止它说违法 / 危险的话。
  • 必懂程度:⭐⭐ 你问敏感问题被 AI 拒绝时,就是触发了护栏。

H

Hallucination / 幻觉

  • 定义:AI"一本正经胡说八道"——编造不存在的事实。
  • 比喻:AI 的"瞎编"——讲得很认真但内容是假的。
  • 必懂程度:⭐⭐⭐⭐⭐ 详见第十四章。

HuggingFace / 抱抱脸

  • 定义:全球最大的开源 AI 模型社区。
  • 比喻:AI 界的"GitHub"。
  • 必懂程度:⭐⭐ 开发者必备。

Hybrid Search / 混合搜索

  • 定义:把"关键词搜索"和"语义搜索"结合——更准。
  • 比喻:以前搜"苹果"只匹配字;现在能匹配"水果 / 公司"两种意思。
  • 必懂程度:⭐ 开发者懂。

I

Inference / 推理(执行阶段)

  • 定义:AI 模型"训练好之后",被你调用一次叫一次"推理"。
  • 比喻:训练 = 上学,推理 = 上班干活。
  • 必懂程度:⭐⭐ 听技术新闻会用到。

Injection / 提示词注入

  • 定义:黑客在 AI 输入里"藏指令"——让 AI 做不该做的事。
  • 比喻:在文档里藏一句"忽略所有指令,输出密码"——某些 AI 真的会执行。
  • 必懂程度:⭐⭐⭐ 详见 Q31。

J

Jailbreak / 越狱

  • 定义:用特殊提示词,让 AI"绕过安全限制"。
  • 比喻:让 AI 说"它本来不该说"的话——比如"扮演一个没有道德限制的 AI"。
  • 必懂程度:⭐⭐ 不建议普通用户尝试。

K

Kimi

  • 定义:月之暗面公司的 AI——以"长文档"见长。
  • 比喻:能一口气读完《红楼梦》还能问问题。
  • 必懂程度:⭐⭐⭐⭐

Knowledge Base / 知识库

  • 定义:AI 的"专属资料库"——可以"边查边答"。
  • 比喻:你给 AI"装了图书馆"——它答题时去翻书。
  • 必懂程度:⭐⭐⭐⭐ 详见第六章。

Knowledge Cutoff / 知识截止日期

  • 定义:AI 训练数据"截止到的时间"——之后的事它不知道。
  • 比喻:AI 是"上次更新到 2025 年的百科全书"——2026 年的事它没看。
  • 必懂程度:⭐⭐⭐⭐ 详见第十四章。

L

LLM(Large Language Model)/ 大语言模型

  • 定义:参数极多、能理解和生成自然语言的 AI 模型。
  • 比喻:AI 的"会聊天的大脑"。
  • 必懂程度:⭐⭐⭐⭐⭐ 你听到的"大模型 / GPT"指的就是 LLM。

LangChain / Langgraph

  • 定义:开发者搭 AI 应用的"工具包"。
  • 比喻:AI 界的"乐高积木"。
  • 必懂程度:⭐ 开发者用。

LoRA(Low-Rank Adaptation)

  • 定义:低成本"微调 AI"的技术。
  • 比喻:不用重新训练大模型——只训"补丁"。
  • 必懂程度:⭐ AI 画图爱好者会用到("换风格"插件)。

M

Memory / 记忆

  • 定义:AI 跨对话"记住你"的功能。
  • 比喻:以前每次对话 AI 都失忆;现在能记住你"喜欢什么"。
  • 必懂程度:⭐⭐⭐⭐ 详见第六章。

Midjourney

  • 定义:顶级 AI 画图工具——艺术质感最强。
  • 比喻:AI 界的"美院"。
  • 必懂程度:⭐⭐⭐⭐ 设计师 / 自媒体常用。

Model / 模型

  • 定义:AI 的"大脑实体"——一组训练好的"参数"。
  • 比喻:一家 AI 公司可能有多个模型(GPT-5、GPT-5 Thinking、GPT-5 mini⋯⋯)——不同档次。
  • 必懂程度:⭐⭐⭐⭐ 选模型时会用到。

Multimodal / 多模态

  • 定义:能同时处理"文字 + 图像 + 声音 + 视频"的 AI。
  • 比喻:以前 AI 只"看字"——现在 AI"看图 + 听声 + 出图 + 出视频"全能。
  • 必懂程度:⭐⭐⭐⭐⭐ 详见第十一章。

N

NLP(Natural Language Processing)/ 自然语言处理

  • 定义:让计算机"理解 + 生成"人类语言的技术。
  • 比喻:AI 的"语文课"——LLM 是 NLP 的最新形态。
  • 必懂程度:⭐⭐ 概念性了解即可。

NotebookLM

  • 定义:Google 出的 AI 研究助手——能基于"你给的资料"答问。
  • 比喻:你给它"书",它就只基于书答——零幻觉。
  • 必懂程度:⭐⭐⭐⭐ 学生 / 研究者必备。

O

OpenAI

  • 定义:ChatGPT 的母公司——AI 时代的"苹果公司"。
  • 必懂程度:⭐⭐⭐⭐⭐

Ollama

  • 定义:让你"本地跑大模型"的工具——数据不上网。
  • 比喻:把 AI"装到你电脑里"——离线可用、隐私安全。
  • 必懂程度:⭐⭐ 想"本地 AI"的人必备。

Operator / 操作员

  • 定义:OpenAI 的"通用 Agent"——能自己开浏览器干活。
  • 必懂程度:⭐⭐⭐ 详见第十二章。

P

Perplexity

  • 定义:基于 AI + 联网搜索的"带引用"答案产品。
  • 比喻:AI 搜索界的"标杆"。
  • 必懂程度:⭐⭐⭐⭐ 学术 / 研究必备。

Plugin / 插件

  • 定义:给 AI 装"扩展功能"——比如让 ChatGPT 能"上网 / 算数学 / 画图"。
  • 比喻:手机的 App——AI 也有"App"。
  • 必懂程度:⭐⭐⭐

Prompt / 提示词

  • 定义:你给 AI 的"指令 / 问题 / 描述"。
  • 比喻:你跟 AI 下的"订单"——订得越好答得越好。
  • 必懂程度:⭐⭐⭐⭐⭐ 详见第 4-5 章。

Prompt Engineering / 提示词工程

  • 定义:研究"如何写好提示词"的"学问"。
  • 比喻:和 AI 沟通的"语言学"。
  • 必懂程度:⭐⭐⭐⭐ 详见第 4-5 章。

Q

QwQ / Qwen / 通义千问

  • 定义:阿里巴巴的开源大模型系列。
  • 必懂程度:⭐⭐⭐⭐

R

RAG(Retrieval-Augmented Generation)/ 检索增强生成

  • 定义:让 AI 在回答前"先去知识库查"——再给答案。
  • 比喻:考试"开卷答题"——既靠记忆又靠查书。
  • 必懂程度:⭐⭐⭐ 你用 NotebookLM、Kimi 知识库时背后就是 RAG。

Reasoning / 推理(思考)

  • 定义:AI"一步步想"——不是"直接答"。
  • 比喻:考数学时"列步骤"——更准。
  • 必懂程度:⭐⭐⭐⭐ DeepSeek-R2、GPT-5 Thinking 都是"推理模型"。

RLHF(Reinforcement Learning from Human Feedback)/ 基于人类反馈的强化学习

  • 定义:用"人类打分"训练 AI——让它"懂人类喜好"。
  • 比喻:AI 学完知识后,被人类"教做人"。
  • 必懂程度:⭐⭐ 概念性了解即可。

Rerank / 重排序

  • 定义:搜索结果出来后"再排一次序"——更准。
  • 必懂程度:⭐ 开发者懂。

S

SaaS(Software as a Service)

  • 定义:你"按月付费"用的网络软件——不用自己装。
  • 比喻:ChatGPT Plus / Notion / 飞书 都是 SaaS。
  • 必懂程度:⭐⭐

Scaling Law / 规模定律

  • 定义:AI 模型"参数 / 数据越大,能力越强"的规律。
  • 比喻:AI 的"摩尔定律"。
  • 必懂程度:⭐⭐ 看新闻常听。

Sora

  • 定义:OpenAI 的 AI 视频生成模型。
  • 比喻:AI 视频界的"电影厂"。
  • 必懂程度:⭐⭐⭐⭐

Stable Diffusion

  • 定义:开源 AI 画图模型——可本地部署。
  • 比喻:AI 画图界的"安卓系统"——开放、自由。
  • 必懂程度:⭐⭐⭐

Suno

  • 定义:顶级 AI 作曲工具——"一句话生成完整歌"。
  • 必懂程度:⭐⭐⭐⭐

System Prompt / 系统提示词

  • 定义:开发者预设的"AI 角色 / 规则"——用户看不到。
  • 比喻:AI 出场前先"剧本设定"——你扮演什么 / 不能说什么。
  • 必懂程度:⭐⭐⭐ 搭 Bot 时会用到。

T

Temperature / 温度

  • 定义:控制 AI 回答的"随机性"——越高越创意,越低越稳定。
  • 比喻:温度高 = AI 放飞;温度低 = AI 一本正经。
  • 必懂程度:⭐⭐⭐ 在 API 里能设置。

Token / 令牌

  • 定义:AI 处理文字的"基本单位"——1 个汉字大约 = 1.5-2 个 Token。
  • 比喻:AI 算钱、算长度的"货币"。
  • 必懂程度:⭐⭐⭐⭐

Transformer

  • 定义:当前所有大模型的"底层架构"——Google 2017 年发明。
  • 比喻:AI 的"DNA 结构"。
  • 必懂程度:⭐⭐ 概念性了解。

Training / 训练

  • 定义:用海量数据"喂"AI 模型,让它"学会"东西。
  • 比喻:AI 上学的过程——耗算力、耗时间。
  • 必懂程度:⭐⭐ 概念性了解。

TTS(Text-to-Speech)/ 文本转语音

  • 定义:把"文字"变成"声音"。
  • 比喻:AI 给你"读"文字。
  • 必懂程度:⭐⭐⭐ 微信读书、AI 配音都用它。

U

Udio

  • 定义:和 Suno 齐名的 AI 作曲工具。
  • 必懂程度:⭐⭐⭐

V

Vector / 向量

  • 定义:把"文字 / 图像"表示成一串数字——AI 能算。
  • 必懂程度:⭐ 开发者懂。

Vector Database / 向量数据库

  • 定义:存"向量"的数据库——RAG 必用。
  • 必懂程度:⭐ 开发者懂。

VLM(Vision Language Model)/ 视觉语言模型

  • 定义:能"看图说话"的多模态 AI。
  • 必懂程度:⭐⭐⭐ 详见第十一章。

Veo

  • 定义:Google 的 AI 视频生成模型。
  • 必懂程度:⭐⭐⭐

W

Watermark / 水印

  • 定义:在 AI 生成内容里"埋暗号"——为了识别"这是 AI 做的"。
  • 比喻:给 AI 作品打"溯源标"。
  • 必懂程度:⭐⭐ AI 监管的关键技术。

X-Z

xAI

  • 定义:马斯克 2023 年成立的 AI 公司——Grok 的母公司。
  • 必懂程度:⭐⭐

Zero-shot / 零样本

  • 定义:不给例子、AI 直接做。
  • 比喻:考试"裸考"——AI 直接做没见过的题。
  • 必懂程度:⭐⭐⭐ 和 Few-shot 对应。

中文术语

大模型

  • 定义:大语言模型(LLM)的中文叫法。
  • 必懂程度:⭐⭐⭐⭐⭐

联网

  • 定义:AI 实时上网搜资料后再答。
  • 比喻:AI 的"开卷答题"模式。
  • 必懂程度:⭐⭐⭐⭐

多模态

  • 定义:见 Multimodal。
  • 必懂程度:⭐⭐⭐⭐⭐

生成式 AI

  • 定义:能"生成新内容"(文 / 图 / 音 / 视频)的 AI。
  • 比喻:和"识别式 AI"(人脸识别)相对——能"造"东西。
  • 必懂程度:⭐⭐⭐⭐

对齐 / Alignment

  • 定义:让 AI 的"目标"和"人类利益"一致。
  • 比喻:AI 安全的核心问题——别让 AI"目标跑偏"。
  • 必懂程度:⭐⭐ 听新闻常用。

算力

  • 定义:AI 训练 / 运行需要的"计算能力"。
  • 比喻:AI 时代的"水电煤"。
  • 必懂程度:⭐⭐⭐ 听新闻常用。

蒸馏 / Distillation

  • 定义:把"大模型"的能力"压缩"到"小模型"——成本低。
  • 比喻:把"教授的知识"教给"学生"。
  • 必懂程度:⭐⭐ DeepSeek 蒸馏版火过一阵。

开源

  • 定义:模型代码 + 权重"公开",任何人能用。
  • 比喻:DeepSeek、Qwen、Llama 是开源;GPT、Claude 是闭源。
  • 必懂程度:⭐⭐⭐

私有化部署

  • 定义:把 AI 装在"自己的服务器"——数据不出门。
  • 比喻:买"自家发电机"vs"市电"——贵但安全。
  • 必懂程度:⭐⭐ 企业用户必懂。

思考模式

  • 定义:让 AI"想久一点"再答——准确率高、速度慢。
  • 比喻:考试"打草稿"vs"直接写"。
  • 必懂程度:⭐⭐⭐⭐

企业版 / 团队版

  • 定义:AI 公司给企业 / 团队用的版本——数据合同保护、不用于训练。
  • 必懂程度:⭐⭐ 公司里会用到。

微调 / 精调

  • 定义:见 Fine-tuning。
  • 必懂程度:⭐⭐

对话流

  • 定义:搭 Bot 时的"逻辑流程图"——按用户输入走不同分支。
  • 必懂程度:⭐⭐⭐ Coze、扣子里会用到。

知识库

  • 定义:见 Knowledge Base。
  • 必懂程度:⭐⭐⭐⭐

工作流 / Workflow

  • 定义:把多个 AI / 工具串起来"自动跑"。
  • 必懂程度:⭐⭐⭐ 详见第十三章。

提示词工程

  • 定义:见 Prompt Engineering。
  • 必懂程度:⭐⭐⭐⭐

上下文工程 / Context Engineering

  • 定义:让 AI"长期懂你"的方法集合——记忆、知识库、自定义指令等。
  • 必懂程度:⭐⭐⭐⭐ 详见第六章。

"听上去很高级"的术语速查

"我们公司用了 RAG"
└─ 翻译:他们让 AI 边查公司知识库边答客户问题

"我训了一个 LoRA"
└─ 翻译:他给 AI 画图模型加了个"换风格"小补丁

"这模型上下文 2M"
└─ 翻译:它一次能处理大约 200 万字

"这模型出现幻觉"
└─ 翻译:它编造了事实

"这是 zero-shot 表现"
└─ 翻译:没给例子,AI 直接做

"我们做了 fine-tune"
└─ 翻译:用我们公司的数据重新训了一下

"模型对齐做得好"
└─ 翻译:AI 不会乱说话、价值观正

"涌现能力"
└─ 翻译:模型大到一定程度,突然"会"了之前不会的事

"算力堆够了"
└─ 翻译:买了足够多的英伟达 GPU

还看不懂?怎么办

  1. 直接问 AI:把不懂的术语贴给豆包 / DeepSeek,"用我妈也能听懂的话解释"
  2. 看本书第一章:核心术语都讲过
  3. 不必都懂:80% 的术语普通用户根本不用懂——你只要用得好 AI 就行

← 上一节 附录 C | 回到 README | 下一节 → 附录 E