术语表 · ChatGPT 橙皮书

索引（按字母序 / 拼音序）

序号	术语	一句话定义
01	AI	让机器表现得像"会思考的人"
02	LLM（大语言模型）	"读了几乎全网内容"的超级文本预测机
03	GPT	OpenAI 出品的一系列 LLM
04	ChatGPT	把 GPT 包成"聊天界面"的产品
05	Token	AI 的"字数单位"，1 中文 ≈ 1.5 token
06	上下文（Context）	AI 一次能"看见"的对话长度
07	上下文窗口（Context Window）	这个"看见"能力的容量上限
08	提示词（Prompt）	你输入给 AI 的那段话
09	系统提示词（System Prompt）	给 AI 的"出厂设定"，用户看不见
10	幻觉（Hallucination）	AI 一本正经地胡说
11	思维链（Chain of Thought, CoT）	让 AI"先想再说"，提高正确率
12	微调（Fine-tuning）	在通用模型基础上"再训练"成专家
13	RAG	让 AI"先查资料再回答"的方法
14	多模态（Multimodal）	AI 能看图、听声、读视频
15	Agent / Operator	让 AI 自己"动手做事"
16	API	程序员调用 AI 的接口
17	GPTs	ChatGPT 的"自定义助手"功能
18	嵌入（Embedding）	把"文字"变成"一串数字"的转换
19	向量数据库（Vector DB）	专门存"数字化文字"的数据库
20	Tokenizer（分词器）	把人话切成 token 的小工具
21	训练（Training）	让 AI"看资料学知识"的过程
22	推理（Inference）	AI"输出回答"的过程
23	涌现（Emergence）	模型一变大就"突然学会"新技能
24	对齐（Alignment）	让 AI"听人话"、"守人规矩"
25	RLHF	用"人给反馈"的方式训练 AI
26	Diffusion（扩散模型）	画图 / 视频 AI 的主要技术
27	LoRA	一种"轻量微调"画图模型的方法
28	Open-source（开源）	谁都能下载、改、用的 AI 模型
29	AGI	"通用人工智能"，能干所有人能干的事
30	ASI	"超级人工智能"，比所有人聪明的 AI

详解

01. AI（人工智能 / Artificial Intelligence）

生活类比：让一台机器，做一件原本"得人才能做"的事。详细：从下围棋（AlphaGo）、识别人脸（Face ID）、推荐商品（淘宝）、自动驾驶（特斯拉），到聊天（ChatGPT）、画图、写代码、做视频——这些全部叫 AI。AI 的"种类"很多，ChatGPT 只是其中一种（叫"生成式 AI"）。

02. LLM（大语言模型 / Large Language Model）

生活类比：一个"读完几乎全互联网"的超级文本预测机。给它前半句，它预测下一个最可能的字——预测一万次，就组成了一篇文章。详细：GPT、Claude、Gemini、文心一言、DeepSeek、Llama 全部都是 LLM。"大"指的是参数量（万亿级）和训练数据量（PB 级）。

03. GPT（Generative Pre-trained Transformer）

生活类比：OpenAI 出品的一个"系列产品"。详细：GPT 是 LLM 的一个具体家族，从 GPT-1（2018）到 GPT-5.4（2026），一共 5 代主版本。每一代背后是同一种"Transformer 架构"，但参数和数据越来越大。

04. ChatGPT

生活类比：把 GPT 包了一个"聊天框"，让普通人能用。详细：在 ChatGPT 出现之前，GPT 是给开发者用的。2022 年 11 月 30 日，OpenAI 把 GPT-3.5 加了个聊天界面，5 天破百万、2 个月破亿——人类历史上最快被普及的技术。

05. Token（"字数"单位）

生活类比：AI 的"字数计费单位"。详细：AI 不按"字"计费，按 token 计。

1 个英文单词 ≈ 1.3 token
1 个中文字 ≈ 1.5-2 token
1000 token ≈ 750 个英文单词 / 500 个中文字

为什么重要？模型的"上下文窗口"和"价格"都按 token 算。

06. 上下文（Context）

生活类比：AI 的"短期记忆"。详细：你和 AI 在同一个对话里来回说的所有话，加上你上传的文件，一起塞进它的"短期记忆"。这个记忆是有上限的（看模型）。

07. 上下文窗口（Context Window）

生活类比：AI 的"短期记忆"上限。详细：

GPT-3.5：4K tokens（≈ 3000 字中文）
GPT-4：8K-128K
GPT-5.4：200K
GPT-5.4 Pro：1M tokens（≈ 100 万字，能"读完一本书"）

超过窗口，最早的内容会被"挤出去"。

08. 提示词（Prompt）

生活类比：你交代实习生的那段话。详细：你在对话框输入的内容。提示词写得好不好，直接决定 AI 答得好不好。整本书第四章和第五章在讲这个。

09. 系统提示词（System Prompt）

生活类比：实习生的"岗位说明书"，你看不见但他每秒都在看。详细：开发者可以在每次对话前预先塞一段"内部指令"给模型。比如 ChatGPT 的系统提示词大致是"你是 ChatGPT，遵循 OpenAI 政策……" 用户看不见。做 GPTs 时填的"Instructions"就是系统提示词。

10. 幻觉（Hallucination）

生活类比：实习生为了"显得自己懂"，编了一个看似靠谱的答案。详细：AI 给出的"看起来对、自信地说出来、但其实是错的"内容。所有大模型都会幻觉，差别只在频率。GPT-5.4 比 5.2 少了 33%，但还有。识别幻觉的方法见第十二章。

11. 思维链（Chain of Thought, CoT）

生活类比：让你做数学题前"先在草稿纸上演算"。详细：让 AI 不要直接给答案，先一步步"想"。研究发现，AI"想了再答"比"脱口而出"准确率高 20-50%。GPT-5 之后的"Thinking 模式"就是把思维链做成了产品。

12. 微调（Fine-tuning）

生活类比：通用医学院毕业后，再去专科医院培训 3 年。详细：在一个通用大模型基础上，用特定领域的数据继续训练，让它在那个领域更专业。比如把 GPT 用医疗数据微调成"医疗 GPT"。普通用户不会做微调，开发者才需要。

13. RAG（检索增强生成 / Retrieval-Augmented Generation）

生活类比：让 AI "先查资料再回答"。详细：当 AI 自己的"知识库"不够 / 过时，可以让它先去外部数据库 / 网页搜资料，然后基于查到的内容回答。这就是为什么联网 ChatGPT 比离线版准确得多。

14. 多模态（Multimodal）

生活类比：AI 不只会"听"和"说"，还会"看图"、"看视频"、"听声音"。详细：以前的 AI 只能处理文字（单模态）。现在的 GPT-5.4 是"多模态"——文字 + 图片 + 音频 + 视频，一个模型搞定。这是为什么你可以拍体检报告 / 截图 / 视频丢给它问。

15. Agent / Operator（智能体）

生活类比：从"听话的助理"升级到"自己动手的实习生"。详细：传统 AI 只会"说"，Agent 能"做"——打开浏览器、点鼠标、敲键盘、跨网站操作。GPT-5.4 内置了"原生计算机使用能力"，是这个领域的代表。详见第十一章。

16. API（应用程序接口 / Application Programming Interface）

生活类比：餐厅的"后厨直供窗口"——程序员可以"绕过前厅服务员（聊天界面）"直接点菜。详细：开发者通过 API 调用 ChatGPT，把 AI 集成到自己的 App / 网页 / 自动化流程里。按 token 计费，自由度高，但贵且复杂。普通用户完全用不到。

17. GPTs（自定义助手）

生活类比：在 App Store 上下载"专门做某件事的 App"，但全部是 ChatGPT 做的。详细：你可以不写代码做一个"专属助手"（比如"小红书选题机"），可以自己用、分享给朋友、甚至发到 GPTs 商店赚分成。详见第十一章。

18. 嵌入（Embedding）

生活类比：把"文字"翻译成"一串数字坐标"。详细：AI 不能直接处理文字，它必须把"狗"翻译成 [0.23, -0.91, 0.45, …]（一个 1536 维向量）。"狗"和"猫"的向量很接近，"狗"和"火星"的向量很远。这是 AI 实现"语义搜索"的基础。

19. 向量数据库（Vector DB）

生活类比：专门存"数字化文字"的图书馆。详细：当你把一份 100 万字的资料丢给 AI，它会先把每段话变成 embedding，存进向量数据库。下次你问问题，AI 在向量库里找意思相近的段落，再生成回答。这就是 RAG 的核心。

20. Tokenizer（分词器）

生活类比：把整段中文 / 英文"切片"的小工具。详细：AI 处理文字前，先用 tokenizer 把它切成 token。中文 tokenizer 和英文 tokenizer 不同，所以同样长度文字"中文比英文费 token"。

21. 训练（Training）

生活类比：AI"上学读书"的过程。详细：用海量文本（互联网、书籍、代码、维基）让模型"学会"语言规律。训练一次成本极高——GPT-4 训练成本估计超过 1 亿美元。GPT-5.4 估计 5-10 亿美元。

22. 推理（Inference）

生活类比：AI"上岗工作、回答问题"的过程。详细：训练完成后，AI 每次给你回答叫"推理"。推理也要花钱（电费、显卡），但每次只是几分钱到几毛钱。

23. 涌现（Emergence）

生活类比：你养的猫突然有一天会开门了——你没教过，它自己学会了。详细：研究发现，模型大到一定程度，会"突然"具备小模型完全没有的能力——比如做奥数、写代码、理解暗语。这是大模型最神奇也最让人担忧的地方。

24. 对齐（Alignment）

生活类比：让聪明的小孩"听话、不学坏"。详细：模型本身没有"善恶观"，对齐就是让它符合人类的价值观和安全规范——不伤害用户、不说脏话、不教做坏事。OpenAI、Anthropic、DeepMind 都有专门的"对齐团队"。

25. RLHF（基于人类反馈的强化学习）

生活类比：让小孩做事，做得对你给糖、做得不对你训他——他慢慢就学会了。详细：RLHF 是让 AI"听话"的关键技术。流程：① 模型给出 N 个回答 → ② 人类标注员打分 → ③ 模型根据打分调整 → ④ 重复几百万次。ChatGPT 的"亲切语气"就是这么训出来的。

26. Diffusion（扩散模型）

生活类比：先画一张"全是雪花的电视屏幕"，然后一步步"擦"出一只猫的形状。详细：DALL·E、Stable Diffusion、Midjourney、Sora 全部是扩散模型。它的工作原理：先把"清晰图"变成"完全噪音"（前向扩散），再训练 AI"反过来"从噪音恢复清晰图（反向扩散）。

27. LoRA（Low-Rank Adaptation）

生活类比："给画图 AI 装个插件"，只训练插件、不动主模型。详细：训练一个完整模型很贵，LoRA 是"轻量微调"的方法——只训练几兆字节的小补丁，就能让画图 AI "学会画我的脸"或"模仿宫崎骏风格"。普通用户不会自己训，但会用别人训好的 LoRA。

28. Open-source（开源）

生活类比："菜谱 + 食材清单"全公开，谁都能自己做。详细：开源 AI 模型 = 任何人都能下载、修改、商用的模型。代表：Meta 的 Llama、Mistral、DeepSeek、Qwen。优点：免费、可控、可私有部署；缺点：自己跑要技术门槛 + 显卡。

29. AGI（通用人工智能 / Artificial General Intelligence）

生活类比：一个能做所有人类智力工作的 AI——写代码、看病、写诗、做研究、谈恋爱（？）。详细：现在的 AI 都是"专用 AI"——擅长某些任务，其他任务一塌糊涂。AGI 是"通用 AI"，水平相当于一个普通成年人在所有智力领域。OpenAI 的官方目标就是 AGI。GPT-5.4 距离 AGI 还有距离，但比 5 年前近多了。

30. ASI（超级人工智能 / Artificial Super Intelligence）

生活类比：一个比所有人加起来都聪明的 AI。详细：ASI 不仅在所有任务上超过最聪明的人类，还能自我改进——这意味着改进速度可能呈指数级。这是科幻小说和"AI 安全"研究的核心话题。OpenAI 联合创始人 Ilya 离职后创办的 SSI（Safe Superintelligence）就是冲这个方向去的。

几个常被混淆的概念对比

"GPT" vs "ChatGPT" vs "OpenAI"

OpenAI = 公司
GPT = 模型（GPT-3.5, GPT-4, GPT-5, GPT-5.4...）
ChatGPT = 产品（用 GPT 模型 + 聊天界面包出来的）

类比：

苹果公司 = OpenAI
A 系列芯片（A17, A18...） = GPT 模型
iPhone = ChatGPT 产品

"训练" vs "推理"

	训练	推理
比喻	上学读书	上岗工作
频率	一次（每代模型）	每次你和它说话
成本	1 亿美元起	几分钱到几毛钱
谁做	OpenAI	你

"幻觉" vs "胡说"

很多人把"AI 幻觉"理解成"AI 故意撒谎"。其实它没有"故意"——它只是在"按概率预测下一个最可能的词"，并不知道自己说的是真是假。

类比：一个不懂股票的人，看到老板问"明天涨还是跌"，为了不显得无知，编了一个答案出来——他不是恶意，但答案是错的。

"AI 替代你" vs "会用 AI 的人替代不会用的"

AI 不会替代你，但会用 AI 的人会替代你。

这是这个时代最重要的判断。

"AGI" vs "ASI"

现在的 AI ────→ AGI（人类水平）────→ ASI（超人类水平）
GPT-5.4    ?    GPT-7?         ?     ?

学界普遍预测 AGI 还有 5-15 年，ASI 在 AGI 之后 5-30 年。OpenAI、Anthropic、Google 都在赛跑。

你可能听过但本书没单独讲的几个名词

名词	一句话
Transformer	LLM 的底层网络架构
Attention	Transformer 里"看上下文"的机制
MoE（Mixture of Experts）	"多专家"模型架构，DeepSeek-V3 就用
Quantization（量化）	把模型"压缩"成更小的版本（精度略降）
GPU / TPU	AI 训练 / 推理的"专用显卡"
CUDA	英伟达 GPU 的编程平台
HuggingFace	全球最大的开源 AI 模型社区
OpenRouter	一个能"统一调用 100 种模型"的中间层
Anthropic	OpenAI 的最大竞争对手，做 Claude
Mistral	欧洲的开源 AI 公司，模型很强

需要时可以让 ChatGPT "用大白话给我讲讲 [名词]"，秒懂。

一段写在最后的话

技术圈最爱"造词唬人"。但 AI 的本质，80% 用 30 个词就讲清楚了——这一份术语表已经覆盖。

下次你听到任何"AI 黑话"，第一反应应该是：

"这能不能用大白话讲清楚？"

如果讲不清楚，多半是说话的人自己也没搞懂。

如果你能用大白话讲清楚，你已经超过了 95% 的"AI 评论员"。

把这份术语表存到收藏夹，每周挑 1 个词跟身边人讲讲——讲完，词就长进你脑子里了。

📖 回到目录

🎯 继续读：附录 E 资源、社区与延伸阅读

🆘 回看：第十二章避坑、安全、隐私与未来