ORANGE BOOK · CHATGPT

附录 D:术语表(30 个 AI 黑话的大白话解释)

索引(按字母序 / 拼音序)

序号 术语 一句话定义
01 AI 让机器表现得像"会思考的人"
02 LLM(大语言模型) "读了几乎全网内容"的超级文本预测机
03 GPT OpenAI 出品的一系列 LLM
04 ChatGPT 把 GPT 包成"聊天界面"的产品
05 Token AI 的"字数单位",1 中文 ≈ 1.5 token
06 上下文(Context) AI 一次能"看见"的对话长度
07 上下文窗口(Context Window) 这个"看见"能力的容量上限
08 提示词(Prompt) 你输入给 AI 的那段话
09 系统提示词(System Prompt) 给 AI 的"出厂设定",用户看不见
10 幻觉(Hallucination) AI 一本正经地胡说
11 思维链(Chain of Thought, CoT) 让 AI"先想再说",提高正确率
12 微调(Fine-tuning) 在通用模型基础上"再训练"成专家
13 RAG 让 AI"先查资料再回答"的方法
14 多模态(Multimodal) AI 能看图、听声、读视频
15 Agent / Operator 让 AI 自己"动手做事"
16 API 程序员调用 AI 的接口
17 GPTs ChatGPT 的"自定义助手"功能
18 嵌入(Embedding) 把"文字"变成"一串数字"的转换
19 向量数据库(Vector DB) 专门存"数字化文字"的数据库
20 Tokenizer(分词器) 把人话切成 token 的小工具
21 训练(Training) 让 AI"看资料学知识"的过程
22 推理(Inference) AI"输出回答"的过程
23 涌现(Emergence) 模型一变大就"突然学会"新技能
24 对齐(Alignment) 让 AI"听人话"、"守人规矩"
25 RLHF 用"人给反馈"的方式训练 AI
26 Diffusion(扩散模型) 画图 / 视频 AI 的主要技术
27 LoRA 一种"轻量微调"画图模型的方法
28 Open-source(开源) 谁都能下载、改、用的 AI 模型
29 AGI "通用人工智能",能干所有人能干的事
30 ASI "超级人工智能",比所有人聪明的 AI

详解

01. AI(人工智能 / Artificial Intelligence)

生活类比:让一台机器,做一件原本"得人才能做"的事。 详细:从下围棋(AlphaGo)、识别人脸(Face ID)、推荐商品(淘宝)、自动驾驶(特斯拉),到聊天(ChatGPT)、画图、写代码、做视频——这些全部叫 AI。AI 的"种类"很多,ChatGPT 只是其中一种(叫"生成式 AI")。

02. LLM(大语言模型 / Large Language Model)

生活类比:一个"读完几乎全互联网"的超级文本预测机。给它前半句,它预测下一个最可能的字——预测一万次,就组成了一篇文章。 详细:GPT、Claude、Gemini、文心一言、DeepSeek、Llama 全部都是 LLM。"大"指的是参数量(万亿级)和训练数据量(PB 级)。

03. GPT(Generative Pre-trained Transformer)

生活类比:OpenAI 出品的一个"系列产品"。 详细:GPT 是 LLM 的一个具体家族,从 GPT-1(2018)到 GPT-5.4(2026),一共 5 代主版本。每一代背后是同一种"Transformer 架构",但参数和数据越来越大。

04. ChatGPT

生活类比:把 GPT 包了一个"聊天框",让普通人能用。 详细:在 ChatGPT 出现之前,GPT 是给开发者用的。2022 年 11 月 30 日,OpenAI 把 GPT-3.5 加了个聊天界面,5 天破百万、2 个月破亿——人类历史上最快被普及的技术。

05. Token("字数"单位)

生活类比:AI 的"字数计费单位"。 详细:AI 不按"字"计费,按 token 计。

  • 1 个英文单词 ≈ 1.3 token
  • 1 个中文字 ≈ 1.5-2 token
  • 1000 token ≈ 750 个英文单词 / 500 个中文字

为什么重要?模型的"上下文窗口"和"价格"都按 token 算。

06. 上下文(Context)

生活类比:AI 的"短期记忆"。 详细:你和 AI 在同一个对话里来回说的所有话,加上你上传的文件,一起塞进它的"短期记忆"。这个记忆是有上限的(看模型)。

07. 上下文窗口(Context Window)

生活类比:AI 的"短期记忆"上限。 详细

  • GPT-3.5:4K tokens(≈ 3000 字中文)
  • GPT-4:8K-128K
  • GPT-5.4:200K
  • GPT-5.4 Pro:1M tokens(≈ 100 万字,能"读完一本书")

超过窗口,最早的内容会被"挤出去"。

08. 提示词(Prompt)

生活类比:你交代实习生的那段话。 详细:你在对话框输入的内容。提示词写得好不好,直接决定 AI 答得好不好。整本书第四章和第五章在讲这个。

09. 系统提示词(System Prompt)

生活类比:实习生的"岗位说明书",你看不见但他每秒都在看。 详细:开发者可以在每次对话前预先塞一段"内部指令"给模型。比如 ChatGPT 的系统提示词大致是"你是 ChatGPT,遵循 OpenAI 政策……" 用户看不见。做 GPTs 时填的"Instructions"就是系统提示词。

10. 幻觉(Hallucination)

生活类比:实习生为了"显得自己懂",编了一个看似靠谱的答案。 详细:AI 给出的"看起来对、自信地说出来、但其实是错的"内容。所有大模型都会幻觉,差别只在频率。GPT-5.4 比 5.2 少了 33%,但还有。识别幻觉的方法见 第十二章

11. 思维链(Chain of Thought, CoT)

生活类比:让你做数学题前"先在草稿纸上演算"。 详细:让 AI 不要直接给答案,先一步步"想"。研究发现,AI"想了再答"比"脱口而出"准确率高 20-50%。GPT-5 之后的"Thinking 模式"就是把思维链做成了产品。

12. 微调(Fine-tuning)

生活类比:通用医学院毕业后,再去专科医院培训 3 年。 详细:在一个通用大模型基础上,用特定领域的数据继续训练,让它在那个领域更专业。比如把 GPT 用医疗数据微调成"医疗 GPT"。普通用户不会做微调,开发者才需要。

13. RAG(检索增强生成 / Retrieval-Augmented Generation)

生活类比:让 AI "先查资料再回答"详细:当 AI 自己的"知识库"不够 / 过时,可以让它先去外部数据库 / 网页搜资料,然后基于查到的内容回答。这就是为什么联网 ChatGPT 比离线版准确得多。

14. 多模态(Multimodal)

生活类比:AI 不只会"听"和"说",还会"看图"、"看视频"、"听声音"。 详细:以前的 AI 只能处理文字(单模态)。现在的 GPT-5.4 是"多模态"——文字 + 图片 + 音频 + 视频,一个模型搞定。这是为什么你可以拍体检报告 / 截图 / 视频丢给它问。

15. Agent / Operator(智能体)

生活类比:从"听话的助理"升级到"自己动手的实习生"。 详细:传统 AI 只会"说",Agent 能"做"——打开浏览器、点鼠标、敲键盘、跨网站操作。GPT-5.4 内置了"原生计算机使用能力",是这个领域的代表。详见 第十一章

16. API(应用程序接口 / Application Programming Interface)

生活类比:餐厅的"后厨直供窗口"——程序员可以"绕过前厅服务员(聊天界面)"直接点菜。 详细:开发者通过 API 调用 ChatGPT,把 AI 集成到自己的 App / 网页 / 自动化流程里。按 token 计费,自由度高,但贵且复杂。普通用户完全用不到

17. GPTs(自定义助手)

生活类比:在 App Store 上下载"专门做某件事的 App",但全部是 ChatGPT 做的。 详细:你可以不写代码做一个"专属助手"(比如"小红书选题机"),可以自己用、分享给朋友、甚至发到 GPTs 商店赚分成。详见第十一章。

18. 嵌入(Embedding)

生活类比:把"文字"翻译成"一串数字坐标"。 详细:AI 不能直接处理文字,它必须把"狗"翻译成 [0.23, -0.91, 0.45, …](一个 1536 维向量)。"狗"和"猫"的向量很接近,"狗"和"火星"的向量很远。这是 AI 实现"语义搜索"的基础。

19. 向量数据库(Vector DB)

生活类比:专门存"数字化文字"的图书馆。 详细:当你把一份 100 万字的资料丢给 AI,它会先把每段话变成 embedding,存进向量数据库。下次你问问题,AI 在向量库里找意思相近的段落,再生成回答。这就是 RAG 的核心。

20. Tokenizer(分词器)

生活类比:把整段中文 / 英文"切片"的小工具。 详细:AI 处理文字前,先用 tokenizer 把它切成 token。中文 tokenizer 和英文 tokenizer 不同,所以同样长度文字"中文比英文费 token"。

21. 训练(Training)

生活类比:AI"上学读书"的过程。 详细:用海量文本(互联网、书籍、代码、维基)让模型"学会"语言规律。训练一次成本极高——GPT-4 训练成本估计超过 1 亿美元。GPT-5.4 估计 5-10 亿美元。

22. 推理(Inference)

生活类比:AI"上岗工作、回答问题"的过程。 详细:训练完成后,AI 每次给你回答叫"推理"。推理也要花钱(电费、显卡),但每次只是几分钱到几毛钱。

23. 涌现(Emergence)

生活类比:你养的猫突然有一天会开门了——你没教过,它自己学会了。 详细:研究发现,模型大到一定程度,会"突然"具备小模型完全没有的能力——比如做奥数、写代码、理解暗语。这是大模型最神奇也最让人担忧的地方。

24. 对齐(Alignment)

生活类比:让聪明的小孩"听话、不学坏"。 详细:模型本身没有"善恶观",对齐就是让它符合人类的价值观和安全规范——不伤害用户、不说脏话、不教做坏事。OpenAI、Anthropic、DeepMind 都有专门的"对齐团队"。

25. RLHF(基于人类反馈的强化学习)

生活类比:让小孩做事,做得对你给糖、做得不对你训他——他慢慢就学会了。 详细:RLHF 是让 AI"听话"的关键技术。流程:① 模型给出 N 个回答 → ② 人类标注员打分 → ③ 模型根据打分调整 → ④ 重复几百万次。ChatGPT 的"亲切语气"就是这么训出来的。

26. Diffusion(扩散模型)

生活类比:先画一张"全是雪花的电视屏幕",然后一步步"擦"出一只猫的形状。 详细:DALL·E、Stable Diffusion、Midjourney、Sora 全部是扩散模型。它的工作原理:先把"清晰图"变成"完全噪音"(前向扩散),再训练 AI"反过来"从噪音恢复清晰图(反向扩散)。

27. LoRA(Low-Rank Adaptation)

生活类比:"给画图 AI 装个插件",只训练插件、不动主模型。 详细:训练一个完整模型很贵,LoRA 是"轻量微调"的方法——只训练几兆字节的小补丁,就能让画图 AI "学会画我的脸"或"模仿宫崎骏风格"。普通用户不会自己训,但会用别人训好的 LoRA。

28. Open-source(开源)

生活类比:"菜谱 + 食材清单"全公开,谁都能自己做。 详细:开源 AI 模型 = 任何人都能下载、修改、商用的模型。代表:Meta 的 Llama、Mistral、DeepSeek、Qwen。优点:免费、可控、可私有部署;缺点:自己跑要技术门槛 + 显卡。

29. AGI(通用人工智能 / Artificial General Intelligence)

生活类比:一个能做所有人类智力工作的 AI——写代码、看病、写诗、做研究、谈恋爱(?)。 详细:现在的 AI 都是"专用 AI"——擅长某些任务,其他任务一塌糊涂。AGI 是"通用 AI",水平相当于一个普通成年人在所有智力领域。OpenAI 的官方目标就是 AGI。GPT-5.4 距离 AGI 还有距离,但比 5 年前近多了

30. ASI(超级人工智能 / Artificial Super Intelligence)

生活类比:一个比所有人加起来都聪明的 AI。 详细:ASI 不仅在所有任务上超过最聪明的人类,还能自我改进——这意味着改进速度可能呈指数级。这是科幻小说和"AI 安全"研究的核心话题。OpenAI 联合创始人 Ilya 离职后创办的 SSI(Safe Superintelligence)就是冲这个方向去的。


几个常被混淆的概念对比

"GPT" vs "ChatGPT" vs "OpenAI"

OpenAI = 公司
GPT = 模型(GPT-3.5, GPT-4, GPT-5, GPT-5.4...)
ChatGPT = 产品(用 GPT 模型 + 聊天界面包出来的)

类比:

苹果公司 = OpenAI
A 系列芯片(A17, A18...) = GPT 模型
iPhone = ChatGPT 产品

"训练" vs "推理"

训练 推理
比喻 上学读书 上岗工作
频率 一次(每代模型) 每次你和它说话
成本 1 亿美元起 几分钱到几毛钱
谁做 OpenAI

"幻觉" vs "胡说"

很多人把"AI 幻觉"理解成"AI 故意撒谎"。其实它没有"故意"——它只是在"按概率预测下一个最可能的词",并不知道自己说的是真是假。

类比:一个不懂股票的人,看到老板问"明天涨还是跌",为了不显得无知,编了一个答案出来——他不是恶意,但答案是错的。

"AI 替代你" vs "会用 AI 的人替代不会用的"

AI 不会替代你,但会用 AI 的人会替代你。

这是这个时代最重要的判断。

"AGI" vs "ASI"

现在的 AI ────→ AGI(人类水平)────→ ASI(超人类水平)
GPT-5.4    ?    GPT-7?         ?     ?

学界普遍预测 AGI 还有 5-15 年,ASI 在 AGI 之后 5-30 年。OpenAI、Anthropic、Google 都在赛跑。


你可能听过但本书没单独讲的几个名词

名词 一句话
Transformer LLM 的底层网络架构
Attention Transformer 里"看上下文"的机制
MoE(Mixture of Experts) "多专家"模型架构,DeepSeek-V3 就用
Quantization(量化) 把模型"压缩"成更小的版本(精度略降)
GPU / TPU AI 训练 / 推理的"专用显卡"
CUDA 英伟达 GPU 的编程平台
HuggingFace 全球最大的开源 AI 模型社区
OpenRouter 一个能"统一调用 100 种模型"的中间层
Anthropic OpenAI 的最大竞争对手,做 Claude
Mistral 欧洲的开源 AI 公司,模型很强

需要时可以让 ChatGPT "用大白话给我讲讲 [名词]",秒懂。


一段写在最后的话

技术圈最爱"造词唬人"。但 AI 的本质,80% 用 30 个词就讲清楚了——这一份术语表已经覆盖。

下次你听到任何"AI 黑话",第一反应应该是:

"这能不能用大白话讲清楚?"

如果讲不清楚,多半是说话的人自己也没搞懂

如果你能用大白话讲清楚,你已经超过了 95% 的"AI 评论员"

把这份术语表存到收藏夹,每周挑 1 个词跟身边人讲讲——讲完,词就长进你脑子里了。


📖 回到目录

🎯 继续读:附录 E 资源、社区与延伸阅读

🆘 回看:第十二章 避坑、安全、隐私与未来