术语表 · 豆包橙皮书

1. AI（人工智能）

一句话：让计算机做"看起来像人在做"的事。

生活类比：以前的电脑是"听话的工具"——你按 1 它执行 1。现在的 AI 是"会想的工具"——你说"帮我想想该吃什么"，它真的去想。

在豆包里：豆包就是 AI 的一种产品形态。

2. 大语言模型 / LLM（Large Language Model）

一句话：用海量文本训练出来的"超级语言学习机"，能理解、生成自然语言。

生活类比：想象一个人从小到大读了 1000 个图书馆的所有书，记住了人类语言的所有规律。你和他聊天，他都能接得住，还能续写、翻译、解释。

在豆包里：豆包背后就是大语言模型（豆包 1.6 / 2.0 Pro）。Doubao-Seed-Code 是专门给编程优化的语言模型。

3. 提示词 / Prompt

一句话：你"喂" 给 AI 的话——你怎么问，决定了它怎么答。

生活类比：跟厨师点菜。你说"随便给我做点啥"，厨师可能给你白米饭。你说"我想吃番茄炒蛋，少盐，不要太油，配米饭"，厨师就懂了。Prompt 就是你的"点菜单"。

在豆包里：第四章整章讲怎么写好 Prompt。本书附录 A 给你 100 个现成模板。

4. 多模态 / Multimodal

一句话：AI 不只能"读字"，还能"看图、听声、看视频"。

生活类比：以前你只能跟 AI 文字聊天。现在你能拍张菜单它告诉你菜啥味、放段录音它转成纪要、上传 PDF 它给你总结、画一张图它给你出图。它的"五感"都活了。

在豆包里：第五章整章讲豆包的"五感"。

5. 智能体 / Agent

一句话：有"专职身份" 的 AI 助手——它不只是"问什么答什么"，它有自己的角色、流程、工具。

生活类比：单纯的 AI 像"前台" ——你问什么 ta 答什么。智能体像"专业部门" ——客服部、财务部、HR 部，每个部门有自己的边界和工作流，专业地处理对应的事。

在豆包里：豆包内置"智能体广场"，有几千个智能体可用。你也可以自己创建。详见第十章 + 第十三章。

6. 幻觉 / Hallucination

一句话：AI 一本正经地"编"——给的答案听起来很合理，其实是它瞎编的。

生活类比：一个特别会聊天的朋友，你问他"鲁迅有没有写过《阿 Q 正传》续集"，他不想说"我不知道"，于是一本正经地编："1928 年鲁迅写了《阿 Q 正传续集》⋯⋯" ——书根本不存在。

在豆包里：涉及具体事实（人名、年份、数据、法条）一定要自己核实。识别 + 应对方法详见第十二章 12.3。

7. RAG / 知识库

一句话：让 AI"先查资料再回答"——把你的私有文档变成 AI 的"参考书"。

生活类比：通用 AI 像一个见识广的"通才"，但他不知道你公司的文档、你家的菜谱、你部门的规章。RAG 就是"给他建一个小图书馆"，里面是你的私有资料，每次问他都先去这个图书馆翻一翻再回答。

英文 RAG = Retrieval-Augmented Generation（检索增强生成）。

在豆包里：自定义智能体可以"上传知识库"，让智能体基于你的私有资料回答。详见第十三章 13.3.6。

8. 工作流 / Workflow

一句话：把 AI 的多个动作"串起来" 自动跑——按一次按钮，AI 自己跑完一长串任务。

生活类比：以前你做菜要"切→洗→炒→装盘"每一步亲自动手。工作流就是你"按一次按钮，全自动洗碗机+炒菜机+装盘机" 一键跑完。

在豆包里：豆包本身的工作流能力有限。Coze 是字节专门做工作流的工具。详见第十三章 13.4。

9. AI 绘画 / 文生图（Text-to-Image）

一句话：用一段文字描述，AI 给你画一张图。

生活类比：以前画画要学美术、买颜料。现在你写一句"画一只穿西装的橘猫坐在咖啡馆", AI 几秒钟出一张图。

在豆包里：豆包用 Seedream 4.0 模型。免费用户每天 10 张。详见第五章 5.7。

类似的术语：

文生视频：写文字 → 出视频（豆包用 Seedance）
图生视频：上传图片 → 让它"动起来"
图生图：基于一张图改造

10. AGI / 通用人工智能

一句话：传说中的"达到人类智力水平甚至超越" 的 AI——目前还没出现，但所有 AI 公司都在追这个目标。

生活类比：现在的 AI 像"会做某些事的专家"（写文章很厉害但不会真正"理解" 这世界）。AGI 像"什么都会、什么都懂、像人一样能学习、推理、创造" 的存在。

在豆包里：你用的豆包目前还不是 AGI，但它已经在某些任务上接近"实习生水平"。AGI 是所有 AI 公司未来 5-10 年的目标。

番外：你不一定要懂，但听过会有面子的 6 个词

Token（词元）

AI 处理文本的"最小单位"。中文 1 个字大概是 1-2 个 token，英文 1 个单词大概是 1-2 个 token。"豆包能处理 100 万字"约等于"百万级 token 上下文"。

上下文窗口（Context Window）

AI 一次能"看" 多少内容。豆包能一次处理 100 万字 = 上下文窗口很大。窗口越大，能处理越长的文档。

微调（Fine-tuning）

拿一个"通用的大模型"，用你的私有数据"再训练" 一下，让它更懂你的领域。比如医院用医疗数据微调出"医疗专用 AI"。

蒸馏（Distillation）

把一个"巨大、复杂、慢" 的 AI 模型，"压缩"成一个"小、简单、快" 的版本，效果接近原版。豆包的"小模型" 就是蒸馏出来的。

强化学习 / RLHF

让 AI 通过"人类反馈"学习什么样的回答更好。你给豆包点"赞 / 踩"，就在帮它做强化学习。

MCP（Model Context Protocol）

让 AI 能"调用外部工具" 的标准协议。比如 AI 通过 MCP 直接读你的本地文件、操作软件、调 API。是 2025-2026 年最火的 AI 概念之一。

一张图记住"这些术语的关系"

         ┌─── 大语言模型（LLM）
         │      ↓
         │  豆包 / ChatGPT 这些产品
   AI ──┤
         │      ↓
         │  你写 Prompt 跟它说话
         │      ↓
         │  它可能产生"幻觉"，要核实
         │      ↓
         ├─ 加"知识库"（RAG）→ 它懂你的私有资料
         ├─ 加"工作流" → 自动跑一长串任务
         ├─ 加"工具调用"（MCP）→ 能读文件、操作软件
         └─ 多模态（看图、听声、看视频）

   全部加起来 = 智能体（Agent）

   未来终点 = AGI（通用人工智能）

记住这张图，90% 的 AI 新闻你都能看懂。