1. AI(人工智能)
一句话:让计算机做"看起来像人在做"的事。
生活类比:以前的电脑是"听话的工具"——你按 1 它执行 1。现在的 AI 是"会想的工具"——你说"帮我想想该吃什么",它真的去想。
在豆包里:豆包就是 AI 的一种产品形态。
2. 大语言模型 / LLM(Large Language Model)
一句话:用海量文本训练出来的"超级语言学习机",能理解、生成自然语言。
生活类比:想象一个人从小到大读了 1000 个图书馆的所有书,记住了人类语言的所有规律。你和他聊天,他都能接得住,还能续写、翻译、解释。
在豆包里:豆包背后就是大语言模型(豆包 1.6 / 2.0 Pro)。Doubao-Seed-Code 是专门给编程优化的语言模型。
3. 提示词 / Prompt
一句话:你"喂" 给 AI 的话——你怎么问,决定了它怎么答。
生活类比:跟厨师点菜。你说"随便给我做点啥",厨师可能给你白米饭。你说"我想吃番茄炒蛋,少盐,不要太油,配米饭",厨师就懂了。Prompt 就是你的"点菜单"。
在豆包里:第四章 整章讲怎么写好 Prompt。本书 附录 A 给你 100 个现成模板。
4. 多模态 / Multimodal
一句话:AI 不只能"读字",还能"看图、听声、看视频"。
生活类比:以前你只能跟 AI 文字聊天。现在你能拍张菜单它告诉你菜啥味、放段录音它转成纪要、上传 PDF 它给你总结、画一张图它给你出图。它的"五感"都活了。
在豆包里:第五章 整章讲豆包的"五感"。
5. 智能体 / Agent
一句话:有"专职身份" 的 AI 助手——它不只是"问什么答什么",它有自己的角色、流程、工具。
生活类比:单纯的 AI 像"前台" ——你问什么 ta 答什么。智能体像"专业部门" ——客服部、财务部、HR 部,每个部门有自己的边界和工作流,专业地处理对应的事。
在豆包里:豆包内置"智能体广场",有几千个智能体可用。你也可以自己创建。详见 第十章 + 第十三章。
6. 幻觉 / Hallucination
一句话:AI 一本正经地"编"——给的答案听起来很合理,其实是它瞎编的。
生活类比:一个特别会聊天的朋友,你问他"鲁迅有没有写过《阿 Q 正传》续集",他不想说"我不知道",于是一本正经地编:"1928 年鲁迅写了《阿 Q 正传续集》⋯⋯" ——书根本不存在。
在豆包里:涉及具体事实(人名、年份、数据、法条)一定要自己核实。识别 + 应对方法详见 第十二章 12.3。
7. RAG / 知识库
一句话:让 AI"先查资料再回答"——把你的私有文档变成 AI 的"参考书"。
生活类比:通用 AI 像一个见识广的"通才",但他不知道你公司的文档、你家的菜谱、你部门的规章。RAG 就是"给他建一个小图书馆",里面是你的私有资料,每次问他都先去这个图书馆翻一翻再回答。
英文 RAG = Retrieval-Augmented Generation(检索增强生成)。
在豆包里:自定义智能体可以"上传知识库",让智能体基于你的私有资料回答。详见 第十三章 13.3.6。
8. 工作流 / Workflow
一句话:把 AI 的多个动作"串起来" 自动跑——按一次按钮,AI 自己跑完一长串任务。
生活类比:以前你做菜要"切→洗→炒→装盘"每一步亲自动手。工作流就是你"按一次按钮,全自动洗碗机+炒菜机+装盘机" 一键跑完。
在豆包里:豆包本身的工作流能力有限。Coze 是字节专门做工作流的工具。详见 第十三章 13.4。
9. AI 绘画 / 文生图(Text-to-Image)
一句话:用一段文字描述,AI 给你画一张图。
生活类比:以前画画要学美术、买颜料。现在你写一句"画一只穿西装的橘猫坐在咖啡馆", AI 几秒钟出一张图。
在豆包里:豆包用 Seedream 4.0 模型。免费用户每天 10 张。详见 第五章 5.7。
类似的术语:
- 文生视频:写文字 → 出视频(豆包用 Seedance)
- 图生视频:上传图片 → 让它"动起来"
- 图生图:基于一张图改造
10. AGI / 通用人工智能
一句话:传说中的"达到人类智力水平甚至超越" 的 AI——目前还没出现,但所有 AI 公司都在追这个目标。
生活类比:现在的 AI 像"会做某些事的专家"(写文章很厉害但不会真正"理解" 这世界)。AGI 像"什么都会、什么都懂、像人一样能学习、推理、创造" 的存在。
在豆包里:你用的豆包目前还不是 AGI,但它已经在某些任务上接近"实习生水平"。AGI 是所有 AI 公司未来 5-10 年的目标。
番外:你不一定要懂,但听过会有面子的 6 个词
Token(词元)
AI 处理文本的"最小单位"。中文 1 个字大概是 1-2 个 token,英文 1 个单词大概是 1-2 个 token。"豆包能处理 100 万字"约等于"百万级 token 上下文"。
上下文窗口(Context Window)
AI 一次能"看" 多少内容。豆包能一次处理 100 万字 = 上下文窗口很大。窗口越大,能处理越长的文档。
微调(Fine-tuning)
拿一个"通用的大模型",用你的私有数据"再训练" 一下,让它更懂你的领域。比如医院用医疗数据微调出"医疗专用 AI"。
蒸馏(Distillation)
把一个"巨大、复杂、慢" 的 AI 模型,"压缩"成一个"小、简单、快" 的版本,效果接近原版。豆包的"小模型" 就是蒸馏出来的。
强化学习 / RLHF
让 AI 通过"人类反馈"学习什么样的回答更好。你给豆包点"赞 / 踩",就在帮它做强化学习。
MCP(Model Context Protocol)
让 AI 能"调用外部工具" 的标准协议。比如 AI 通过 MCP 直接读你的本地文件、操作软件、调 API。是 2025-2026 年最火的 AI 概念之一。
一张图记住"这些术语的关系"
┌─── 大语言模型(LLM)
│ ↓
│ 豆包 / ChatGPT 这些产品
AI ──┤
│ ↓
│ 你写 Prompt 跟它说话
│ ↓
│ 它可能产生"幻觉",要核实
│ ↓
├─ 加"知识库"(RAG)→ 它懂你的私有资料
├─ 加"工作流" → 自动跑一长串任务
├─ 加"工具调用"(MCP)→ 能读文件、操作软件
└─ 多模态(看图、听声、看视频)
全部加起来 = 智能体(Agent)
未来终点 = AGI(通用人工智能)
记住这张图,90% 的 AI 新闻你都能看懂。