一、基础概念
AI(人工智能 / Artificial Intelligence)
一句话:让机器"像人一样思考、学习、做事"的技术。
大白话:原来只能"按规则干活"的电脑,现在可以"自己理解 + 决策"——比如认人脸、写文章、聊天。
跟你的关系:你每天用的微信抖音里的"推荐算法 / 人脸识别 / 自动翻译"都是 AI——只是你没察觉。
大模型(Large Language Model, LLM)
一句话:用几千亿参数训练出来的、能"理解和生成"语言的 AI。
大白话:把"互联网上的所有书 / 文章 / 对话"喂给电脑,让它学到"人类语言的规律"——然后它就能跟你像"老朋友"一样聊天。
跟你的关系:腾讯元宝、ChatGPT、豆包、Kimi 都是基于"大模型"做的产品。
生成式 AI(Generative AI)
一句话:能"创造"内容的 AI——文字、图片、音频、视频、代码。
大白话:不只是"识别",而是"生成"——你说"画一只猫",它真的画出来一只猫。
跟你的关系:你用元宝写周报、做 PPT、生成图片——都是生成式 AI。
Token(令牌)
一句话:大模型处理"文字"的最小单位(像"字",但更细)。
大白话:不是 1 个汉字 = 1 个 token,而是大概 1 个汉字 ≈ 1.5-2 个 tokens。
跟你的关系:模型的"上下文长度"用 token 衡量——比如"128K tokens"≈ 10 万汉字。
Context(上下文)
一句话:模型在"当前对话"中能"记住"的内容总量。
大白话:你问的话、它答的话、你上传的文件——都算上下文。"上下文越大"=它能"记住的东西越多"。
跟你的关系:元宝的上下文很大,可以一次性"记住"几十万字——比 ChatGPT 早期的版本"记得"多 10 倍。
多模态(Multimodal)
一句话:AI 能同时处理"文字 + 图 + 音 + 视频"等多种"信息形式"。
大白话:原来 AI 只能"打字回复",现在能"看图 / 听音 / 看视频"——五种感官全开。
跟你的关系:你拍照让元宝识别、上传录音让它转写、让它生成视频——都是多模态。
Prompt(提示词)
一句话:你给 AI 的"指令 / 问题 / 输入"。
大白话:你跟 AI 说的"每一句话"都叫提示词。
跟你的关系:你的提示词越好,AI 答得越好。这本书 第五章 专门讲这个。
Prompt Engineering(提示词工程)
一句话:研究"如何写出更好的提示词"的学问。
大白话:不是写代码,是"学会跟 AI 说话"。
跟你的关系:本书 第五章 + 附录 A 就是教你这个。
二、模型相关
混元大模型(Hunyuan)
一句话:腾讯自研的大模型系列。
大白话:腾讯版的"GPT"。包括 Turbo S(快版)和 T1(深度思考版)。
跟你的关系:你用元宝时,背后的"大脑"之一就是混元。
混元 T1
一句话:腾讯混元的"深度思考"版本——擅长长文档 / 中文文学 / 复杂推理。
大白话:思考型,慢但深。
跟你的关系:要"认真想一想"的任务(论文 / 长文档 / 写作)都用 T1。
混元 Turbo S
一句话:腾讯混元的"快速响应"版本。
大白话:闪电式秒答型。
跟你的关系:闲聊 / 简单问答用 Turbo S,省时间。
DeepSeek
一句话:中国独立 AI 公司"深度求索"做的开源大模型。
大白话:以"超强推理 + 超低价格"著称,全球程序员的最爱之一。
跟你的关系:元宝集成了 DeepSeek-R1(深度思考)和 V3(通用)——你能直接用。
DeepSeek-R1
一句话:DeepSeek 的"深度推理"模型。
大白话:擅长"想很久"的题目——数学 / 物理 / 代码 / 复杂逻辑。
跟你的关系:在元宝里要"算复杂的数学题 / 写代码 / 做严密分析"——优先选 R1。
DeepSeek-V3
一句话:DeepSeek 的"通用对话"模型。
大白话:日常用,平衡 + 通用。
跟你的关系:日常聊天 / 中文创作 / 大部分任务都能用 V3。
GPT(Generative Pre-trained Transformer)
一句话:OpenAI 做的大模型系列(ChatGPT 背后的模型)。
大白话:业内"鼻祖级"产品,最早把"AI 对话"带进大众视野。
跟你的关系:国内访问受限,但你应该知道它的存在。详细对比看 附录 B。
Claude
一句话:Anthropic(OpenAI 离职团队)做的大模型。
大白话:以"文风优雅 + 对话克制"著称,开发者圈的最爱之一。
跟你的关系:国内不可直接访问,但你写"高质量英文"时可以了解。
开源 vs 闭源
一句话:
- 开源:模型代码 / 权重免费公开(如 DeepSeek、Llama、Qwen)
- 闭源:模型只能通过厂商 API 访问(如 GPT、Claude、混元 T1)
大白话:开源 = 谁都能下载用;闭源 = 只能"租用"。
跟你的关系:作为普通用户,开源还是闭源对你影响不大——元宝里既有混元(闭源)也有 DeepSeek(开源),都能用。
三、提问 & 推理相关
上下文工程(Context Engineering)
一句话:通过"提供恰当的上下文"让 AI 输出更好结果的方法。
大白话:你给 AI 的"信息越完整",它答得越好——这比"调提示词"更重要。
跟你的关系:本书核心心法之一:"上下文 > 提示词",详见 第五章 5.6 节。
Chain-of-Thought(CoT,思维链)
一句话:让 AI"一步步思考"的提示方法。
大白话:跟 AI 说"请一步步分析",它的答案会更准确——尤其是数学 / 推理题。
跟你的关系:复杂问题加一句"请先列思考过程,再给答案"——立刻提升准确率。
深度思考(Deep Thinking / Reasoning Mode)
一句话:模型的"加强版思考模式"——更慢但更准。
大白话:模型在回答前"先想 5-30 秒"——适合复杂问题。
跟你的关系:元宝里的"深度思考"按钮就是这个——参考 第四章。
Zero-shot / Few-shot
一句话:
- Zero-shot:不给 AI 任何示例,直接问
- Few-shot:给 AI 几个"示例",让它"照着做"
大白话:先教 AI"该长什么样",它就能"模仿出来"。
跟你的关系:写邮件 / 文案时,给 AI"3 个范例"——比不给好 10 倍。
Role Prompting(角色提示)
一句话:让 AI"扮演某个角色"再回答。
大白话:跟 AI 说"你是 30 年经验的医生",它的回答风格会立刻变得更专业。
跟你的关系:本书的所有提示词模板都用了"角色提示"——这是最有效的提问技巧之一。
Self-Consistency(自我一致性)
一句话:让 AI"多次回答同一问题",取"最一致"的答案。
大白话:让 AI 答 3 遍,看哪个答案"更稳定"——通常就是更准的那个。
跟你的关系:医疗 / 法律 / 投资等高风险问题,用这招提升可靠性。
四、多模态相关
TTS(Text-to-Speech,语音合成)
一句话:把"文字"变成"语音"的技术。
大白话:让 AI"用嘴说话"。
跟你的关系:元宝的"语音通话"功能就是 TTS——你用了 第十三章 13.4 节。
ASR(Automatic Speech Recognition,语音识别)
一句话:把"语音"变成"文字"的技术。
大白话:让 AI"听懂人话"。
跟你的关系:元宝的"录音笔"功能就是 ASR——你用了 第十三章 13.3 节。
OCR(Optical Character Recognition,光学字符识别)
一句话:把"图片里的文字"变成"可编辑的文字"。
大白话:拍一张图,AI 能读出图里的字。
跟你的关系:元宝拍照翻译 / 拍合同 / 拍化验单——都用了 OCR。
Text-to-Image(文生图)
一句话:用文字描述"生成"图片。
大白话:你说"画一个穿宇航服的猫",AI 真的画出来。
跟你的关系:元宝的 AI 美照 / AI 配图都是文生图——参考 第十二章。
Text-to-Video(文生视频)
一句话:用文字描述"生成"视频。
大白话:写一段"傍晚的西湖夕阳",AI 真的做出 5-15 秒短视频。
跟你的关系:元宝的 AI 视频功能——参考 第十三章 13.2 节。
五、智能体相关
Agent(智能体)
一句话:被"预设角色 + 知识库 + 工作流"的 AI。
大白话:把元宝"配置成一个特定职业"——比如"小学老师助手""外贸客户跟进助手"。
跟你的关系:你可以"用别人造的智能体"或"自己造一个"——参考 第十四章。
智能体广场
一句话:元宝里的"智能体应用商店"。
大白话:里面有几万个"现成的小 AI"——找到合适的,比自己写提示词省 10 倍时间。
跟你的关系:元宝主界面 → "智能体广场"或"发现"。
腾讯元器(Tencent Yuanqi)
一句话:腾讯的"零代码造智能体"平台(yuanqi.tencent.com)。
大白话:你不用写代码,就能造一个属于你的 AI 智能体,发布到元宝、小程序、公众号。
跟你的关系:想"造 AI"的入门——参考 第十四章。
知识库(Knowledge Base)
一句话:你"喂给"智能体的专属资料库。
大白话:上传你的文档、笔记、行业资料——智能体回答时优先从这里找答案。
跟你的关系:在元器里造智能体时,"上传知识库"是最关键的一步。
RAG(Retrieval-Augmented Generation,检索增强生成)
一句话:AI 在回答前"先检索知识库"再生成答案的技术。
大白话:让 AI 不"凭记忆瞎说",而"先翻你的资料库"——回答更准。
跟你的关系:元器里的"知识库"功能就用了 RAG。
Function Calling(函数调用)
一句话:让 AI"调用工具"完成任务(比如查天气、订机票、发邮件)。
大白话:AI 不只是"答问题",还能"动手做事"。
跟你的关系:元器里的"工作流"功能用了 Function Calling——你能让智能体"自动联网搜 + 自动整理 + 自动出报告"。
Workflow(工作流)
一句话:把多个步骤"串起来自动执行"的设计。
大白话:智能体不是"答一个问题就结束"——可以"先搜 → 再读文件 → 再分析 → 再出报告"。
跟你的关系:元器后台支持"可视化工作流编辑器"——拖拖拽拽就能配置。
六、风险与安全相关
Hallucination(AI 幻觉)
一句话:AI 输出"看起来合理但其实错"的内容。
大白话:AI 一本正经地胡说八道——尤其是它不知道的领域。
跟你的关系:本书 第十五章 15.2 节 专门讲怎么防。
偏见(Bias)
一句话:AI 因"训练数据"带有的"刻板印象"。
大白话:AI 可能因"训练材料里更多某类内容",导致回答偏向某个角度。
跟你的关系:用 AI 做"涉及人 / 群体 / 性别 / 种族"的内容时,多角度核查,别完全信。
Jailbreak(越狱)
一句话:用"特殊提示词"让 AI 输出"它本不该输出"的内容。
大白话:试图骗 AI "突破安全限制"。
跟你的关系:强烈不建议尝试——既不道德,也违规,还可能被封号。
对齐(Alignment)
一句话:让 AI 的"价值观"跟"人类价值观"一致的研究。
大白话:让 AI"听话 + 不作恶"。
跟你的关系:你不需要懂技术细节,只需要知道——这是"AI 安全"领域最重要的话题之一。
数据合规
一句话:AI 公司处理用户数据是否符合"法律法规"。
大白话:你的数据被怎么收集、存放、使用——是否合法。
跟你的关系:腾讯元宝的服务器在国内,符合中国法规——比海外 AI 更"合规"。
AI 诈骗
一句话:用 AI 工具(换脸 / 仿声 / 代写)实施的新型诈骗。
大白话:骗子用 AI 模仿你家人的脸和声音,给你打电话要钱。
跟你的关系:本书 第十五章 15.5 节 给了"防 AI 诈骗 10 条"——值得转发给爸妈。
七、A-Z 速查表
| 术语 | 章节 |
|---|---|
| Agent(智能体) | 五 |
| AI(人工智能) | 一 |
| Alignment(对齐) | 六 |
| ASR(语音识别) | 四 |
| Bias(偏见) | 六 |
| Chain-of-Thought(思维链) | 三 |
| Claude | 二 |
| Context(上下文) | 一 |
| Context Engineering(上下文工程) | 三 |
| 数据合规 | 六 |
| DeepSeek | 二 |
| DeepSeek-R1 | 二 |
| DeepSeek-V3 | 二 |
| 深度思考 | 三 |
| 大模型 | 一 |
| Few-shot / Zero-shot | 三 |
| Function Calling(函数调用) | 五 |
| 生成式 AI | 一 |
| GPT | 二 |
| Hallucination(AI 幻觉) | 六 |
| 混元大模型 | 二 |
| 混元 T1 | 二 |
| 混元 Turbo S | 二 |
| Jailbreak(越狱) | 六 |
| 知识库 | 五 |
| 多模态 | 一 |
| OCR(图像文字识别) | 四 |
| 开源 vs 闭源 | 二 |
| Prompt(提示词) | 一 |
| Prompt Engineering(提示词工程) | 一 |
| RAG(检索增强生成) | 五 |
| Role Prompting(角色提示) | 三 |
| Self-Consistency(自我一致性) | 三 |
| Text-to-Image(文生图) | 四 |
| Text-to-Video(文生视频) | 四 |
| Token | 一 |
| 腾讯元器(Yuanqi) | 五 |
| TTS(语音合成) | 四 |
| Workflow(工作流) | 五 |
| AI 诈骗 | 六 |
| 智能体广场 | 五 |
用好这份术语表的"3 条建议"
建议 1:不要"硬记"
术语是工具,不是考试——遇到一个查一个就行。
建议 2:优先记前 10 个
最重要的:大模型 / Token / Context / Prompt / 多模态 / 智能体 / 知识库 / 联网 / 深度思考 / 幻觉
——这 10 个搞清楚,你已经超过 80% 的 AI 用户。
建议 3:用"自己的话"复述
读完一个术语,用你的话给身边人讲一遍——讲不清楚的,就回来再读。
下一篇:附录 E 资源与社区链接