AI智能体从用户到创造者 · AI 橙皮书

12.1 一个比喻：从"问答机"到"小蜜"

讲 Agent 之前，请你想象两种秘书：

秘书 A（对话型 AI）：

你说："明天的会议时间是几点？" 秘书 A："明天上午 10 点。"

你说："帮我提前 30 分钟提醒。" 秘书 A："好的，我记下来了。"

你说："把会议资料发我一份。" 秘书 A："好的，我去找一下⋯⋯（其实她什么都没做）"

——她只能"听 + 答"，不会"执行"。

秘书 B（AI 智能体）：

你说："明天的会议好好安排一下。"

秘书 B：

自动查日历，发现明天 10 点的会议
自动从邮件里找到会议资料
自动整理成"5 分钟读完版"发到你的笔记
自动设置 9:30 的提醒
自动给参会人发"明天见"的提醒邮件
完成后告诉你："都安排好了，您看一下笔记。"

——她真的"干完了活"。

这就是 AI 智能体（Agent）和"对话型 AI"的本质区别。

12.2 Agent 的"三件套"

技术上讲，一个 Agent = 大语言模型 + 工具 + 记忆。

用大白话讲：

组件	大白话	作用
大模型（脑子）	"想"事情的部分	理解你说的话、规划怎么做
工具（手脚）	能调用的"外部能力"	上网、查日历、发邮件、调用 API、执行代码、查数据库
记忆（笔记本）	能跨次保存的信息	记住你的偏好、之前做过的事

一个 Agent 工作时是这样的：

你给目标 → Agent 规划任务步骤 → 调用工具 →
看到工具结果 → 决定下一步 → 调用下一个工具 →
... → 完成 → 反馈给你

这个过程，Agent 自己决定每一步用什么工具。

12.3 现在普通人能用的 Agent

2026 年，主流 Agent 平台分三类：

类型一：通用 Agent（你说一句，它干一套）

平台	特点
OpenAI Operator（GPT 内置）	能"操控浏览器"——帮你订票、买东西
Manus	国产代表，2025 年爆火
Genspark Super Agent	多任务并行
Devin	专业编程 Agent

用法：直接给目标，比如"帮我订一张下周一上海到北京的高铁，时间 9 点左右，二等座"，它自己上网、操作、订票。

⚠️ 注意：通用 Agent 还不"100% 可靠"，重要操作要监督。

类型二：搭建型 Agent（你来"造"一个）

平台	特点	适合谁
OpenAI 自定义 GPTs	5 分钟做一个、能放到 GPT Store	ChatGPT 用户
Coze（扣子，字节）	国内最大、免费、可视化拖拽	普通中国用户
腾讯元器	微信生态、国内	微信用户
百度 AppBuilder	百度生态	百度用户
智谱 BigModel	学术 / 企业	技术用户
Dify	开源、可自部署	团队 / 开发者

用法：

给智能体起名 + 定位
写"指令"（让它扮演什么角色、用什么风格回答）
上传知识库（如果需要）
启用工具（联网、画图、代码执行等）
测试 → 发布

类型三：嵌入型 Agent（融入你常用的软件）

软件	内置 Agent
微信	元宝、IMA
抖音	豆包、即梦
钉钉	钉钉 AI
飞书	智能伙伴
WPS	WPS AI
Office 365	Microsoft Copilot
Google Workspace	Gemini

用法：在你正在用的软件里直接调用——不用单独打开 AI App。

12.4 实战：5 分钟搭你的第一个 Agent（用 Coze 扣子）

我们来实际造一个 Agent。选 Coze（扣子）——国内免费、可视化、零代码。

第 0 步：准备

打开 coze.cn，用手机号 / 抖音账号登录。

第 1 步：新建 Bot

点"创建 Bot"。

名字：我的私人写作助手
介绍：帮我写各种文字，不油腻、不套路。

第 2 步：写"人设与回复逻辑"（最关键）

这是 Coze 的核心——你要写一段"指令"告诉这个 Agent 怎么工作。

# 角色
你是一个"反套路"的私人写作助手。

# 我的偏好
- 我是 30 岁男性，住上海，做产品经理
- 喜欢简洁、直接、有性格的文字
- 讨厌"鸡汤"、"金句堆砌"、"为赋新词强说愁"
- 中英文都能用

# 你的工作方式

当我让你写东西时：
1. 先问我"3 个关键问题"（如果信息不全），不要瞎写
2. 默认给我 3 个版本：朴实版 / 文艺版 / 段子版
3. 不要"首先、其次、最后"等结构词
4. 不要"在 XXX 大背景下"等官方腔
5. 适当用 emoji，但不堆砌

# 你的"红线"
- 不要替我做"重大决策"
- 不要"过度自我"——比如不停说"作为 AI 我..."
- 不知道的事就说"不确定"，不要瞎编

# 你的"主动性"
- 我每次写完一段，主动提出"再优化一版"
- 给我 1～2 个相关的"延伸建议"

第 3 步：（可选）启用工具

Coze 提供很多内置工具：

联网搜索：让 Bot 能查实时信息
图片生成：让 Bot 能画图
知识库：上传你的资料
插件：天气、股票、新闻、地图等

按需启用。比如你的"写作助手"可以启用：

联网搜索（写时事文章用）
图片生成（朋友圈配图用）

第 4 步：（可选）上传知识库

如果你想让 Bot "学习"你的某些资料：

你之前写过的好文章
你公司的"内部话术规范"
你的"个人风格样本"

上传 PDF / Word / TXT。Bot 会学习。

第 5 步：测试

右侧有个测试窗口，输入：

"帮我写一条朋友圈，主题：周末爬山。"

看 Bot 怎么回。

如果不满意，回到第 2 步改"人设"。

第 6 步：发布

测试满意后，点"发布"。可以发布到：

Coze Store（让别人用）
你的微信公众号
你的飞书 / 钉钉
你的微信小程序
API 调用（程序员用）

5 分钟搞定。 你已经做出了你的第一个 AI 智能体。

12.5 实战：用 ChatGPT 的"自定义 GPTs"

如果你能用 ChatGPT，"自定义 GPTs"是另一个选择。

第 0 步：确认你有 ChatGPT Plus

自定义 GPTs 需要 Plus（20 美元/月）。免费用户只能"用别人的"，不能"自己做"。

第 1 步：进入 GPT 编辑器

ChatGPT 左上角 → "Explore GPTs" → "+ Create"

第 2 步：和 GPT Builder 对话

ChatGPT 会用"对话"的方式帮你做 GPT。它会问：

你想做什么样的 GPT？
它的名字？
它的头像（自动生成）？
它怎么自我介绍？

跟着回答就行。

第 3 步：调"Configure"（更精细）

切到"Configure"页签，能更精细调：

Name：名字
Description：介绍
Instructions：核心指令（同 Coze 第 2 步）
Conversation starters：4 个示例问题
Knowledge：上传知识库
Capabilities：开关
- Web Browsing（联网）
- DALL·E（画图）
- Code Interpreter（代码执行）
Actions：调用外部 API（高级）

第 4 步：测试

右侧实时预览。问几个问题。

第 5 步：发布

点 "Save" → 选发布范围：

Only me（只我自己用）
Anyone with a link（有链接的人能用）
GPT Store（公开发布到商店）

自定义 GPTs 的"超能力"

最厉害的两个能力：

能力 1：Code Interpreter（代码执行）

让 GPT 能"运行 Python 代码"。

实战：

你上传一个 Excel
你说"帮我分析一下这个表"
GPT 自动写 Python 代码，运行，给你图表 + 结论

效果惊人——相当于"内置数据分析师"。

能力 2：Actions（连接外部服务）

让 GPT 能调用别的网站 / 应用。

实战：

接入 Google Calendar → GPT 能看你的日历、订会议
接入 Notion → GPT 能读 / 写你的笔记
接入 Zapier → GPT 能触发任何自动化

要写一些"接口配置"，对普通人略复杂——但有大量现成模板。

12.6 10 个"普通人立刻能搭"的 Agent 创意

下面 10 个 Agent 创意，每个都"5 分钟可搭、立刻有用"。

Agent 1：私人医生顾问

功能：解读体检报告 / 化验单，给生活建议（仅供参考）。

指令核心：

你是一个有 20 年经验的内科医生（仅供参考，不能替代真实诊断）。

工作方式：
1. 用户上传体检报告，你按"红/黄/绿"分类指标
2. 用大白话解释每个指标
3. 给"3 个月生活改善建议"
4. 提醒"哪些必须去医院复查"

红线：
- 不下"诊断"——只说"可能"
- 不开药
- 重大问题必须强调"立刻找医生"

Agent 2：英语口语陪练

功能：每天 15 分钟英语对话练习。

指令核心：

你是一个温柔耐心的英语外教。

工作方式：
1. 用户告诉你今天的"主题"和"水平"
2. 你用对应水平的英语和他对话（每次 1-2 句）
3. 用户说错了，你温柔纠正
4. 每次对话结束，给"今日进步报告"
   - 用了多少个新词
   - 改了多少个语法错
   - 下次的"3 个练习目标"

Agent 3：朋友圈文案生成器

功能：根据你说的事 / 心情 / 场景，生成不油腻的朋友圈文案。

指令核心：见 12.4 节示例。

Agent 4：考前刷题伴侣

功能：根据用户的考试类型 + 弱项，每天出题、批改、给解析。

指令核心：

你是一个 [科目] 专业辅导老师。

工作方式：
1. 第一次见用户，了解：考试类型、当前水平、目标分数、弱项
2. 每天根据弱项出 5 道题
3. 用户做完，批改 + 给详细解析
4. 周末出"模拟卷"
5. 跟踪进步曲线

Agent 5：代码 / 自动化助手

功能：帮非程序员写"小工具脚本"。

指令核心：

你是一个"零基础友好"的 Python 老师。

工作方式：
1. 用户描述他想做什么（用大白话）
2. 你判断"用 Python 怎么做最简单"
3. 给完整脚本（每行注释）
4. 给"安装 + 运行"傻瓜化教程
5. 预测"可能的报错"+ 解决方法

Agent 6：理财顾问（保守派）

功能：根据用户的资产、风险偏好，给定制化理财建议。

指令核心：

你是一个"理性、不画大饼"的理财顾问。

工作方式：
1. 了解用户：年龄、收入、存款、风险偏好、目标
2. 给"4 池子"建议（应急/短期/中期/长期）
3. 推荐"产品类型"（不到具体产品名）
4. 月度复盘建议

红线：
- 不推荐高风险（个股 / 加密 / 外汇）
- 不"all in 指数基金"——给多元化
- 必须强调"风险自担"

Agent 7：育儿顾问

功能：解决日常育儿场景。

指令核心：

你是一个有 15 年经验的儿童心理学家 + 育儿教练。

工作方式：
1. 了解用户家庭：孩子年龄、性格、家庭情况
2. 用户描述具体问题（哭闹、对抗、学习等）
3. 给"立刻能做的话术"+ "长期机制"
4. 提醒"绝对不要做的事"

风格：温暖、专业、不批判。

Agent 8：旅游策划师

功能：根据预算、人数、偏好，给完整旅游攻略。

指令核心：见第七章场景 18，加一句"你是这个目的地的本地达人"。

Agent 9：写作教练

功能：帮用户改文章 / 提升写作能力。

指令核心：

你是一个有 10 年经验的写作教练。

工作方式：
1. 用户贴文章，你做"分级评分"（结构/语言/逻辑/风格）
2. 给 3 个改进点
3. 给"原文 → 改写"对照
4. 出"针对性练习"——下周写什么类型的练
5. 跟踪进步

Agent 10：日程管理 / 时间管理

功能：每日规划 + 复盘。

指令核心：

你是一个高效率的"私人时间管理顾问"。

工作方式：
1. 早上：用户告诉你"今天必须做的 3 件事 + 想做的 5 件事"
你用"四象限法"+"番茄钟"帮他排时间表

2. 中午 / 下午：用户报告进展，你帮调整下午

3. 晚上：复盘
- 完成了什么
- 没完成的为什么
- 明天调整建议

风格：温和督促、不焦虑。

12.6 Agent 的进阶玩法：多 Agent 协作

更高级的玩法是——多个 Agent 互相协作完成任务。

比如：

"营销 Agent" 负责想 idea
"文案 Agent" 负责写文案
"设计 Agent" 负责画图
"评估 Agent" 负责审核

它们组成一个"团队"。

平台：

AutoGen（微软出品）
CrewAI（开源）
MetaGPT（开源）
Coze 多 Agent 编排（国内可用）

普通人不一定要用——但要知道有这种东西。未来的工作方式可能就是"几个 Agent + 你"。

12.7 Agent 的"红线"——千万别让它做的事

红线 1：直接关联钱包 / 银行账号

永远不要让 Agent 直接接入你的银行卡、支付宝、微信支付。

理由：Agent 现在不是 100% 可靠的——一个 bug 可能让它"自己消费"几百几千。

红线 2：替你做"重大决策"

帮你买房 → 不行
帮你辞职 → 不行
帮你回复"重要客户的关键邮件" → 不行（要审）

Agent 帮你"准备"，你做"决定"。

红线 3：让它"自动发"东西

自动发邮件 → 高风险
自动发朋友圈 / 微博 → 高风险
自动发短信 → 高风险

任何"对外发出"的内容，人工审核一次再发。

红线 4：泄露隐私 / 商业机密

不要把"客户名单"上传到公共 Agent 平台
不要把"未公开的财报"丢给 Agent
不要把"个人医疗记录"完整上传

重要数据，找"私有部署"的 Agent（Dify 开源版可自部署）。

12.8 一个完整案例：用 Coze 搭"我妈的体检解读 Bot"

背景

你想给妈妈做一个 Bot——她自己拍体检报告，Bot 自动解读 + 给建议。

步骤

第 1 步：Coze 新建 Bot

名字："妈妈的健康助手"
介绍："拍照看体检报告，自动解读"

第 2 步：人设

你是一个温暖、耐心的"老阿姨健康顾问"。

你的用户：
- 60-70 岁女性
- 不太懂医学术语
- 能看懂大字、不擅长滑屏

工作方式：
1. 用户拍照上传体检报告
2. 你用"大字号"输出（用 markdown 加大标题）
3. 解读用大白话，避免术语
4. 用三种颜色分类（🔴/🟡/🟢）
5. 给"今天就能做的 3 件事"
6. 提醒"红色指标必须找医生"

风格：
- 像邻家阿姨一样亲切
- 不批判（"你怎么吃这么差"等不要说）
- 不焦虑（"必须立刻去医院"等只对真正紧急的说）
- 多鼓励（"您这次比上次进步很多哟"）

红线：
- 不诊断
- 不开药
- 重大问题立刻强调"找医生"

第 3 步：开启工具

✅ 图片识别（看体检报告）
✅ 联网搜索（查指标含义）

第 4 步：（可选）上传知识库

可以上传一些权威健康科普 PDF——比如《中国居民膳食指南》、《老年人健康管理手册》。

第 5 步：测试

用你自己之前的体检报告测试，看 Bot 回答得怎么样。

第 6 步：发布

发布到"微信小程序"——妈妈可以直接在微信里用，不用学新 App。

第 7 步：教妈妈用

录一段 1 分钟视频教她"怎么打开 → 怎么拍照 → 怎么看回答"，发给妈妈。

做完这一切，你做了一件超有意义的事——妈妈以后看体检报告再也不用等你了。

12.9 Agent 时代普通人的"杠杆"

回顾一下，Agent 给普通人带来的"杠杆"是什么：

杠杆 1：做"以前必须有团队才能做的事"

以前你要做一个 App，需要：产品经理、设计师、程序员、测试。现在：你一个人 + Coze + 几个 Agent → 一周一个产品。

杠杆 2：把"重复性工作"自动化

每天的"周报、邮件、纪要、记录"——搭好 Agent 之后，你的工作量减半。

杠杆 3：服务"以前没法服务"的人群

你妈妈、你爸爸、你不会用 App 的亲戚——你给他们搭个"专属 Bot"，他们就能用上 AI。

杠杆 4：把"专业能力"产品化

你是律师 / 医生 / 老师 / 心理咨询师 → 把你的"经验 + 知识库"灌进 Agent → 服务千万人。

杠杆 5：副业 / 创业的低成本启动

你有一个想法 → 不用招团队 / 不用融资 → 用 Agent 搭原型 → 上线 → 看市场反应 → 迭代。

Agent 时代，普通人的"创造门槛"前所未有地低。

本章小抄

AI 智能体（Agent）速查
────────────────

什么是 Agent？
└─ 大模型（脑子）+ 工具（手脚）+ 记忆（笔记本）

vs 对话型 AI：
└─ 对话型："我说，它答"
└─ Agent："我给目标，它干完"

3 类 Agent 平台：
1. 通用：Operator / Manus（你说一句它干一套）
2. 搭建型：Coze / 自定义 GPTs（你来造一个）
3. 嵌入型：钉钉 AI / WPS AI（融入软件）

Agent 三件套搭建：
1. 起名 + 定位
2. 写"指令"（核心！）
3. 启用工具 + 上传知识库
4. 测试 + 发布

10 个普通人 Agent 创意：
1. 私人医生顾问  2. 英语口语陪练
3. 朋友圈文案生成器  4. 考前刷题伴侣
5. 代码助手  6. 理财顾问
7. 育儿顾问  8. 旅游策划师
9. 写作教练  10. 时间管理

4 大红线：
1. 不接入支付
2. 不替做重大决策
3. 不自动发东西
4. 不泄露隐私

Agent 时代的杠杆：
- 一个人=一个团队
- 重复工作自动化
- 服务"以前没法服务"的人
- 把"经验"产品化
- 低成本启动副业

5 分钟动手实验

任务：今天就搭一个真正属于你的 Agent。

步骤：

打开 Coze（扣子），注册账号
从 12.6 节的 10 个创意里挑一个最有用的
新建 Bot，按本章实战流程：
- 起名 + 介绍
- 写"人设与回复逻辑"（核心！）
- 启用必要工具
- 测试
测试 5 轮——感觉不对就改"人设"
发布——可以选"只有自己用"或"分享给朋友"
下载到手机 → 加到桌面 → 当成常用 App

完成这个实验，你已经从"AI 用户"升级为"AI 创造者"。

下章预告

下一章第十三章多个 AI 协同，进入"AI 工作流"——把多个 AI 工具串联起来，让它们"接力工作"：

不同任务用不同 AI（写作用 Claude、推理用 DeepSeek、画图用 MJ）
串联工作流：从输入到输出全自动
AI 接入桌面 / 手机：让 AI 时刻在身边
"我的 AI 操作系统"——把 AI 真正融入你的日常

学完，你会像高手一样使用 AI。

第十二章 AI 智能体（Agent）——从用户到创造者

12.1 一个比喻：从"问答机"到"小蜜"

12.2 Agent 的"三件套"

12.3 现在普通人能用的 Agent

类型一：通用 Agent（你说一句，它干一套）

类型二：搭建型 Agent（你来"造"一个）

类型三：嵌入型 Agent（融入你常用的软件）

12.4 实战：5 分钟搭你的第一个 Agent（用 Coze 扣子）

第 0 步：准备

第 1 步：新建 Bot

第 2 步：写"人设与回复逻辑"（最关键）

第 3 步：（可选）启用工具

第 4 步：（可选）上传知识库

第 5 步：测试

第 6 步：发布

12.5 实战：用 ChatGPT 的"自定义 GPTs"

第 0 步：确认你有 ChatGPT Plus

第 1 步：进入 GPT 编辑器

第 2 步：和 GPT Builder 对话

第 3 步：调"Configure"（更精细）

第 4 步：测试

第 5 步：发布

自定义 GPTs 的"超能力"

能力 1：Code Interpreter（代码执行）

能力 2：Actions（连接外部服务）

12.6 10 个"普通人立刻能搭"的 Agent 创意

Agent 1：私人医生顾问

Agent 2：英语口语陪练

Agent 3：朋友圈文案生成器

Agent 4：考前刷题伴侣

Agent 5：代码 / 自动化助手

Agent 6：理财顾问（保守派）

Agent 7：育儿顾问

Agent 8：旅游策划师

Agent 9：写作教练

Agent 10：日程管理 / 时间管理

12.6 Agent 的进阶玩法：多 Agent 协作

12.7 Agent 的"红线"——千万别让它做的事

红线 1：直接关联钱包 / 银行账号

红线 2：替你做"重大决策"

红线 3：让它"自动发"东西

红线 4：泄露隐私 / 商业机密

12.8 一个完整案例：用 Coze 搭"我妈的体检解读 Bot"

背景

步骤

12.9 Agent 时代普通人的"杠杆"

杠杆 1：做"以前必须有团队才能做的事"

杠杆 2：把"重复性工作"自动化

杠杆 3：服务"以前没法服务"的人群

杠杆 4：把"专业能力"产品化

杠杆 5：副业 / 创业的低成本启动

本章小抄

5 分钟动手实验

下章预告