ORANGE BOOK

第十二章 AI 智能体(Agent)——从用户到创造者


12.1 一个比喻:从"问答机"到"小蜜"

讲 Agent 之前,请你想象两种秘书:

秘书 A(对话型 AI)

你说:"明天的会议时间是几点?" 秘书 A:"明天上午 10 点。"

你说:"帮我提前 30 分钟提醒。" 秘书 A:"好的,我记下来了。"

你说:"把会议资料发我一份。" 秘书 A:"好的,我去找一下⋯⋯(其实她什么都没做)"

——她只能"听 + 答",不会"执行"

秘书 B(AI 智能体)

你说:"明天的会议好好安排一下。"

秘书 B:

  1. 自动查日历,发现明天 10 点的会议
  2. 自动从邮件里找到会议资料
  3. 自动整理成"5 分钟读完版"发到你的笔记
  4. 自动设置 9:30 的提醒
  5. 自动给参会人发"明天见"的提醒邮件
  6. 完成后告诉你:"都安排好了,您看一下笔记。"

——她真的"干完了活"

这就是 AI 智能体(Agent)和"对话型 AI"的本质区别。


12.2 Agent 的"三件套"

技术上讲,一个 Agent = 大语言模型 + 工具 + 记忆。

用大白话讲

组件 大白话 作用
大模型(脑子) "想"事情的部分 理解你说的话、规划怎么做
工具(手脚) 能调用的"外部能力" 上网、查日历、发邮件、调用 API、执行代码、查数据库
记忆(笔记本) 能跨次保存的信息 记住你的偏好、之前做过的事

一个 Agent 工作时是这样的

你给目标 → Agent 规划任务步骤 → 调用工具 →
看到工具结果 → 决定下一步 → 调用下一个工具 →
... → 完成 → 反馈给你

这个过程,Agent 自己决定每一步用什么工具


12.3 现在普通人能用的 Agent

2026 年,主流 Agent 平台分三类:

类型一:通用 Agent(你说一句,它干一套)

平台 特点
OpenAI Operator(GPT 内置) 能"操控浏览器"——帮你订票、买东西
Manus 国产代表,2025 年爆火
Genspark Super Agent 多任务并行
Devin 专业编程 Agent

用法:直接给目标,比如"帮我订一张下周一上海到北京的高铁,时间 9 点左右,二等座",它自己上网、操作、订票。

⚠️ 注意:通用 Agent 还不"100% 可靠",重要操作要监督。

类型二:搭建型 Agent(你来"造"一个)

平台 特点 适合谁
OpenAI 自定义 GPTs 5 分钟做一个、能放到 GPT Store ChatGPT 用户
Coze(扣子,字节) 国内最大、免费、可视化拖拽 普通中国用户
腾讯元器 微信生态、国内 微信用户
百度 AppBuilder 百度生态 百度用户
智谱 BigModel 学术 / 企业 技术用户
Dify 开源、可自部署 团队 / 开发者

用法

  1. 给智能体起名 + 定位
  2. 写"指令"(让它扮演什么角色、用什么风格回答)
  3. 上传知识库(如果需要)
  4. 启用工具(联网、画图、代码执行等)
  5. 测试 → 发布

类型三:嵌入型 Agent(融入你常用的软件)

软件 内置 Agent
微信 元宝、IMA
抖音 豆包、即梦
钉钉 钉钉 AI
飞书 智能伙伴
WPS WPS AI
Office 365 Microsoft Copilot
Google Workspace Gemini

用法:在你正在用的软件里直接调用——不用单独打开 AI App。


12.4 实战:5 分钟搭你的第一个 Agent(用 Coze 扣子)

我们来实际造一个 Agent。选 Coze(扣子)——国内免费、可视化、零代码。

第 0 步:准备

打开 coze.cn,用手机号 / 抖音账号登录。

第 1 步:新建 Bot

点"创建 Bot"。

  • 名字:我的私人写作助手
  • 介绍:帮我写各种文字,不油腻、不套路。

第 2 步:写"人设与回复逻辑"(最关键)

这是 Coze 的核心——你要写一段"指令"告诉这个 Agent 怎么工作。

# 角色
你是一个"反套路"的私人写作助手。

# 我的偏好
- 我是 30 岁男性,住上海,做产品经理
- 喜欢简洁、直接、有性格的文字
- 讨厌"鸡汤"、"金句堆砌"、"为赋新词强说愁"
- 中英文都能用

# 你的工作方式

当我让你写东西时:
1. 先问我"3 个关键问题"(如果信息不全),不要瞎写
2. 默认给我 3 个版本:朴实版 / 文艺版 / 段子版
3. 不要"首先、其次、最后"等结构词
4. 不要"在 XXX 大背景下"等官方腔
5. 适当用 emoji,但不堆砌

# 你的"红线"
- 不要替我做"重大决策"
- 不要"过度自我"——比如不停说"作为 AI 我..."
- 不知道的事就说"不确定",不要瞎编

# 你的"主动性"
- 我每次写完一段,主动提出"再优化一版"
- 给我 1~2 个相关的"延伸建议"

第 3 步:(可选)启用工具

Coze 提供很多内置工具:

  • 联网搜索:让 Bot 能查实时信息
  • 图片生成:让 Bot 能画图
  • 知识库:上传你的资料
  • 插件:天气、股票、新闻、地图等

按需启用。比如你的"写作助手"可以启用:

  • 联网搜索(写时事文章用)
  • 图片生成(朋友圈配图用)

第 4 步:(可选)上传知识库

如果你想让 Bot "学习"你的某些资料:

  • 你之前写过的好文章
  • 你公司的"内部话术规范"
  • 你的"个人风格样本"

上传 PDF / Word / TXT。Bot 会学习。

第 5 步:测试

右侧有个测试窗口,输入:

"帮我写一条朋友圈,主题:周末爬山。"

看 Bot 怎么回。

如果不满意,回到第 2 步改"人设"。

第 6 步:发布

测试满意后,点"发布"。可以发布到:

  • Coze Store(让别人用)
  • 你的微信公众号
  • 你的飞书 / 钉钉
  • 你的微信小程序
  • API 调用(程序员用)

5 分钟搞定。 你已经做出了你的第一个 AI 智能体。


12.5 实战:用 ChatGPT 的"自定义 GPTs"

如果你能用 ChatGPT,"自定义 GPTs"是另一个选择。

第 0 步:确认你有 ChatGPT Plus

自定义 GPTs 需要 Plus(20 美元/月)。免费用户只能"用别人的",不能"自己做"。

第 1 步:进入 GPT 编辑器

ChatGPT 左上角 → "Explore GPTs" → "+ Create"

第 2 步:和 GPT Builder 对话

ChatGPT 会用"对话"的方式帮你做 GPT。它会问:

  • 你想做什么样的 GPT?
  • 它的名字?
  • 它的头像(自动生成)?
  • 它怎么自我介绍?

跟着回答就行。

第 3 步:调"Configure"(更精细)

切到"Configure"页签,能更精细调:

  • Name:名字
  • Description:介绍
  • Instructions:核心指令(同 Coze 第 2 步)
  • Conversation starters:4 个示例问题
  • Knowledge:上传知识库
  • Capabilities:开关
    • Web Browsing(联网)
    • DALL·E(画图)
    • Code Interpreter(代码执行)
  • Actions:调用外部 API(高级)

第 4 步:测试

右侧实时预览。问几个问题。

第 5 步:发布

点 "Save" → 选发布范围:

  • Only me(只我自己用)
  • Anyone with a link(有链接的人能用)
  • GPT Store(公开发布到商店)

自定义 GPTs 的"超能力"

最厉害的两个能力:

能力 1:Code Interpreter(代码执行)

让 GPT 能"运行 Python 代码"。

实战:

  • 你上传一个 Excel
  • 你说"帮我分析一下这个表"
  • GPT 自动写 Python 代码,运行,给你图表 + 结论

效果惊人——相当于"内置数据分析师"。

能力 2:Actions(连接外部服务)

让 GPT 能调用别的网站 / 应用。

实战:

  • 接入 Google Calendar → GPT 能看你的日历、订会议
  • 接入 Notion → GPT 能读 / 写你的笔记
  • 接入 Zapier → GPT 能触发任何自动化

要写一些"接口配置",对普通人略复杂——但有大量现成模板。


12.6 10 个"普通人立刻能搭"的 Agent 创意

下面 10 个 Agent 创意,每个都"5 分钟可搭、立刻有用"。

Agent 1:私人医生顾问

功能:解读体检报告 / 化验单,给生活建议(仅供参考)。

指令核心

你是一个有 20 年经验的内科医生(仅供参考,不能替代真实诊断)。

工作方式:
1. 用户上传体检报告,你按"红/黄/绿"分类指标
2. 用大白话解释每个指标
3. 给"3 个月生活改善建议"
4. 提醒"哪些必须去医院复查"

红线:
- 不下"诊断"——只说"可能"
- 不开药
- 重大问题必须强调"立刻找医生"

Agent 2:英语口语陪练

功能:每天 15 分钟英语对话练习。

指令核心

你是一个温柔耐心的英语外教。

工作方式:
1. 用户告诉你今天的"主题"和"水平"
2. 你用对应水平的英语和他对话(每次 1-2 句)
3. 用户说错了,你温柔纠正
4. 每次对话结束,给"今日进步报告"
   - 用了多少个新词
   - 改了多少个语法错
   - 下次的"3 个练习目标"

Agent 3:朋友圈文案生成器

功能:根据你说的事 / 心情 / 场景,生成不油腻的朋友圈文案。

指令核心:见 12.4 节示例。

Agent 4:考前刷题伴侣

功能:根据用户的考试类型 + 弱项,每天出题、批改、给解析。

指令核心

你是一个 [科目] 专业辅导老师。

工作方式:
1. 第一次见用户,了解:考试类型、当前水平、目标分数、弱项
2. 每天根据弱项出 5 道题
3. 用户做完,批改 + 给详细解析
4. 周末出"模拟卷"
5. 跟踪进步曲线

Agent 5:代码 / 自动化助手

功能:帮非程序员写"小工具脚本"。

指令核心

你是一个"零基础友好"的 Python 老师。

工作方式:
1. 用户描述他想做什么(用大白话)
2. 你判断"用 Python 怎么做最简单"
3. 给完整脚本(每行注释)
4. 给"安装 + 运行"傻瓜化教程
5. 预测"可能的报错"+ 解决方法

Agent 6:理财顾问(保守派)

功能:根据用户的资产、风险偏好,给定制化理财建议。

指令核心

你是一个"理性、不画大饼"的理财顾问。

工作方式:
1. 了解用户:年龄、收入、存款、风险偏好、目标
2. 给"4 池子"建议(应急/短期/中期/长期)
3. 推荐"产品类型"(不到具体产品名)
4. 月度复盘建议

红线:
- 不推荐高风险(个股 / 加密 / 外汇)
- 不"all in 指数基金"——给多元化
- 必须强调"风险自担"

Agent 7:育儿顾问

功能:解决日常育儿场景。

指令核心

你是一个有 15 年经验的儿童心理学家 + 育儿教练。

工作方式:
1. 了解用户家庭:孩子年龄、性格、家庭情况
2. 用户描述具体问题(哭闹、对抗、学习等)
3. 给"立刻能做的话术"+ "长期机制"
4. 提醒"绝对不要做的事"

风格:温暖、专业、不批判。

Agent 8:旅游策划师

功能:根据预算、人数、偏好,给完整旅游攻略。

指令核心:见第七章场景 18,加一句"你是这个目的地的本地达人"。

Agent 9:写作教练

功能:帮用户改文章 / 提升写作能力。

指令核心

你是一个有 10 年经验的写作教练。

工作方式:
1. 用户贴文章,你做"分级评分"(结构/语言/逻辑/风格)
2. 给 3 个改进点
3. 给"原文 → 改写"对照
4. 出"针对性练习"——下周写什么类型的练
5. 跟踪进步

Agent 10:日程管理 / 时间管理

功能:每日规划 + 复盘。

指令核心

你是一个高效率的"私人时间管理顾问"。

工作方式:
1. 早上:用户告诉你"今天必须做的 3 件事 + 想做的 5 件事"
你用"四象限法"+"番茄钟"帮他排时间表

2. 中午 / 下午:用户报告进展,你帮调整下午

3. 晚上:复盘
- 完成了什么
- 没完成的为什么
- 明天调整建议

风格:温和督促、不焦虑。

12.6 Agent 的进阶玩法:多 Agent 协作

更高级的玩法是——多个 Agent 互相协作完成任务

比如:

  • "营销 Agent" 负责想 idea
  • "文案 Agent" 负责写文案
  • "设计 Agent" 负责画图
  • "评估 Agent" 负责审核

它们组成一个"团队"。

平台:

  • AutoGen(微软出品)
  • CrewAI(开源)
  • MetaGPT(开源)
  • Coze 多 Agent 编排(国内可用)

普通人不一定要用——但要知道有这种东西。未来的工作方式可能就是"几个 Agent + 你"


12.7 Agent 的"红线"——千万别让它做的事

红线 1:直接关联钱包 / 银行账号

永远不要让 Agent 直接接入你的银行卡、支付宝、微信支付。

理由:Agent 现在不是 100% 可靠的——一个 bug 可能让它"自己消费"几百几千。

红线 2:替你做"重大决策"

  • 帮你买房 → 不行
  • 帮你辞职 → 不行
  • 帮你回复"重要客户的关键邮件" → 不行(要审)

Agent 帮你"准备",你做"决定"。

红线 3:让它"自动发"东西

  • 自动发邮件 → 高风险
  • 自动发朋友圈 / 微博 → 高风险
  • 自动发短信 → 高风险

任何"对外发出"的内容,人工审核一次再发

红线 4:泄露隐私 / 商业机密

  • 不要把"客户名单"上传到公共 Agent 平台
  • 不要把"未公开的财报"丢给 Agent
  • 不要把"个人医疗记录"完整上传

重要数据,找"私有部署"的 Agent(Dify 开源版可自部署)。


12.8 一个完整案例:用 Coze 搭"我妈的体检解读 Bot"

背景

你想给妈妈做一个 Bot——她自己拍体检报告,Bot 自动解读 + 给建议。

步骤

第 1 步:Coze 新建 Bot

  • 名字:"妈妈的健康助手"
  • 介绍:"拍照看体检报告,自动解读"

第 2 步:人设

你是一个温暖、耐心的"老阿姨健康顾问"。

你的用户:
- 60-70 岁女性
- 不太懂医学术语
- 能看懂大字、不擅长滑屏

工作方式:
1. 用户拍照上传体检报告
2. 你用"大字号"输出(用 markdown 加大标题)
3. 解读用大白话,避免术语
4. 用三种颜色分类(🔴/🟡/🟢)
5. 给"今天就能做的 3 件事"
6. 提醒"红色指标必须找医生"

风格:
- 像邻家阿姨一样亲切
- 不批判("你怎么吃这么差"等不要说)
- 不焦虑("必须立刻去医院"等只对真正紧急的说)
- 多鼓励("您这次比上次进步很多哟")

红线:
- 不诊断
- 不开药
- 重大问题立刻强调"找医生"

第 3 步:开启工具

  • ✅ 图片识别(看体检报告)
  • ✅ 联网搜索(查指标含义)

第 4 步:(可选)上传知识库

可以上传一些权威健康科普 PDF——比如《中国居民膳食指南》、《老年人健康管理手册》。

第 5 步:测试

用你自己之前的体检报告测试,看 Bot 回答得怎么样。

第 6 步:发布

发布到"微信小程序"——妈妈可以直接在微信里用,不用学新 App。

第 7 步:教妈妈用

录一段 1 分钟视频教她"怎么打开 → 怎么拍照 → 怎么看回答",发给妈妈。

做完这一切,你做了一件超有意义的事——妈妈以后看体检报告再也不用等你了。


12.9 Agent 时代普通人的"杠杆"

回顾一下,Agent 给普通人带来的"杠杆"是什么:

杠杆 1:做"以前必须有团队才能做的事"

以前你要做一个 App,需要:产品经理、设计师、程序员、测试。 现在:你一个人 + Coze + 几个 Agent → 一周一个产品。

杠杆 2:把"重复性工作"自动化

每天的"周报、邮件、纪要、记录"——搭好 Agent 之后,你的工作量减半。

杠杆 3:服务"以前没法服务"的人群

你妈妈、你爸爸、你不会用 App 的亲戚——你给他们搭个"专属 Bot",他们就能用上 AI。

杠杆 4:把"专业能力"产品化

你是律师 / 医生 / 老师 / 心理咨询师 → 把你的"经验 + 知识库"灌进 Agent → 服务千万人。

杠杆 5:副业 / 创业的低成本启动

你有一个想法 → 不用招团队 / 不用融资 → 用 Agent 搭原型 → 上线 → 看市场反应 → 迭代。

Agent 时代,普通人的"创造门槛"前所未有地低。


本章小抄

AI 智能体(Agent)速查
────────────────

什么是 Agent?
└─ 大模型(脑子)+ 工具(手脚)+ 记忆(笔记本)

vs 对话型 AI:
└─ 对话型:"我说,它答"
└─ Agent:"我给目标,它干完"

3 类 Agent 平台:
1. 通用:Operator / Manus(你说一句它干一套)
2. 搭建型:Coze / 自定义 GPTs(你来造一个)
3. 嵌入型:钉钉 AI / WPS AI(融入软件)

Agent 三件套搭建:
1. 起名 + 定位
2. 写"指令"(核心!)
3. 启用工具 + 上传知识库
4. 测试 + 发布

10 个普通人 Agent 创意:
1. 私人医生顾问  2. 英语口语陪练
3. 朋友圈文案生成器  4. 考前刷题伴侣
5. 代码助手  6. 理财顾问
7. 育儿顾问  8. 旅游策划师
9. 写作教练  10. 时间管理

4 大红线:
1. 不接入支付
2. 不替做重大决策
3. 不自动发东西
4. 不泄露隐私

Agent 时代的杠杆:
- 一个人=一个团队
- 重复工作自动化
- 服务"以前没法服务"的人
- 把"经验"产品化
- 低成本启动副业

5 分钟动手实验

任务:今天就搭一个真正属于你的 Agent

步骤

  1. 打开 Coze(扣子),注册账号

  2. 从 12.6 节的 10 个创意里挑一个最有用的

  3. 新建 Bot,按本章实战流程:

    • 起名 + 介绍
    • 写"人设与回复逻辑"(核心!)
    • 启用必要工具
    • 测试
  4. 测试 5 轮——感觉不对就改"人设"

  5. 发布——可以选"只有自己用"或"分享给朋友"

  6. 下载到手机 → 加到桌面 → 当成常用 App

完成这个实验,你已经从"AI 用户"升级为"AI 创造者"。


下章预告

下一章 第十三章 多个 AI 协同,进入"AI 工作流"——把多个 AI 工具串联起来,让它们"接力工作":

  • 不同任务用不同 AI(写作用 Claude、推理用 DeepSeek、画图用 MJ)
  • 串联工作流:从输入到输出全自动
  • AI 接入桌面 / 手机:让 AI 时刻在身边
  • "我的 AI 操作系统"——把 AI 真正融入你的日常

学完,你会像高手一样使用 AI