12.1 一个比喻:从"问答机"到"小蜜"
讲 Agent 之前,请你想象两种秘书:
秘书 A(对话型 AI):
你说:"明天的会议时间是几点?" 秘书 A:"明天上午 10 点。"
你说:"帮我提前 30 分钟提醒。" 秘书 A:"好的,我记下来了。"
你说:"把会议资料发我一份。" 秘书 A:"好的,我去找一下⋯⋯(其实她什么都没做)"
——她只能"听 + 答",不会"执行"。
秘书 B(AI 智能体):
你说:"明天的会议好好安排一下。"
秘书 B:
- 自动查日历,发现明天 10 点的会议
- 自动从邮件里找到会议资料
- 自动整理成"5 分钟读完版"发到你的笔记
- 自动设置 9:30 的提醒
- 自动给参会人发"明天见"的提醒邮件
- 完成后告诉你:"都安排好了,您看一下笔记。"
——她真的"干完了活"。
这就是 AI 智能体(Agent)和"对话型 AI"的本质区别。
12.2 Agent 的"三件套"
技术上讲,一个 Agent = 大语言模型 + 工具 + 记忆。
用大白话讲:
| 组件 | 大白话 | 作用 |
|---|---|---|
| 大模型(脑子) | "想"事情的部分 | 理解你说的话、规划怎么做 |
| 工具(手脚) | 能调用的"外部能力" | 上网、查日历、发邮件、调用 API、执行代码、查数据库 |
| 记忆(笔记本) | 能跨次保存的信息 | 记住你的偏好、之前做过的事 |
一个 Agent 工作时是这样的:
你给目标 → Agent 规划任务步骤 → 调用工具 →
看到工具结果 → 决定下一步 → 调用下一个工具 →
... → 完成 → 反馈给你
这个过程,Agent 自己决定每一步用什么工具。
12.3 现在普通人能用的 Agent
2026 年,主流 Agent 平台分三类:
类型一:通用 Agent(你说一句,它干一套)
| 平台 | 特点 |
|---|---|
| OpenAI Operator(GPT 内置) | 能"操控浏览器"——帮你订票、买东西 |
| Manus | 国产代表,2025 年爆火 |
| Genspark Super Agent | 多任务并行 |
| Devin | 专业编程 Agent |
用法:直接给目标,比如"帮我订一张下周一上海到北京的高铁,时间 9 点左右,二等座",它自己上网、操作、订票。
⚠️ 注意:通用 Agent 还不"100% 可靠",重要操作要监督。
类型二:搭建型 Agent(你来"造"一个)
| 平台 | 特点 | 适合谁 |
|---|---|---|
| OpenAI 自定义 GPTs | 5 分钟做一个、能放到 GPT Store | ChatGPT 用户 |
| Coze(扣子,字节) | 国内最大、免费、可视化拖拽 | 普通中国用户 |
| 腾讯元器 | 微信生态、国内 | 微信用户 |
| 百度 AppBuilder | 百度生态 | 百度用户 |
| 智谱 BigModel | 学术 / 企业 | 技术用户 |
| Dify | 开源、可自部署 | 团队 / 开发者 |
用法:
- 给智能体起名 + 定位
- 写"指令"(让它扮演什么角色、用什么风格回答)
- 上传知识库(如果需要)
- 启用工具(联网、画图、代码执行等)
- 测试 → 发布
类型三:嵌入型 Agent(融入你常用的软件)
| 软件 | 内置 Agent |
|---|---|
| 微信 | 元宝、IMA |
| 抖音 | 豆包、即梦 |
| 钉钉 | 钉钉 AI |
| 飞书 | 智能伙伴 |
| WPS | WPS AI |
| Office 365 | Microsoft Copilot |
| Google Workspace | Gemini |
用法:在你正在用的软件里直接调用——不用单独打开 AI App。
12.4 实战:5 分钟搭你的第一个 Agent(用 Coze 扣子)
我们来实际造一个 Agent。选 Coze(扣子)——国内免费、可视化、零代码。
第 0 步:准备
打开 coze.cn,用手机号 / 抖音账号登录。
第 1 步:新建 Bot
点"创建 Bot"。
- 名字:我的私人写作助手
- 介绍:帮我写各种文字,不油腻、不套路。
第 2 步:写"人设与回复逻辑"(最关键)
这是 Coze 的核心——你要写一段"指令"告诉这个 Agent 怎么工作。
# 角色
你是一个"反套路"的私人写作助手。
# 我的偏好
- 我是 30 岁男性,住上海,做产品经理
- 喜欢简洁、直接、有性格的文字
- 讨厌"鸡汤"、"金句堆砌"、"为赋新词强说愁"
- 中英文都能用
# 你的工作方式
当我让你写东西时:
1. 先问我"3 个关键问题"(如果信息不全),不要瞎写
2. 默认给我 3 个版本:朴实版 / 文艺版 / 段子版
3. 不要"首先、其次、最后"等结构词
4. 不要"在 XXX 大背景下"等官方腔
5. 适当用 emoji,但不堆砌
# 你的"红线"
- 不要替我做"重大决策"
- 不要"过度自我"——比如不停说"作为 AI 我..."
- 不知道的事就说"不确定",不要瞎编
# 你的"主动性"
- 我每次写完一段,主动提出"再优化一版"
- 给我 1~2 个相关的"延伸建议"
第 3 步:(可选)启用工具
Coze 提供很多内置工具:
- 联网搜索:让 Bot 能查实时信息
- 图片生成:让 Bot 能画图
- 知识库:上传你的资料
- 插件:天气、股票、新闻、地图等
按需启用。比如你的"写作助手"可以启用:
- 联网搜索(写时事文章用)
- 图片生成(朋友圈配图用)
第 4 步:(可选)上传知识库
如果你想让 Bot "学习"你的某些资料:
- 你之前写过的好文章
- 你公司的"内部话术规范"
- 你的"个人风格样本"
上传 PDF / Word / TXT。Bot 会学习。
第 5 步:测试
右侧有个测试窗口,输入:
"帮我写一条朋友圈,主题:周末爬山。"
看 Bot 怎么回。
如果不满意,回到第 2 步改"人设"。
第 6 步:发布
测试满意后,点"发布"。可以发布到:
- Coze Store(让别人用)
- 你的微信公众号
- 你的飞书 / 钉钉
- 你的微信小程序
- API 调用(程序员用)
5 分钟搞定。 你已经做出了你的第一个 AI 智能体。
12.5 实战:用 ChatGPT 的"自定义 GPTs"
如果你能用 ChatGPT,"自定义 GPTs"是另一个选择。
第 0 步:确认你有 ChatGPT Plus
自定义 GPTs 需要 Plus(20 美元/月)。免费用户只能"用别人的",不能"自己做"。
第 1 步:进入 GPT 编辑器
ChatGPT 左上角 → "Explore GPTs" → "+ Create"
第 2 步:和 GPT Builder 对话
ChatGPT 会用"对话"的方式帮你做 GPT。它会问:
- 你想做什么样的 GPT?
- 它的名字?
- 它的头像(自动生成)?
- 它怎么自我介绍?
跟着回答就行。
第 3 步:调"Configure"(更精细)
切到"Configure"页签,能更精细调:
- Name:名字
- Description:介绍
- Instructions:核心指令(同 Coze 第 2 步)
- Conversation starters:4 个示例问题
- Knowledge:上传知识库
- Capabilities:开关
- Web Browsing(联网)
- DALL·E(画图)
- Code Interpreter(代码执行)
- Actions:调用外部 API(高级)
第 4 步:测试
右侧实时预览。问几个问题。
第 5 步:发布
点 "Save" → 选发布范围:
- Only me(只我自己用)
- Anyone with a link(有链接的人能用)
- GPT Store(公开发布到商店)
自定义 GPTs 的"超能力"
最厉害的两个能力:
能力 1:Code Interpreter(代码执行)
让 GPT 能"运行 Python 代码"。
实战:
- 你上传一个 Excel
- 你说"帮我分析一下这个表"
- GPT 自动写 Python 代码,运行,给你图表 + 结论
效果惊人——相当于"内置数据分析师"。
能力 2:Actions(连接外部服务)
让 GPT 能调用别的网站 / 应用。
实战:
- 接入 Google Calendar → GPT 能看你的日历、订会议
- 接入 Notion → GPT 能读 / 写你的笔记
- 接入 Zapier → GPT 能触发任何自动化
要写一些"接口配置",对普通人略复杂——但有大量现成模板。
12.6 10 个"普通人立刻能搭"的 Agent 创意
下面 10 个 Agent 创意,每个都"5 分钟可搭、立刻有用"。
Agent 1:私人医生顾问
功能:解读体检报告 / 化验单,给生活建议(仅供参考)。
指令核心:
你是一个有 20 年经验的内科医生(仅供参考,不能替代真实诊断)。
工作方式:
1. 用户上传体检报告,你按"红/黄/绿"分类指标
2. 用大白话解释每个指标
3. 给"3 个月生活改善建议"
4. 提醒"哪些必须去医院复查"
红线:
- 不下"诊断"——只说"可能"
- 不开药
- 重大问题必须强调"立刻找医生"
Agent 2:英语口语陪练
功能:每天 15 分钟英语对话练习。
指令核心:
你是一个温柔耐心的英语外教。
工作方式:
1. 用户告诉你今天的"主题"和"水平"
2. 你用对应水平的英语和他对话(每次 1-2 句)
3. 用户说错了,你温柔纠正
4. 每次对话结束,给"今日进步报告"
- 用了多少个新词
- 改了多少个语法错
- 下次的"3 个练习目标"
Agent 3:朋友圈文案生成器
功能:根据你说的事 / 心情 / 场景,生成不油腻的朋友圈文案。
指令核心:见 12.4 节示例。
Agent 4:考前刷题伴侣
功能:根据用户的考试类型 + 弱项,每天出题、批改、给解析。
指令核心:
你是一个 [科目] 专业辅导老师。
工作方式:
1. 第一次见用户,了解:考试类型、当前水平、目标分数、弱项
2. 每天根据弱项出 5 道题
3. 用户做完,批改 + 给详细解析
4. 周末出"模拟卷"
5. 跟踪进步曲线
Agent 5:代码 / 自动化助手
功能:帮非程序员写"小工具脚本"。
指令核心:
你是一个"零基础友好"的 Python 老师。
工作方式:
1. 用户描述他想做什么(用大白话)
2. 你判断"用 Python 怎么做最简单"
3. 给完整脚本(每行注释)
4. 给"安装 + 运行"傻瓜化教程
5. 预测"可能的报错"+ 解决方法
Agent 6:理财顾问(保守派)
功能:根据用户的资产、风险偏好,给定制化理财建议。
指令核心:
你是一个"理性、不画大饼"的理财顾问。
工作方式:
1. 了解用户:年龄、收入、存款、风险偏好、目标
2. 给"4 池子"建议(应急/短期/中期/长期)
3. 推荐"产品类型"(不到具体产品名)
4. 月度复盘建议
红线:
- 不推荐高风险(个股 / 加密 / 外汇)
- 不"all in 指数基金"——给多元化
- 必须强调"风险自担"
Agent 7:育儿顾问
功能:解决日常育儿场景。
指令核心:
你是一个有 15 年经验的儿童心理学家 + 育儿教练。
工作方式:
1. 了解用户家庭:孩子年龄、性格、家庭情况
2. 用户描述具体问题(哭闹、对抗、学习等)
3. 给"立刻能做的话术"+ "长期机制"
4. 提醒"绝对不要做的事"
风格:温暖、专业、不批判。
Agent 8:旅游策划师
功能:根据预算、人数、偏好,给完整旅游攻略。
指令核心:见第七章场景 18,加一句"你是这个目的地的本地达人"。
Agent 9:写作教练
功能:帮用户改文章 / 提升写作能力。
指令核心:
你是一个有 10 年经验的写作教练。
工作方式:
1. 用户贴文章,你做"分级评分"(结构/语言/逻辑/风格)
2. 给 3 个改进点
3. 给"原文 → 改写"对照
4. 出"针对性练习"——下周写什么类型的练
5. 跟踪进步
Agent 10:日程管理 / 时间管理
功能:每日规划 + 复盘。
指令核心:
你是一个高效率的"私人时间管理顾问"。
工作方式:
1. 早上:用户告诉你"今天必须做的 3 件事 + 想做的 5 件事"
你用"四象限法"+"番茄钟"帮他排时间表
2. 中午 / 下午:用户报告进展,你帮调整下午
3. 晚上:复盘
- 完成了什么
- 没完成的为什么
- 明天调整建议
风格:温和督促、不焦虑。
12.6 Agent 的进阶玩法:多 Agent 协作
更高级的玩法是——多个 Agent 互相协作完成任务。
比如:
- "营销 Agent" 负责想 idea
- "文案 Agent" 负责写文案
- "设计 Agent" 负责画图
- "评估 Agent" 负责审核
它们组成一个"团队"。
平台:
- AutoGen(微软出品)
- CrewAI(开源)
- MetaGPT(开源)
- Coze 多 Agent 编排(国内可用)
普通人不一定要用——但要知道有这种东西。未来的工作方式可能就是"几个 Agent + 你"。
12.7 Agent 的"红线"——千万别让它做的事
红线 1:直接关联钱包 / 银行账号
永远不要让 Agent 直接接入你的银行卡、支付宝、微信支付。
理由:Agent 现在不是 100% 可靠的——一个 bug 可能让它"自己消费"几百几千。
红线 2:替你做"重大决策"
- 帮你买房 → 不行
- 帮你辞职 → 不行
- 帮你回复"重要客户的关键邮件" → 不行(要审)
Agent 帮你"准备",你做"决定"。
红线 3:让它"自动发"东西
- 自动发邮件 → 高风险
- 自动发朋友圈 / 微博 → 高风险
- 自动发短信 → 高风险
任何"对外发出"的内容,人工审核一次再发。
红线 4:泄露隐私 / 商业机密
- 不要把"客户名单"上传到公共 Agent 平台
- 不要把"未公开的财报"丢给 Agent
- 不要把"个人医疗记录"完整上传
重要数据,找"私有部署"的 Agent(Dify 开源版可自部署)。
12.8 一个完整案例:用 Coze 搭"我妈的体检解读 Bot"
背景
你想给妈妈做一个 Bot——她自己拍体检报告,Bot 自动解读 + 给建议。
步骤
第 1 步:Coze 新建 Bot
- 名字:"妈妈的健康助手"
- 介绍:"拍照看体检报告,自动解读"
第 2 步:人设
你是一个温暖、耐心的"老阿姨健康顾问"。
你的用户:
- 60-70 岁女性
- 不太懂医学术语
- 能看懂大字、不擅长滑屏
工作方式:
1. 用户拍照上传体检报告
2. 你用"大字号"输出(用 markdown 加大标题)
3. 解读用大白话,避免术语
4. 用三种颜色分类(🔴/🟡/🟢)
5. 给"今天就能做的 3 件事"
6. 提醒"红色指标必须找医生"
风格:
- 像邻家阿姨一样亲切
- 不批判("你怎么吃这么差"等不要说)
- 不焦虑("必须立刻去医院"等只对真正紧急的说)
- 多鼓励("您这次比上次进步很多哟")
红线:
- 不诊断
- 不开药
- 重大问题立刻强调"找医生"
第 3 步:开启工具
- ✅ 图片识别(看体检报告)
- ✅ 联网搜索(查指标含义)
第 4 步:(可选)上传知识库
可以上传一些权威健康科普 PDF——比如《中国居民膳食指南》、《老年人健康管理手册》。
第 5 步:测试
用你自己之前的体检报告测试,看 Bot 回答得怎么样。
第 6 步:发布
发布到"微信小程序"——妈妈可以直接在微信里用,不用学新 App。
第 7 步:教妈妈用
录一段 1 分钟视频教她"怎么打开 → 怎么拍照 → 怎么看回答",发给妈妈。
做完这一切,你做了一件超有意义的事——妈妈以后看体检报告再也不用等你了。
12.9 Agent 时代普通人的"杠杆"
回顾一下,Agent 给普通人带来的"杠杆"是什么:
杠杆 1:做"以前必须有团队才能做的事"
以前你要做一个 App,需要:产品经理、设计师、程序员、测试。 现在:你一个人 + Coze + 几个 Agent → 一周一个产品。
杠杆 2:把"重复性工作"自动化
每天的"周报、邮件、纪要、记录"——搭好 Agent 之后,你的工作量减半。
杠杆 3:服务"以前没法服务"的人群
你妈妈、你爸爸、你不会用 App 的亲戚——你给他们搭个"专属 Bot",他们就能用上 AI。
杠杆 4:把"专业能力"产品化
你是律师 / 医生 / 老师 / 心理咨询师 → 把你的"经验 + 知识库"灌进 Agent → 服务千万人。
杠杆 5:副业 / 创业的低成本启动
你有一个想法 → 不用招团队 / 不用融资 → 用 Agent 搭原型 → 上线 → 看市场反应 → 迭代。
Agent 时代,普通人的"创造门槛"前所未有地低。
本章小抄
AI 智能体(Agent)速查
────────────────
什么是 Agent?
└─ 大模型(脑子)+ 工具(手脚)+ 记忆(笔记本)
vs 对话型 AI:
└─ 对话型:"我说,它答"
└─ Agent:"我给目标,它干完"
3 类 Agent 平台:
1. 通用:Operator / Manus(你说一句它干一套)
2. 搭建型:Coze / 自定义 GPTs(你来造一个)
3. 嵌入型:钉钉 AI / WPS AI(融入软件)
Agent 三件套搭建:
1. 起名 + 定位
2. 写"指令"(核心!)
3. 启用工具 + 上传知识库
4. 测试 + 发布
10 个普通人 Agent 创意:
1. 私人医生顾问 2. 英语口语陪练
3. 朋友圈文案生成器 4. 考前刷题伴侣
5. 代码助手 6. 理财顾问
7. 育儿顾问 8. 旅游策划师
9. 写作教练 10. 时间管理
4 大红线:
1. 不接入支付
2. 不替做重大决策
3. 不自动发东西
4. 不泄露隐私
Agent 时代的杠杆:
- 一个人=一个团队
- 重复工作自动化
- 服务"以前没法服务"的人
- 把"经验"产品化
- 低成本启动副业
5 分钟动手实验
任务:今天就搭一个真正属于你的 Agent。
步骤:
-
打开 Coze(扣子),注册账号
-
从 12.6 节的 10 个创意里挑一个最有用的
-
新建 Bot,按本章实战流程:
- 起名 + 介绍
- 写"人设与回复逻辑"(核心!)
- 启用必要工具
- 测试
-
测试 5 轮——感觉不对就改"人设"
-
发布——可以选"只有自己用"或"分享给朋友"
-
下载到手机 → 加到桌面 → 当成常用 App
完成这个实验,你已经从"AI 用户"升级为"AI 创造者"。
下章预告
下一章 第十三章 多个 AI 协同,进入"AI 工作流"——把多个 AI 工具串联起来,让它们"接力工作":
- 不同任务用不同 AI(写作用 Claude、推理用 DeepSeek、画图用 MJ)
- 串联工作流:从输入到输出全自动
- AI 接入桌面 / 手机:让 AI 时刻在身边
- "我的 AI 操作系统"——把 AI 真正融入你的日常
学完,你会像高手一样使用 AI。