一、为什么需要"AI 小团队"
让我们看一个真实场景。
你想做一件事:调研 5 家 SaaS 竞品的产品差异、定价、用户评价,给一份对比表。
如果用单个 Hermes,它会怎么做?
1. 打开竞品 A 官网,分析
2. 打开竞品 A 定价页,分析
3. 打开 G2 / Capterra 找竞品 A 评价,分析
4. 打开竞品 B 官网,分析
5. ... (重复 5 次)
6. 综合 → 出表
总耗时:约 25~40 分钟
如果用 AI 小团队呢?
1. 主 Hermes 把任务拆成 5 份:"你 A、你 B、你 C、你 D、你 E"
2. 5 个子代理同时打开各自竞品,并行调研
3. 每个子代理用便宜模型(DeepSeek / Haiku),减少成本
4. 5 个子代理 5 分钟后各自交报告
5. 主 Hermes(用聪明模型)综合 → 出表
总耗时:约 6~8 分钟
成本:单 Hermes 的 60% 左右(因为子代理用便宜模型)
5 倍速度,60% 成本。 这就是 AI 小团队的威力。
二、子代理是什么
子代理(Subagent),就是"由主 Hermes 临时启动的、独立的小 Hermes"。它有:
- 独立的会话上下文(不污染主代理)
- 独立的工具配置(可以专门给它配某些工具)
- 独立的模型选择(一般用便宜的)
- 独立的任务目标
- 完成后回收资源
特点:
- ✅ 隔离:子代理跑的事不影响主代理记忆
- ✅ 并行:N 个子代理可以同时跑
- ✅ 专业化:可以给每个子代理不同的"角色"
- ✅ 省钱:可以用便宜模型
三、最简单的"子代理委派"
在 Hermes 里,最简单的派活方式:
> 你帮我调研 5 家 SaaS 竞品(A、B、C、D、E)的产品 + 定价 + 用户评价。
> 用 5 个子代理并行做,每个子代理用 deepseek-chat。
> 5 分钟后给我一份对比表。
Hermes 会自动:
- 解析"5 家"
- 用
subagent.spawn启动 5 个子代理 - 每个子代理拿到一份"专门调研 X 家"的提示词
- 5 个并行跑
- 用
subagent.collect收集结果 - 主 Hermes 综合输出
整个过程你只输入一句话,但内部有 6 个 Agent 在协作。
四、子代理的"显式"配置(更可控)
如果你想精准控制每个子代理:
# ~/.hermes/workflows/competitor-research.yaml
name: 5 家竞品并行调研
trigger:
type: manual
inputs:
- name: competitors
type: list
example: ["Salesforce", "HubSpot", "Pipedrive", "Zoho", "Freshworks"]
steps:
- id: spawn_research
skill: subagent.parallel
config:
model: deepseek-chat # 子代理用便宜模型
timeout: 300 # 单个子代理最多 5 分钟
max_parallel: 5
inputs:
tasks:
- role: "你是 {{ competitor }} 产品分析专员"
task: "调研 {{ competitor }}"
steps:
- "打开官网,列出 5 个核心功能"
- "打开定价页,列出所有套餐 + 价格"
- "搜 G2 上的评分和最新 5 条评价"
- "返回 JSON 格式:{ name, features, pricing, rating, reviews }"
for_each: "{{ inputs.competitors }}"
- id: synthesize
model: anthropic/claude-sonnet-4 # 主 Hermes 用聪明的
skill: compose-comparison-table
inputs:
raw_data: "{{ steps.spawn_research.output }}"
output:
format: markdown_table
执行:
hermes workflow run competitor-research --inputs '{"competitors": ["Salesforce", "HubSpot", "Pipedrive", "Zoho", "Freshworks"]}'
五、五个常用"小团队"模式
5.1 模式一:并行调研(fan-out / fan-in)
适合:调研 N 家公司、评估 N 个候选、对比 N 个方案
┌── 子代理 A 调研竞品 A ──┐
│ │
主 Agent ┼── 子代理 B 调研竞品 B ──┼── 主 Agent 汇总
│ │
└── 子代理 C 调研竞品 C ──┘
5.2 模式二:流水线(pipeline)
适合:内容生产(搜资料 → 写初稿 → 审稿 → 排版)
搜资料子代理 → 写作子代理 → 审稿子代理 → 排版子代理 → 主 Agent 输出
每个子代理专精一件事,依次传递。
5.3 模式三:经理-员工(manager-worker)
适合:复杂任务,需要动态分派
主 Agent(经理)
│
├─→ 决定要做哪些子任务
├─→ 把每个子任务派给一个子代理
├─→ 监控进度,子代理卡住时换人或加资源
└─→ 最后汇总
例子:
> 帮我把团队下个 Sprint(10 个 user story)的需求文档全部写出来。
主 Agent 会:
- 启动 10 个子代理,每个写一份
- 每隔 30 秒检查进度
- 谁卡住了换更聪明的模型重试
- 全部完成后整合 + 风格统一
5.4 模式四:投票/裁判(vote-and-judge)
适合:需要"高质量"的决策(让 3 个不同模型独立做,再选最好的)
你的请求 → 子代理 A (Claude Opus)
→ 子代理 B (GPT-4o) } → 裁判 Agent 选最好的
→ 子代理 C (DeepSeek-Reasoner)
例如让 3 个 Agent 各写一份方案,让一个"裁判 Agent"按你给的标准评分,选出最优。
5.5 模式五:嵌套(nested subagents)
子代理还能启动它自己的子代理。例如做一份"行业研究报告":
主 Agent
└── 行业概况子代理
└── 主要玩家子代理
└── 公司 A 子子代理
└── 公司 B 子子代理
└── 公司 C 子子代理
└── 趋势预测子代理
注意嵌套深度别太深(>3 层会失控),并设好预算。
六、6 种执行后端
到现在为止,所有 Hermes 都跑在你本地电脑上。但你电脑会关机、会睡眠、会被你拿出去开会。如果你想让 Hermes "24 小时不停",需要把它部署到别的地方。
Hermes 支持 6 种执行后端,每种适合不同场景:
| 后端 | 适合谁 | 价格 | 特点 |
|---|---|---|---|
| Local | 新手、本地任务 | 免费 | 你电脑跑,关机就停 |
| Docker | 想要隔离沙箱的 | 免费 | 本地 Docker,安全但功能受限 |
| SSH(VPS) | 想 24h 跑的 | $5/月起 | 自己一台小服务器 |
| Daytona | 团队、远程开发 | 按用量 | 云端开发环境,无服务器 |
| Singularity | HPC / 研究人员 | 视机构 | 高性能计算集群 |
| Modal | 突发大任务 | 按秒计费 | Serverless,伸缩自由 |
普通人最常用的是 Local + Docker + SSH 这三个。
6.1 切换后端
hermes config set terminal.backend local # 默认
hermes config set terminal.backend docker # 隔离
hermes config set terminal.backend ssh # 远程
或者按任务类型自动切:
terminal:
default_backend: local
rules:
- match: "task.requires_isolation == true"
backend: docker
- match: "task.is_long_running == true"
backend: ssh
- match: "task.is_high_compute == true"
backend: modal
七、Docker 沙箱:本地最安全的玩法
如果你不放心 Hermes 在你电脑上"乱动文件",给它一个 Docker 沙箱:
# ~/.hermes/config.yaml
terminal:
backend: docker
docker:
image: "python:3.11-slim" # 用什么镜像
timeout: 300
mounts:
- source: "~/Documents/hermes-workspace" # 只挂载这个目录
target: "/workspace"
network: "none" # 默认禁用网络(更安全)
memory: "2g"
cpus: "2"
这样 Hermes 跑命令时实际是在 Docker 容器里跑,最多能动 ~/Documents/hermes-workspace 里的文件,其他地方它根本看不见。
八、让 Hermes 上 5 美元/月的小服务器(24h 上班)
这是本章最有价值的部分。
8.1 为什么要上服务器
- 你的电脑要睡眠/关机
- 你不希望"早上提醒"功能在你电脑没开机时不工作
- 你希望"盯抢票"在你出差时也照常进行
- 你希望"回复爸妈微信"在你晚上睡觉时也能马上回
8.2 选哪个 VPS
| 推荐厂商 | 配置 | 月费 | 国内/海外 |
|---|---|---|---|
| Hetzner CX22 | 2C / 4G / 40G | €4.5(约 ¥35) | 海外 |
| DigitalOcean | 1C / 2G | $6(约 ¥45) | 海外 |
| Vultr | 1C / 2G | $5 | 海外 |
| AWS Lightsail | 2C / 2G | $5 | 海外 |
| 腾讯云轻量 | 2C / 2G | ¥40~80 | 国内 |
| 阿里云 ECS | 2C / 2G | ¥50~100 | 国内 |
注意:如果你用国内 VPS,要访问 OpenRouter / Anthropic 仍然不顺,最好用国内模型(Kimi / DeepSeek)。
8.3 部署步骤
SSH 到你的 VPS,跑:
# 1) 装 Hermes
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
source ~/.bashrc
# 2) 跑 setup
hermes setup
# 3) 配你的 API key
hermes config set OPENROUTER_API_KEY sk-or-v1-xxx
# 或者用国内模型:
hermes config set DEEPSEEK_API_KEY sk-xxx
# 4) 把你的本地 SOUL.md / 记忆同步到 VPS
# 在你本地:
hermes export --all ~/hermes-backup.tar.gz
scp ~/hermes-backup.tar.gz user@vps:/tmp/
# 在 VPS 上:
hermes import /tmp/hermes-backup.tar.gz
# 5) 创建 systemd 服务,让 Hermes 开机自启 + 崩溃自动重启
sudo tee /etc/systemd/system/hermes.service > /dev/null << 'EOF'
[Unit]
Description=Hermes AI Agent
After=network.target
[Service]
Type=simple
User=cassius
WorkingDirectory=/home/cassius
ExecStart=/home/cassius/.local/bin/hermes daemon
Restart=always
RestartSec=10
Environment="HOME=/home/cassius"
[Install]
WantedBy=multi-user.target
EOF
# 6) 启动并设为开机自启
sudo systemctl daemon-reload
sudo systemctl enable hermes
sudo systemctl start hermes
# 7) 验证
sudo systemctl status hermes
hermes doctor
# 8) 启动你需要的 Gateway
hermes gateway start telegram
hermes gateway start email
完成。从此 Hermes 24 小时在 VPS 上活着,你只要打开 Telegram 就能跟它说话,无论你的电脑开着还是关着。
8.4 双向同步:本地 + 云端
进阶玩法:让本地 Hermes 和云端 Hermes 共享记忆。
# 本地 ~/.hermes/sync.yaml
sync:
enabled: true
remote: "ssh://cassius@my-vps.example.com/~/.hermes"
schedule: "*/15 * * * *" # 每 15 分钟同步一次
conflict_strategy: "newer-wins"
这样本地写的 Skill / 记忆,15 分钟内会同步到云端 Hermes。云端积累的也会拉回本地。真正一份记忆、两个执行点。
九、AI 小团队的成本模型
很多人担心"开 5 个子代理是不是 5 倍成本?"。不是。 因为:
- 子代理通常用便宜模型(成本只有主代理的 1/10)
- 子代理任务往往更聚焦,token 用量更少
- 并行节省时间,但不增加 token
实测一份"5 家竞品调研"任务的成本对比:
| 方案 | 模型 | 时长 | API 成本 |
|---|---|---|---|
| 单 Agent | Claude Sonnet 4 | 32 min | $0.45 |
| 5 个子代理 | Sonnet(主)+ DeepSeek(5 子) | 6 min | $0.18 |
| 5 个子代理(极致省钱) | Haiku(主)+ DeepSeek(5 子) | 7 min | $0.08 |
5 倍速度,1/3 成本,质量基本不损失。
十、几个进阶玩法
10.1 让一个 Agent 用浏览器、另一个 Agent 写代码
> 你(主)让一个子代理打开 Stripe 文档页(用浏览器),
> 让另一个子代理(用 python.run)测试我新写的支付集成代码。
> 两个子代理之间通过共享的 ~/tmp/payment-context.md 交换信息。
10.2 让 Hermes 跑别的 AI Agent
Hermes 还能在子代理里跑别的 AI Agent——用 claude-code 写代码、用 cursor-agent 调试 UI、用 OpenClaw 做某些专业工作。
> 帮我做一个 Web 项目:
> - 让 claude-code 子代理写后端
> - 让 cursor-agent 子代理写前端
> - 主 Hermes 综合,最后给我一份完整的代码库
10.3 Worktree 模式(同一个项目并行干)
hermes -w
这会在 git worktree 里跑 Hermes——多个 Hermes 可以同时在同一个仓库的不同分支上工作,互不冲突。
十一、安全提示:子代理 / 远程部署的边界
把 Hermes 上 VPS、用子代理,意味着把"控制权"交给了远程电脑。请:
- VPS 用强密码 + SSH 密钥登录,禁用 root 密码登录
- 防火墙只开 SSH 端口 + 你需要的 Gateway 端口
- 子代理一定要设
timeout,否则可能死循环 - 子代理一定要设
max_parallel,否则可能 fork 炸 - 远程 Hermes 别给"删数据库""转账"这类高危权限
更详细的安全实践见 第十一章。
本章一图回顾
┌────────── AI 小团队架构 ────────────┐
│ │
│ 主 Hermes (经理) │
│ 在 VPS 上 24h 跑 │
│ 用 Claude Sonnet 4 │
│ │ │
│ │ 派活 │
│ ▼ │
│ ┌───────┬───────┬───────┐ │
│ ▼ ▼ ▼ ▼ │
│ 子1 子2 子3 子N │
│ (DeepSeek-chat 这种便宜的) │
│ │ │ │ │ │
│ └───────┴───┬───┴───────┘ │
│ │ 交结果 │
│ ▼ │
│ 主 Hermes 汇总 │
│ 推送到你 Telegram │
│ │
│ 速度: 5x 成本: 1/3 │
└──────────────────────────────────────┘
下章预告
到这里你已经能搭建一个比 90% 同事都强的 AI 工作流了。但能力越大,责任越大—— 第十一章 安全、隐私与避坑指南 会告诉你:
- Hermes 的三级权限模型
- API Key / 隐私数据怎么管
- Docker 沙箱的具体配置
- 防 prompt injection 的 8 条建议
- 新手最容易踩的 8 大坑
- 一份"事故处理手册"