ORANGE BOOK · HERMES AGENT

第十章 子代理与 AI 小团队


一、为什么需要"AI 小团队"

让我们看一个真实场景。

你想做一件事:调研 5 家 SaaS 竞品的产品差异、定价、用户评价,给一份对比表。

如果用单个 Hermes,它会怎么做?

1. 打开竞品 A 官网,分析
2. 打开竞品 A 定价页,分析
3. 打开 G2 / Capterra 找竞品 A 评价,分析
4. 打开竞品 B 官网,分析
5. ... (重复 5 次)
6. 综合 → 出表

总耗时:约 25~40 分钟

如果用 AI 小团队呢?

1. 主 Hermes 把任务拆成 5 份:"你 A、你 B、你 C、你 D、你 E"
2. 5 个子代理同时打开各自竞品,并行调研
3. 每个子代理用便宜模型(DeepSeek / Haiku),减少成本
4. 5 个子代理 5 分钟后各自交报告
5. 主 Hermes(用聪明模型)综合 → 出表

总耗时:约 6~8 分钟
成本:单 Hermes 的 60% 左右(因为子代理用便宜模型)

5 倍速度,60% 成本。 这就是 AI 小团队的威力。

二、子代理是什么

子代理(Subagent),就是"由主 Hermes 临时启动的、独立的小 Hermes"。它有:

  • 独立的会话上下文(不污染主代理)
  • 独立的工具配置(可以专门给它配某些工具)
  • 独立的模型选择(一般用便宜的)
  • 独立的任务目标
  • 完成后回收资源

特点:

  • 隔离:子代理跑的事不影响主代理记忆
  • 并行:N 个子代理可以同时跑
  • 专业化:可以给每个子代理不同的"角色"
  • 省钱:可以用便宜模型

三、最简单的"子代理委派"

在 Hermes 里,最简单的派活方式:

> 你帮我调研 5 家 SaaS 竞品(A、B、C、D、E)的产品 + 定价 + 用户评价。
> 用 5 个子代理并行做,每个子代理用 deepseek-chat。
> 5 分钟后给我一份对比表。

Hermes 会自动:

  1. 解析"5 家"
  2. subagent.spawn 启动 5 个子代理
  3. 每个子代理拿到一份"专门调研 X 家"的提示词
  4. 5 个并行跑
  5. subagent.collect 收集结果
  6. 主 Hermes 综合输出

整个过程你只输入一句话,但内部有 6 个 Agent 在协作。

四、子代理的"显式"配置(更可控)

如果你想精准控制每个子代理:

# ~/.hermes/workflows/competitor-research.yaml
name: 5 家竞品并行调研
trigger:
  type: manual
inputs:
  - name: competitors
    type: list
    example: ["Salesforce", "HubSpot", "Pipedrive", "Zoho", "Freshworks"]

steps:
  - id: spawn_research
    skill: subagent.parallel
    config:
      model: deepseek-chat       # 子代理用便宜模型
      timeout: 300               # 单个子代理最多 5 分钟
      max_parallel: 5
    inputs:
      tasks:
        - role: "你是 {{ competitor }} 产品分析专员"
          task: "调研 {{ competitor }}"
          steps:
            - "打开官网,列出 5 个核心功能"
            - "打开定价页,列出所有套餐 + 价格"
            - "搜 G2 上的评分和最新 5 条评价"
            - "返回 JSON 格式:{ name, features, pricing, rating, reviews }"
          for_each: "{{ inputs.competitors }}"
  
  - id: synthesize
    model: anthropic/claude-sonnet-4    # 主 Hermes 用聪明的
    skill: compose-comparison-table
    inputs:
      raw_data: "{{ steps.spawn_research.output }}"
    output:
      format: markdown_table

执行:

hermes workflow run competitor-research --inputs '{"competitors": ["Salesforce", "HubSpot", "Pipedrive", "Zoho", "Freshworks"]}'

五、五个常用"小团队"模式

5.1 模式一:并行调研(fan-out / fan-in)

适合:调研 N 家公司、评估 N 个候选、对比 N 个方案

        ┌── 子代理 A 调研竞品 A ──┐
        │                         │
主 Agent ┼── 子代理 B 调研竞品 B ──┼── 主 Agent 汇总
        │                         │
        └── 子代理 C 调研竞品 C ──┘

5.2 模式二:流水线(pipeline)

适合:内容生产(搜资料 → 写初稿 → 审稿 → 排版)

搜资料子代理 → 写作子代理 → 审稿子代理 → 排版子代理 → 主 Agent 输出

每个子代理专精一件事,依次传递。

5.3 模式三:经理-员工(manager-worker)

适合:复杂任务,需要动态分派

主 Agent(经理)
   │
   ├─→ 决定要做哪些子任务
   ├─→ 把每个子任务派给一个子代理
   ├─→ 监控进度,子代理卡住时换人或加资源
   └─→ 最后汇总

例子:

> 帮我把团队下个 Sprint(10 个 user story)的需求文档全部写出来。

主 Agent 会:

  1. 启动 10 个子代理,每个写一份
  2. 每隔 30 秒检查进度
  3. 谁卡住了换更聪明的模型重试
  4. 全部完成后整合 + 风格统一

5.4 模式四:投票/裁判(vote-and-judge)

适合:需要"高质量"的决策(让 3 个不同模型独立做,再选最好的)

你的请求 → 子代理 A (Claude Opus)
        → 子代理 B (GPT-4o)         } → 裁判 Agent 选最好的
        → 子代理 C (DeepSeek-Reasoner)

例如让 3 个 Agent 各写一份方案,让一个"裁判 Agent"按你给的标准评分,选出最优。

5.5 模式五:嵌套(nested subagents)

子代理还能启动它自己的子代理。例如做一份"行业研究报告":

主 Agent
  └── 行业概况子代理
  └── 主要玩家子代理
        └── 公司 A 子子代理
        └── 公司 B 子子代理
        └── 公司 C 子子代理
  └── 趋势预测子代理

注意嵌套深度别太深(>3 层会失控),并设好预算。

六、6 种执行后端

到现在为止,所有 Hermes 都跑在你本地电脑上。但你电脑会关机、会睡眠、会被你拿出去开会。如果你想让 Hermes "24 小时不停",需要把它部署到别的地方。

Hermes 支持 6 种执行后端,每种适合不同场景:

后端 适合谁 价格 特点
Local 新手、本地任务 免费 你电脑跑,关机就停
Docker 想要隔离沙箱的 免费 本地 Docker,安全但功能受限
SSH(VPS) 想 24h 跑的 $5/月起 自己一台小服务器
Daytona 团队、远程开发 按用量 云端开发环境,无服务器
Singularity HPC / 研究人员 视机构 高性能计算集群
Modal 突发大任务 按秒计费 Serverless,伸缩自由

普通人最常用的是 Local + Docker + SSH 这三个。

6.1 切换后端

hermes config set terminal.backend local      # 默认
hermes config set terminal.backend docker     # 隔离
hermes config set terminal.backend ssh        # 远程

或者按任务类型自动切:

terminal:
  default_backend: local
  
  rules:
    - match: "task.requires_isolation == true"
      backend: docker
    - match: "task.is_long_running == true"
      backend: ssh
    - match: "task.is_high_compute == true"
      backend: modal

七、Docker 沙箱:本地最安全的玩法

如果你不放心 Hermes 在你电脑上"乱动文件",给它一个 Docker 沙箱:

# ~/.hermes/config.yaml
terminal:
  backend: docker
  docker:
    image: "python:3.11-slim"          # 用什么镜像
    timeout: 300
    mounts:
      - source: "~/Documents/hermes-workspace"   # 只挂载这个目录
        target: "/workspace"
    network: "none"                    # 默认禁用网络(更安全)
    memory: "2g"
    cpus: "2"

这样 Hermes 跑命令时实际是在 Docker 容器里跑,最多能动 ~/Documents/hermes-workspace 里的文件,其他地方它根本看不见。

八、让 Hermes 上 5 美元/月的小服务器(24h 上班)

这是本章最有价值的部分。

8.1 为什么要上服务器

  • 你的电脑要睡眠/关机
  • 你不希望"早上提醒"功能在你电脑没开机时不工作
  • 你希望"盯抢票"在你出差时也照常进行
  • 你希望"回复爸妈微信"在你晚上睡觉时也能马上回

8.2 选哪个 VPS

推荐厂商 配置 月费 国内/海外
Hetzner CX22 2C / 4G / 40G €4.5(约 ¥35) 海外
DigitalOcean 1C / 2G $6(约 ¥45) 海外
Vultr 1C / 2G $5 海外
AWS Lightsail 2C / 2G $5 海外
腾讯云轻量 2C / 2G ¥40~80 国内
阿里云 ECS 2C / 2G ¥50~100 国内

注意:如果你用国内 VPS,要访问 OpenRouter / Anthropic 仍然不顺,最好用国内模型(Kimi / DeepSeek)。

8.3 部署步骤

SSH 到你的 VPS,跑:

# 1) 装 Hermes
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
source ~/.bashrc

# 2) 跑 setup
hermes setup

# 3) 配你的 API key
hermes config set OPENROUTER_API_KEY sk-or-v1-xxx
# 或者用国内模型:
hermes config set DEEPSEEK_API_KEY sk-xxx

# 4) 把你的本地 SOUL.md / 记忆同步到 VPS
# 在你本地:
hermes export --all ~/hermes-backup.tar.gz
scp ~/hermes-backup.tar.gz user@vps:/tmp/
# 在 VPS 上:
hermes import /tmp/hermes-backup.tar.gz

# 5) 创建 systemd 服务,让 Hermes 开机自启 + 崩溃自动重启
sudo tee /etc/systemd/system/hermes.service > /dev/null << 'EOF'
[Unit]
Description=Hermes AI Agent
After=network.target

[Service]
Type=simple
User=cassius
WorkingDirectory=/home/cassius
ExecStart=/home/cassius/.local/bin/hermes daemon
Restart=always
RestartSec=10
Environment="HOME=/home/cassius"

[Install]
WantedBy=multi-user.target
EOF

# 6) 启动并设为开机自启
sudo systemctl daemon-reload
sudo systemctl enable hermes
sudo systemctl start hermes

# 7) 验证
sudo systemctl status hermes
hermes doctor

# 8) 启动你需要的 Gateway
hermes gateway start telegram
hermes gateway start email

完成。从此 Hermes 24 小时在 VPS 上活着,你只要打开 Telegram 就能跟它说话,无论你的电脑开着还是关着。

8.4 双向同步:本地 + 云端

进阶玩法:让本地 Hermes 和云端 Hermes 共享记忆。

# 本地 ~/.hermes/sync.yaml
sync:
  enabled: true
  remote: "ssh://cassius@my-vps.example.com/~/.hermes"
  schedule: "*/15 * * * *"          # 每 15 分钟同步一次
  conflict_strategy: "newer-wins"

这样本地写的 Skill / 记忆,15 分钟内会同步到云端 Hermes。云端积累的也会拉回本地。真正一份记忆、两个执行点

九、AI 小团队的成本模型

很多人担心"开 5 个子代理是不是 5 倍成本?"。不是。 因为:

  1. 子代理通常用便宜模型(成本只有主代理的 1/10)
  2. 子代理任务往往更聚焦,token 用量更少
  3. 并行节省时间,但不增加 token

实测一份"5 家竞品调研"任务的成本对比:

方案 模型 时长 API 成本
单 Agent Claude Sonnet 4 32 min $0.45
5 个子代理 Sonnet(主)+ DeepSeek(5 子) 6 min $0.18
5 个子代理(极致省钱) Haiku(主)+ DeepSeek(5 子) 7 min $0.08

5 倍速度,1/3 成本,质量基本不损失。

十、几个进阶玩法

10.1 让一个 Agent 用浏览器、另一个 Agent 写代码

> 你(主)让一个子代理打开 Stripe 文档页(用浏览器),
> 让另一个子代理(用 python.run)测试我新写的支付集成代码。
> 两个子代理之间通过共享的 ~/tmp/payment-context.md 交换信息。

10.2 让 Hermes 跑别的 AI Agent

Hermes 还能在子代理里跑别的 AI Agent——用 claude-code 写代码、用 cursor-agent 调试 UI、用 OpenClaw 做某些专业工作。

> 帮我做一个 Web 项目:
> - 让 claude-code 子代理写后端
> - 让 cursor-agent 子代理写前端
> - 主 Hermes 综合,最后给我一份完整的代码库

10.3 Worktree 模式(同一个项目并行干)

hermes -w

这会在 git worktree 里跑 Hermes——多个 Hermes 可以同时在同一个仓库的不同分支上工作,互不冲突。

十一、安全提示:子代理 / 远程部署的边界

把 Hermes 上 VPS、用子代理,意味着把"控制权"交给了远程电脑。请:

  1. VPS 用强密码 + SSH 密钥登录,禁用 root 密码登录
  2. 防火墙只开 SSH 端口 + 你需要的 Gateway 端口
  3. 子代理一定要设 timeout,否则可能死循环
  4. 子代理一定要设 max_parallel,否则可能 fork 炸
  5. 远程 Hermes 别给"删数据库""转账"这类高危权限

更详细的安全实践见 第十一章

本章一图回顾

┌────────── AI 小团队架构 ────────────┐
│                                      │
│        主 Hermes (经理)              │
│        在 VPS 上 24h 跑              │
│        用 Claude Sonnet 4            │
│           │                          │
│           │ 派活                     │
│           ▼                          │
│   ┌───────┬───────┬───────┐         │
│   ▼       ▼       ▼       ▼         │
│ 子1     子2     子3     子N         │
│ (DeepSeek-chat 这种便宜的)          │
│   │       │       │       │         │
│   └───────┴───┬───┴───────┘         │
│               │ 交结果               │
│               ▼                      │
│         主 Hermes 汇总               │
│         推送到你 Telegram            │
│                                      │
│   速度: 5x      成本: 1/3            │
└──────────────────────────────────────┘

下章预告

到这里你已经能搭建一个比 90% 同事都强的 AI 工作流了。但能力越大,责任越大—— 第十一章 安全、隐私与避坑指南 会告诉你:

  • Hermes 的三级权限模型
  • API Key / 隐私数据怎么管
  • Docker 沙箱的具体配置
  • 防 prompt injection 的 8 条建议
  • 新手最容易踩的 8 大坑
  • 一份"事故处理手册"