ORANGE BOOK · HERMES AGENT

第一章 认识 Hermes Agent


一、用一句话讲清楚 Hermes Agent

Hermes Agent 是一个跑在你自己电脑上的开源 AI 智能体,它会自学习、会跨会话记住你,并能跨多种消息平台陪你工作。

把这句话拆开看:

  • AI 智能体(Agent):和"AI 助手"是两个词。助手只能聊,Agent 能干。
  • 开源:源代码完全公开、免费,遵守 MIT 协议,没有订阅费,可商用。
  • 跑在你自己电脑上:你的数据不上传到第三方,配置文件、记忆、技能全部在本地的 ~/.hermes/ 目录里。
  • 会自学习:每完成一件复杂任务就自动写一份"经验文档"(Skill),下次遇到类似任务直接调用。
  • 会跨会话记住你:三层记忆系统(会话记忆 / 持久记忆 / 技能记忆),不会再让你"重头解释自己"。
  • 跨多种消息平台:Telegram / Discord / Slack / WhatsApp / Signal / Email / CLI 都能用,同一个 Hermes 在哪个 App 都是同一个它

Hermes 在英文社区里常被昵称为"the agent that grows with you"——与你共同成长的代理。这句话是它整个产品哲学。

二、它和 ChatGPT 到底有什么不同

很多人第一次接触 Hermes,会觉得"不就是另一个聊天框吗?"。差别其实非常大。我们做一张表,一目了然。

对比维度 ChatGPT / Kimi / 豆包 等 Hermes Agent
核心定位 对话式 AI 助手 任务式 AI 伙伴
能不能动你的电脑 不能 能:开浏览器、改文件、跑命令、调 API
能不能持续跑 你不问它就停 能定时跑、能 24 小时盯着
会不会记得你 每次对话从零开始 三层记忆,跨会话/跨平台记住偏好
会不会成长 不会 自动写 Skill,下次更快更准
数据去哪了 上传到云端 默认全部留在本地 ~/.hermes/
价格 按月订阅,约 20 美元/月起 开源免费,只付你选的大模型 API 费用
能装插件吗 有 GPTs,但封闭 支持 47 内置工具 + MCP 服务器无限扩展
能跨多个 App 工作吗 不能 6+ 消息平台共享同一记忆
能让它去 5 美元的小服务器上 24 小时打工吗 不能 可以
学习曲线 比 ChatGPT 略陡,但本书读完就够了

如果还是觉得抽象,我们再来一个比喻:

  • ChatGPT 像一个聪明但有金鱼记忆的实习生。每天上班来不认识你,需要你先做 5 分钟自我介绍,然后他能干活,但下班一回家就把你忘了。
  • Hermes Agent 像一个会成长的初级员工。第一周可能只能做点小事,但他每天都在记笔记、攒经验,一个月后他知道你的口味、你的客户、你团队每个人的脾气。半年后你会发现,他比你还了解你的项目。

理解到这里,Hermes 的"威力"和"风险"你也就同时理解了——它能记住,意味着它也可能记错;它能动手,意味着它也可能"动错"。所以本书 第十一章 会专门讲安全。

三、它和"另一只 Agent" —— Hermes vs OpenClaw / Claude Code

如果你已经在关注 AI Agent 圈,多半听过 OpenClaw、Claude Code 这些。它们和 Hermes 是什么关系?我们也做一张表。

维度 Hermes Agent Claude Code OpenClaw
出品方 Nous Research Anthropic OpenClaw 社区
协议 MIT(最宽松) 商业(含订阅) Apache 2.0
自学习/Skill 自动生成 ✅ 是 ❌ 否(仅 memory.md) ❌ 否
模型支持 任何提供商 仅 Claude 任何提供商
消息平台数量 7+ 仅 CLI 仅 CLI
MCP 支持
语音模式
持久记忆 FTS5 全文搜索 + LLM 总结 CLAUDE.md 上下文文件
内置 Cron 调度 部分
子代理并行 ✅(ClawHub)
执行后端数 6(local/Docker/SSH/Daytona/Singularity/Modal) local + cloud local
主战场 通用伙伴(生活+工作+研发都能) 专攻编程 专攻编程

一句话总结:

  • Claude Code 是顶级的"AI 程序员",专为写代码而生;
  • OpenClaw 是开源的"AI 程序员",社区生态强;
  • Hermes Agent通用型的"AI 伙伴"——会写代码也会订酒店、会发周报也会跟妈聊天,关键是它会记住你、会成长

如果你是开发者,Claude Code 和 Hermes 完全可以一起用。如果你是普通人,Hermes 一个就够了

四、它的"身份证"

为了让你对它有更立体的认识,我们把这个项目的关键事实列出来:

项目 数据
发布日期 2026 年 2 月 25 日
出品方 Nous Research(同时也是 Hermes 系列开源大模型的出品方)
开源协议 MIT(最宽松的开源协议,可商用)
主要语言 Python(约 87%),少量 TypeScript / Rust
GitHub Stars 6 万+(截至 2026 年 4 月)
内置工具数 47 个(文件、Shell、网络、浏览器、代码执行、子代理委派…)
支持系统 macOS / Linux / Windows(推荐 WSL2)
最低硬件 2 核 CPU、4GB 内存(推荐 8GB+)
安装方式 一行 curl 命令,约 2 分钟完成
接入大模型 OpenAI / Anthropic / Google Gemini / OpenRouter 200+ / DeepSeek / Kimi / Ollama 本地 / Nous Portal 等
消息平台 Telegram / Discord / Slack / WhatsApp / Signal / Email / CLI
执行后端 Local / Docker / SSH / Daytona / Singularity / Modal
MCP 支持 原生支持,可挂任意 MCP 服务器
Skill 社区 agentskills.io(社区共享技能库)

五、它能帮你做的 20 件事

为了让"能干活"这个抽象概念落地,我们列 20 件普通人最常用的事情。看看有没有哪一件让你眼前一亮。

生活类(10 件)

  1. 早晨语音播报:天气、日程、值得看的微信、值得回的邮件、需要关注的航班/快递。
  2. 24 小时盯演唱会票/限量球鞋/特价机票,一旦满足条件自动下单或第一时间通知你。
  3. 每月账单"消费体检":把支付宝、微信、信用卡账单打通分析,发现异常消费、给出节流建议。
  4. 下载文件夹自动整理:图片归图片、PDF 归 PDF、超 30 天没用的归档。
  5. 旅行规划:你说"国庆带爸妈去新疆 6 天,预算 1.5 万",它给出三套方案 + 机票酒店 + 必玩点位 + 当地美食 + 自驾路线。
  6. 追剧追番追小说:自动追更,每天打包成你喜欢的格式发到你的 Kindle 或手机。
  7. 给爸妈用的"一句话办事":他们说"帮我订下周三去北京的高铁",它自动比价订票、加日历、发短信确认给爸妈。
  8. 健身/读书/学习打卡:根据计划每天提醒,进度可视化,跟不上时调整计划。
  9. 新闻定制简报:只看你关心的领域、公司、人,每天一条 200 字。
  10. 节日提醒 + 礼物建议:自动记录朋友家人生日、纪念日,提前一天提醒并给出礼物清单和购买链接。

工作类(10 件)

  1. 会议纪要自动整理:录音/字幕一传,5 分钟内给你完整纪要 + 待办清单 + 重要决策 + 关键人物表态。
  2. 周报自动起草:从你过去一周的 Git 提交、文档、消息中提取,按公司模板写好,留三段你来补"判断"。
  3. 邮件智能分类与三句话总结:每天上班前已分好类,重要的标红,每封三句话告诉你是什么。
  4. 客户反馈打分与归类:60 条原始反馈打包成 Excel,BUG / 优化 / 新需求 / 无效四类分好。
  5. 竞品监控:每天自动打开竞品官网、定价页、博客、Release Notes,有变动给你一份 diff。
  6. 社交媒体多平台同步发布:写一次,自动适配小红书 / 公众号 / X / LinkedIn 的格式与字数。
  7. 求职助手:给画像它去搜岗、定制简历、批量投递、跟踪 HR 回复。
  8. 招聘助手:把简历压缩包丢进去,自动初筛打分、按岗位匹配排序、生成沟通话术。
  9. 数据报表自动生成:连上数据源,每天/每周/每月自动出图出表,差的指标自动标红。
  10. 代码 Code Review:开源项目维护者必备,每次 PR 自动给一份初审意见。

如果你只对其中一两件感兴趣,那这本书已经值得了。如果你看到三件以上眼睛一亮,那就别犹豫,往下读。

六、Hermes 的"灵魂三件套"

如果说 ChatGPT 的核心是"模型",那 Hermes 的核心是这三件东西的组合,你越早理解越好:

1. SOUL.md(灵魂档案)

存在 ~/.hermes/SOUL.md,定义你想要 Hermes 是个什么"性格"的伙伴。例如:

  • "请永远叫我'周老板',不要用'您'。"
  • "我说话直接,你也别绕弯子。"
  • "凡是涉及到花钱超过 100 元的,先问我一下。"

这份档案会被 Hermes 在每次对话开始时自动加载,让它"是你的它"。

2. MEMORY.md / USER.md(长期记忆)

存在 ~/.hermes/memories/,是 Hermes 自己整理的"关于你的事实档案"。例如:

  • "用户的猫叫包子,是橘猫。"
  • "用户在科技园上班,加班到 9 点是常态。"
  • "用户的妈妈坐车超 4 小时会晕。"

这些事实是 Hermes 一边和你聊一边自动记下来的,下次它做任何事都会先翻一翻这本"档案"。

3. Skills(技能记忆)

存在 ~/.hermes/skills/,是 Hermes 完成复杂任务后自动写下的"操作经验"。例如完成一次"国庆带爸妈出游规划"后,下次再有"出游规划"类任务,Hermes 会先翻这份 Skill,避免重复试错。

这三件套合起来,就是 Hermes 区别于所有"普通 AI"的关键。

下面我们用一张图把这三件套的关系画清楚(不用懂技术,看个大意即可):

       ┌─────────────────┐
       │   SOUL.md       │ ← 你给它定的"性格设定"(一次写好)
       │ (它是谁?)    │
       └─────────────────┘
                ▲
                │
     ┌──────────┴──────────┐
     │                     │
┌────┴─────┐         ┌─────┴────┐
│ MEMORY   │         │ SKILLS   │
│(关于你)│         │(怎么做)│
│ 自动累积 │         │ 自动累积 │
└──────────┘         └──────────┘
                ▲
                │
         ┌──────┴──────┐
         │  本次对话    │ ← 它和你说的每一句话
         │  会话记忆    │
         └─────────────┘

不要觉得这听起来复杂——你只需要打开 Hermes 用就行,这三件套都是它自己在后台慢慢长出来的

七、它适不适合你?一份自检清单

下面 12 个问题,每个问题给自己打一个分(0 = 完全不是,1 = 有点像,2 = 非常是我)。

# 问题 0 1 2
1 我每天有超过 30 分钟时间花在"信息整理"上(看微信、看邮件、读群聊)
2 我用过 ChatGPT 等 AI,但每次都觉得"它不记得我,要重头讲"
3 我希望 AI 能直接打开浏览器/读我的文件,而不只是回答
4 我希望 AI 能在我手机上、电脑上、办公 Slack 上是同一个它
5 我经常需要 AI 在我没开机的时候继续干活(比如盯票、监控)
6 我希望 AI 用得越久越懂我,而不是每次都从零开始
7 我对个人隐私在意,希望数据不要上传到云
8 我愿意花一两个小时学一点新东西(不需要写代码)
9 我能在终端里复制粘贴一行命令并按回车
10 我有耐心给 AI 写一段"我希望你怎么对我说话"的人格设定
11 我希望以后能给团队/家人也配一个 AI 助理
12 我每个月愿意为一个真正能省时间的工具付几十块钱(API 费用)

把分数加起来:

  • 0~6 分:Hermes 现阶段对你可能是"过度装备",建议先把 ChatGPT 的免费版用熟。
  • 7~14 分:Hermes 适合你,先把第二章跑完,后面慢慢加功能。
  • 15~24 分:你就是这本书的目标读者,强烈建议从头到尾读完,并且把 第十二章 也读了——你有可能成为 Hermes 中文社区的早期贡献者之一。

八、关于成本:到底要花多少钱

这是普通人最关心的问题之一,我们直接给数字:

使用强度 每月花费(人民币) 说明
试一试 0 元 用 Ollama 本地模型,零费用
轻度(每天聊几次) 30~100 元 OpenRouter / Kimi / DeepSeek,按 token 付费
中度(重度日常用) 100~300 元 一两个常驻定时任务 + 每天 50 次以上交互
重度(24 小时为你打工) 300~1500 元 VPS 5 美元 + Claude Opus 当大脑 + 多个定时工作流

第三章我们会教你怎么用一套省钱组合——便宜模型当"打杂工"、贵模型只在关键步骤介入,把成本压到最低。

本章一图回顾

┌─────────────────────────────────────────┐
│         Hermes Agent ≈ "数字伙伴"        │
├─────────────────────────────────────────┤
│ 会自学习  ──→ 越用越快越准              │
│ 会记住    ──→ 跨会话/跨平台一份记忆      │
│ 会动手    ──→ 47 内置工具 + MCP 无限扩展 │
│ 跨平台    ──→ 同一个它在 7+ App 都在     │
│ 会守护    ──→ 默认本地,隐私你说了算     │
│ 会进化    ──→ 你陪它一年,它就更懂你一年 │
└─────────────────────────────────────────┘

下章预告

理论部分结束。下一章我们直接动手—— 第二章 五分钟快速上手,让你在 5 分钟之内把 Hermes Agent 装好、跑起来,并完成第一个真实任务。

如果你已经迫不及待想先看看 Hermes 能写出什么花样的提示词,可以先翻一下 附录 B 30 个开箱即用提示词