Hermes Agent 评测:一款能自我进化的开源 AI 智能体
Hermes Agent 是 Nous Research 在 2026 年初开源的 AI 智能体框架,仓库上线后短时间内 GitHub 星标突破 30K。它的卖点是“自我进化”—— 不止有记忆,还能从执行任务的过程中自动生成可复用技能。本文综合多家评测和官方文档,对项目做一次客观梳理。
一、定位
Hermes Agent 的核心定位与主流 Agent 工具差异明显:
| 类型 | 代表 | 形态 |
|---|---|---|
| IDE Copilot | Cursor / Cline / Aider | 嵌入编辑器,按代码上下文补全 |
| 通用对话助手 | ChatGPT / Claude Desktop | 浏览器/桌面应用,单次会话 |
| 常驻自托管 Agent | Hermes / OpenClaw | 后台长期运行,持续学习 |
它和 Cursor 这类工具不在同一个赛道。更准确的对照是 OpenClaw —— 同样主打“自托管 + 持久化”的个人 AI Agent。
二、核心机制:自我进化
不同于“对话即遗忘”的传统 Agent,Hermes 围绕可复用过程性知识构建:
- SOUL.md:定义 Agent 的人格和角色边界
- MEMORY.md / USER.md:长期事实型记忆,记录用户画像和关键事实
- Skills(技能):将成功完成的任务流程自动沉淀为可调用脚本
- FTS5 全文检索:基于 SQLite 的会话历史检索,配合 LLM 摘要做跨会话回忆
- Honcho 用户建模:持续迭代对用户偏好和习惯的理解
TuringPost 的评测把这套设计称为“过程性记忆(procedural memory)”—— Agent 记住的不只是事实,还有方法论。Substack 的 mlearning 评测中提到一个有意思的数字:
在评测中,Agent 在两小时内自主生成了三个 skill 文档,再次执行类似任务时速度比首次快约 40%,全程没有人工调整提示词。
这是 Hermes 与“加了向量数据库的普通 Agent”之间最关键的差异。
三、模型支持
Hermes 是**模型无关(model-agnostic)**的运行时,可以自由切换底层 LLM。截至 2026 年 5 月支持的主流来源:
- Nous Portal(官方)
- OpenRouter:聚合 200+ 模型
- NovitaAI:模型 API + Agent Sandbox + GPU Cloud
- NVIDIA NIM:Nemotron 系列
- 国内主流:智谱 GLM-4.6、Kimi K2、MiniMax-M2、小米 MiMo
- 国外主流:OpenAI(GPT-5 / o3)、Anthropic(Claude Sonnet 4.5 / Opus 4.7)
- 本地推理:HuggingFace TGI / Ollama / 任意 OpenAI 兼容端点
切换模型仅需一条命令:
1 | hermes model |
不需要改代码、不需要改配置文件,对避免厂商锁定很有意义。
四、运行时与部署
Agent 运行后端共 7 种:
| 后端 | 适用场景 |
|---|---|
| 本地(Local) | 开发测试 |
| Docker | 容器化隔离 |
| SSH | 远程服务器 |
| Singularity | HPC 集群 |
| Modal | Serverless(休眠/唤醒) |
| Daytona | Serverless |
| Vercel Sandbox | 边缘计算 |
其中 Modal 和 Daytona 的 Serverless 模式是亮点:Agent 在闲置时自动休眠,按需唤醒,长期运行成本接近零。这让“在 5 美元/月的 VPS 上常驻”和“按调用量付费”都成为可行选项。
五、多平台接入
Hermes 通过统一 Gateway 接入多个对话入口:
- Telegram
- Discord
- Slack
- Signal
- CLI(终端)
支持语音备忘录自动转写。社区扩展 HermesClaw 可同时桥接微信。
六、性能数据(参考第三方评测)
JustOborn 的对比测试(2026-05)数据如下:
1 | 任务平均耗时(多步任务): |
成本对比(1000 任务/月,每任务 8 次 LLM 调用):
| 方案 | 月费 | 单任务成本 |
|---|---|---|
| HERMES(混合 GPT-4 + GPT-3.5) | $32.5 | $0.033 |
| ChatGPT Agents(全 GPT-4 Turbo) | $80 | $0.08 |
| Claude Code(全 Claude Sonnet) | $120 | $0.12 |
数据来源不同测试场景,仅作参考。Hermes 的成本优势主要来自多模型混合调度 —— 简单任务派给便宜的小模型,复杂任务调用强模型。
七、自动化与并行
- Cron 定时任务:用自然语言描述周期性任务,自动投递到任意平台
- 子 Agent 并行:主 Agent 可派遣隔离的 subagent 处理并发任务,多步流水线压缩为单次调用
- MCP 工具协议:原生支持 Model Context Protocol,可接入任何 MCP 工具
八、安装
官方一键脚本:
1 | # Linux / macOS / WSL2 / Termux |
源码方式:
1 | git clone https://github.com/NousResearch/hermes-agent.git |
中国大陆环境需要注意:安装脚本依赖 astral.sh、PyPI 和 GitHub,建议提前配置代理或镜像源(PyPI 清华源、npmmirror 等)。
九、与 OpenClaw 对比
TuringPost 把 Hermes 和 OpenClaw 做了系统对比,结论是两者哲学不同:
| 维度 | Hermes Agent | OpenClaw |
|---|---|---|
| 核心理念 | 自我进化、长期复利 | 控制平面优先、人工编排 |
| 技能来源 | 自动从经验生成 | 人工编写 |
| 默认安全 | 用户授权、审批检查、隔离 | 文件级身份、显式记忆 |
| 适用场景 | 长期常驻、累积学习 | 工作区助手、强人工控制 |
简单说:想要“放养”型自学习 Agent 选 Hermes,想要“圈养”型可控助手选 OpenClaw。
十、局限与风险
各家评测中较一致的几个问题:
- 学习曲线陡:SOUL.md / MEMORY.md / Skills / Hooks / Cron 等概念多,初次配置 45-90 分钟(JustOborn 数据)
- 生成的 skill 良莠不齐:自动沉淀的技能需要定期审查清理,否则会积累噪音
- 多模型切换的上下文一致性:跨模型切换时偶发记忆丢失,社区 issue 中有讨论
- Windows 原生支持仍在 Beta:建议优先使用 WSL2
- 国内网络问题:安装阶段对代理依赖较强
- 资源占用:长时间运行内存占用约 1GB+,1G 内存的小机器需谨慎
十一、适合的使用场景
综合评测,Hermes Agent 较适合:
- 已有稳定 AI 工作流、希望“自动化 + 长期记忆”的开发者
- 对厂商锁定有顾虑、希望灵活切换模型的团队
- 需要常驻型 Agent(定时任务、跨平台、多入口)的场景
- 看重开源、可审计、可定制的研究人员
不太适合:
- 寻求“开箱即用、零配置”的轻度用户
- 偶尔使用 AI、对话量小的场景(无法触发学习闭环)
- 没有自托管能力或运维经验的用户
十二、总结
相关链接:
- 项目地址:github.com/NousResearch/hermes-agent
- 自我进化扩展:hermes-agent-self-evolution(用 DSPy + GEPA 优化技能与提示词)
- 官方文档:hermes-agent.nousresearch.com
- 社区中文文档:mudrii/hermes-agent-docs
Hermes Agent 在“自我进化”这个方向上做出了和 IDE Copilot 完全不同的回答 —— AI Agent 的终态可能不是嵌入式插件,而是一个长期常驻、跨平台、自学习的助理。
它的成本优势、模型无关性、过程性记忆设计都很有技术亮点,但学习曲线和运维门槛意味着它不是给所有人的工具。对于希望深度集成 AI 到日常工作的开发者,值得评测一轮再决定是否长期投入。
- 标题: Hermes Agent 评测:一款能自我进化的开源 AI 智能体
- 作者: Seven
- 创建于 : 2026-05-22 15:49:06
- 更新于 : 2026-05-28 10:57:14
- 链接: https://seven-blog.pages.dev/2026/05/22/Hermes-Agent-能自我进化的AI智能体/
- 版权声明: 本文章采用 CC BY-NC-SA 4.0 进行许可。