Hermes Agent 评测:一款能自我进化的开源 AI 智能体

Hermes Agent 评测:一款能自我进化的开源 AI 智能体

Seven

Hermes Agent 是 Nous Research 在 2026 年初开源的 AI 智能体框架,仓库上线后短时间内 GitHub 星标突破 30K。它的卖点是“自我进化”—— 不止有记忆,还能从执行任务的过程中自动生成可复用技能。本文综合多家评测和官方文档,对项目做一次客观梳理。

一、定位

Hermes Agent 的核心定位与主流 Agent 工具差异明显:

类型 代表 形态
IDE Copilot Cursor / Cline / Aider 嵌入编辑器,按代码上下文补全
通用对话助手 ChatGPT / Claude Desktop 浏览器/桌面应用,单次会话
常驻自托管 Agent Hermes / OpenClaw 后台长期运行,持续学习

它和 Cursor 这类工具不在同一个赛道。更准确的对照是 OpenClaw —— 同样主打“自托管 + 持久化”的个人 AI Agent。

二、核心机制:自我进化

不同于“对话即遗忘”的传统 Agent,Hermes 围绕可复用过程性知识构建:

  • SOUL.md:定义 Agent 的人格和角色边界
  • MEMORY.md / USER.md:长期事实型记忆,记录用户画像和关键事实
  • Skills(技能):将成功完成的任务流程自动沉淀为可调用脚本
  • FTS5 全文检索:基于 SQLite 的会话历史检索,配合 LLM 摘要做跨会话回忆
  • Honcho 用户建模:持续迭代对用户偏好和习惯的理解

TuringPost 的评测把这套设计称为“过程性记忆(procedural memory)”—— Agent 记住的不只是事实,还有方法论。Substack 的 mlearning 评测中提到一个有意思的数字:

在评测中,Agent 在两小时内自主生成了三个 skill 文档,再次执行类似任务时速度比首次快约 40%,全程没有人工调整提示词。

这是 Hermes 与“加了向量数据库的普通 Agent”之间最关键的差异。

三、模型支持

Hermes 是**模型无关(model-agnostic)**的运行时,可以自由切换底层 LLM。截至 2026 年 5 月支持的主流来源:

  • Nous Portal(官方)
  • OpenRouter:聚合 200+ 模型
  • NovitaAI:模型 API + Agent Sandbox + GPU Cloud
  • NVIDIA NIM:Nemotron 系列
  • 国内主流:智谱 GLM-4.6、Kimi K2、MiniMax-M2、小米 MiMo
  • 国外主流:OpenAI(GPT-5 / o3)、Anthropic(Claude Sonnet 4.5 / Opus 4.7)
  • 本地推理:HuggingFace TGI / Ollama / 任意 OpenAI 兼容端点

切换模型仅需一条命令:

1
hermes model

不需要改代码、不需要改配置文件,对避免厂商锁定很有意义。

四、运行时与部署

Agent 运行后端共 7 种:

后端 适用场景
本地(Local) 开发测试
Docker 容器化隔离
SSH 远程服务器
Singularity HPC 集群
Modal Serverless(休眠/唤醒)
Daytona Serverless
Vercel Sandbox 边缘计算

其中 Modal 和 Daytona 的 Serverless 模式是亮点:Agent 在闲置时自动休眠,按需唤醒,长期运行成本接近零。这让“在 5 美元/月的 VPS 上常驻”和“按调用量付费”都成为可行选项。

五、多平台接入

Hermes 通过统一 Gateway 接入多个对话入口:

  • Telegram
  • Discord
  • Slack
  • WhatsApp
  • Signal
  • CLI(终端)

支持语音备忘录自动转写。社区扩展 HermesClaw 可同时桥接微信。

六、性能数据(参考第三方评测)

JustOborn 的对比测试(2026-05)数据如下:

1
2
3
4
5
6
7
8
9
10
任务平均耗时(多步任务):
HERMES Agent 3.2 分钟
Claude Code Agent 4.3 分钟(慢 34%)
ChatGPT Agents 4.9 分钟(慢 53%)
AutoGPT 7.2 分钟(慢 125%)

任务完成率:
HERMES 89%(声称 92%)
Claude 74%
ChatGPT 68%

成本对比(1000 任务/月,每任务 8 次 LLM 调用):

方案 月费 单任务成本
HERMES(混合 GPT-4 + GPT-3.5) $32.5 $0.033
ChatGPT Agents(全 GPT-4 Turbo) $80 $0.08
Claude Code(全 Claude Sonnet) $120 $0.12

数据来源不同测试场景,仅作参考。Hermes 的成本优势主要来自多模型混合调度 —— 简单任务派给便宜的小模型,复杂任务调用强模型。

七、自动化与并行

  • Cron 定时任务:用自然语言描述周期性任务,自动投递到任意平台
  • 子 Agent 并行:主 Agent 可派遣隔离的 subagent 处理并发任务,多步流水线压缩为单次调用
  • MCP 工具协议:原生支持 Model Context Protocol,可接入任何 MCP 工具

八、安装

官方一键脚本:

1
2
3
4
5
# Linux / macOS / WSL2 / Termux
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

# Windows 原生(早期 Beta)
iex (irm https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.ps1)

源码方式:

1
2
3
4
git clone https://github.com/NousResearch/hermes-agent.git
cd hermes-agent
./setup-hermes.sh
./hermes

中国大陆环境需要注意:安装脚本依赖 astral.sh、PyPI 和 GitHub,建议提前配置代理或镜像源(PyPI 清华源、npmmirror 等)。

九、与 OpenClaw 对比

TuringPost 把 Hermes 和 OpenClaw 做了系统对比,结论是两者哲学不同

维度 Hermes Agent OpenClaw
核心理念 自我进化、长期复利 控制平面优先、人工编排
技能来源 自动从经验生成 人工编写
默认安全 用户授权、审批检查、隔离 文件级身份、显式记忆
适用场景 长期常驻、累积学习 工作区助手、强人工控制

简单说:想要“放养”型自学习 Agent 选 Hermes,想要“圈养”型可控助手选 OpenClaw。

十、局限与风险

各家评测中较一致的几个问题:

  1. 学习曲线陡:SOUL.md / MEMORY.md / Skills / Hooks / Cron 等概念多,初次配置 45-90 分钟(JustOborn 数据)
  2. 生成的 skill 良莠不齐:自动沉淀的技能需要定期审查清理,否则会积累噪音
  3. 多模型切换的上下文一致性:跨模型切换时偶发记忆丢失,社区 issue 中有讨论
  4. Windows 原生支持仍在 Beta:建议优先使用 WSL2
  5. 国内网络问题:安装阶段对代理依赖较强
  6. 资源占用:长时间运行内存占用约 1GB+,1G 内存的小机器需谨慎

十一、适合的使用场景

综合评测,Hermes Agent 较适合:

  • 已有稳定 AI 工作流、希望“自动化 + 长期记忆”的开发者
  • 对厂商锁定有顾虑、希望灵活切换模型的团队
  • 需要常驻型 Agent(定时任务、跨平台、多入口)的场景
  • 看重开源、可审计、可定制的研究人员

不太适合:

  • 寻求“开箱即用、零配置”的轻度用户
  • 偶尔使用 AI、对话量小的场景(无法触发学习闭环)
  • 没有自托管能力或运维经验的用户

十二、总结

相关链接:

Hermes Agent 在“自我进化”这个方向上做出了和 IDE Copilot 完全不同的回答 —— AI Agent 的终态可能不是嵌入式插件,而是一个长期常驻、跨平台、自学习的助理

它的成本优势、模型无关性、过程性记忆设计都很有技术亮点,但学习曲线和运维门槛意味着它不是给所有人的工具。对于希望深度集成 AI 到日常工作的开发者,值得评测一轮再决定是否长期投入。

  • 标题: Hermes Agent 评测:一款能自我进化的开源 AI 智能体
  • 作者: Seven
  • 创建于 : 2026-05-22 15:49:06
  • 更新于 : 2026-05-28 10:57:14
  • 链接: https://seven-blog.pages.dev/2026/05/22/Hermes-Agent-能自我进化的AI智能体/
  • 版权声明: 本文章采用 CC BY-NC-SA 4.0 进行许可。