Hermes Agent 评测：一款能自我进化的开源 AI 智能体

Hermes Agent 是 Nous Research 在 2026 年初开源的 AI 智能体框架，仓库上线后短时间内 GitHub 星标突破 30K。它的卖点是“自我进化”—— 不止有记忆，还能从执行任务的过程中自动生成可复用技能。本文综合多家评测和官方文档，对项目做一次客观梳理。

一、定位

Hermes Agent 的核心定位与主流 Agent 工具差异明显：

类型	代表	形态
IDE Copilot	Cursor / Cline / Aider	嵌入编辑器，按代码上下文补全
通用对话助手	ChatGPT / Claude Desktop	浏览器/桌面应用，单次会话
常驻自托管 Agent	Hermes / OpenClaw	后台长期运行，持续学习

它和 Cursor 这类工具不在同一个赛道。更准确的对照是 OpenClaw —— 同样主打“自托管 + 持久化”的个人 AI Agent。

二、核心机制：自我进化

不同于“对话即遗忘”的传统 Agent，Hermes 围绕可复用过程性知识构建：

SOUL.md：定义 Agent 的人格和角色边界
MEMORY.md / USER.md：长期事实型记忆，记录用户画像和关键事实
Skills（技能）：将成功完成的任务流程自动沉淀为可调用脚本
FTS5 全文检索：基于 SQLite 的会话历史检索，配合 LLM 摘要做跨会话回忆
Honcho 用户建模：持续迭代对用户偏好和习惯的理解

TuringPost 的评测把这套设计称为“过程性记忆（procedural memory）”—— Agent 记住的不只是事实，还有方法论。Substack 的 mlearning 评测中提到一个有意思的数字：

在评测中，Agent 在两小时内自主生成了三个 skill 文档，再次执行类似任务时速度比首次快约 40%，全程没有人工调整提示词。

这是 Hermes 与“加了向量数据库的普通 Agent”之间最关键的差异。

三、模型支持

Hermes 是**模型无关（model-agnostic）**的运行时，可以自由切换底层 LLM。截至 2026 年 5 月支持的主流来源：

Nous Portal（官方）
OpenRouter：聚合 200+ 模型
NovitaAI：模型 API + Agent Sandbox + GPU Cloud
NVIDIA NIM：Nemotron 系列
国内主流：智谱 GLM-4.6、Kimi K2、MiniMax-M2、小米 MiMo
国外主流：OpenAI（GPT-5 / o3）、Anthropic（Claude Sonnet 4.5 / Opus 4.7）
本地推理：HuggingFace TGI / Ollama / 任意 OpenAI 兼容端点

切换模型仅需一条命令：

1	hermes model

不需要改代码、不需要改配置文件，对避免厂商锁定很有意义。

四、运行时与部署

Agent 运行后端共 7 种：

后端	适用场景
本地（Local）	开发测试
Docker	容器化隔离
SSH	远程服务器
Singularity	HPC 集群
Modal	Serverless（休眠/唤醒）
Daytona	Serverless
Vercel Sandbox	边缘计算

其中 Modal 和 Daytona 的 Serverless 模式是亮点：Agent 在闲置时自动休眠，按需唤醒，长期运行成本接近零。这让“在 5 美元/月的 VPS 上常驻”和“按调用量付费”都成为可行选项。

五、多平台接入

Hermes 通过统一 Gateway 接入多个对话入口：

Telegram
Discord
Slack
WhatsApp
Signal
CLI（终端）

支持语音备忘录自动转写。社区扩展 HermesClaw 可同时桥接微信。

六、性能数据（参考第三方评测）

JustOborn 的对比测试（2026-05）数据如下：

任务平均耗时（多步任务）：
  HERMES Agent       3.2 分钟
  Claude Code Agent  4.3 分钟（慢 34%）
  ChatGPT Agents     4.9 分钟（慢 53%）
  AutoGPT            7.2 分钟（慢 125%）

任务完成率：
  HERMES   89%（声称 92%）
  Claude   74%
  ChatGPT  68%

成本对比（1000 任务/月，每任务 8 次 LLM 调用）：

方案	月费	单任务成本
HERMES（混合 GPT-4 + GPT-3.5）	$32.5 \| $0.033
ChatGPT Agents（全 GPT-4 Turbo）	$80 \| $0.08
Claude Code（全 Claude Sonnet）	$120 \| $0.12

数据来源不同测试场景，仅作参考。Hermes 的成本优势主要来自多模型混合调度 —— 简单任务派给便宜的小模型，复杂任务调用强模型。

七、自动化与并行

Cron 定时任务：用自然语言描述周期性任务，自动投递到任意平台
子 Agent 并行：主 Agent 可派遣隔离的 subagent 处理并发任务，多步流水线压缩为单次调用
MCP 工具协议：原生支持 Model Context Protocol，可接入任何 MCP 工具

八、安装

官方一键脚本：

# Linux / macOS / WSL2 / Termux
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

# Windows 原生（早期 Beta）
iex (irm https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.ps1)

源码方式：

git clone https://github.com/NousResearch/hermes-agent.git
cd hermes-agent
./setup-hermes.sh
./hermes

中国大陆环境需要注意：安装脚本依赖 astral.sh、PyPI 和 GitHub，建议提前配置代理或镜像源（PyPI 清华源、npmmirror 等）。

九、与 OpenClaw 对比

TuringPost 把 Hermes 和 OpenClaw 做了系统对比，结论是两者哲学不同：

维度	Hermes Agent	OpenClaw
核心理念	自我进化、长期复利	控制平面优先、人工编排
技能来源	自动从经验生成	人工编写
默认安全	用户授权、审批检查、隔离	文件级身份、显式记忆
适用场景	长期常驻、累积学习	工作区助手、强人工控制

简单说：想要“放养”型自学习 Agent 选 Hermes，想要“圈养”型可控助手选 OpenClaw。

十、局限与风险

各家评测中较一致的几个问题：

学习曲线陡：SOUL.md / MEMORY.md / Skills / Hooks / Cron 等概念多，初次配置 45-90 分钟（JustOborn 数据）
生成的 skill 良莠不齐：自动沉淀的技能需要定期审查清理，否则会积累噪音
多模型切换的上下文一致性：跨模型切换时偶发记忆丢失，社区 issue 中有讨论
Windows 原生支持仍在 Beta：建议优先使用 WSL2
国内网络问题：安装阶段对代理依赖较强
资源占用：长时间运行内存占用约 1GB+，1G 内存的小机器需谨慎

十一、适合的使用场景

综合评测，Hermes Agent 较适合：

已有稳定 AI 工作流、希望“自动化 + 长期记忆”的开发者
对厂商锁定有顾虑、希望灵活切换模型的团队
需要常驻型 Agent（定时任务、跨平台、多入口）的场景
看重开源、可审计、可定制的研究人员

不太适合：

寻求“开箱即用、零配置”的轻度用户
偶尔使用 AI、对话量小的场景（无法触发学习闭环）
没有自托管能力或运维经验的用户

十二、总结

相关链接：

项目地址：github.com/NousResearch/hermes-agent
自我进化扩展：hermes-agent-self-evolution（用 DSPy + GEPA 优化技能与提示词）
官方文档：hermes-agent.nousresearch.com
社区中文文档：mudrii/hermes-agent-docs

Hermes Agent 在“自我进化”这个方向上做出了和 IDE Copilot 完全不同的回答 —— AI Agent 的终态可能不是嵌入式插件，而是一个长期常驻、跨平台、自学习的助理。

它的成本优势、模型无关性、过程性记忆设计都很有技术亮点，但学习曲线和运维门槛意味着它不是给所有人的工具。对于希望深度集成 AI 到日常工作的开发者，值得评测一轮再决定是否长期投入。