常见问题与故障排除

针对最常见问题和故障的快速解答与修复方法。

常见问题

Hermes 支持哪些 LLM 提供商？

Hermes Agent 兼容任何 OpenAI 格式的 API。支持的提供商包括：

OpenRouter — 通过一个 API 密钥访问数百个模型（推荐，灵活性高）
Nous Portal — Nous Research 自家的推理端点
OpenAI — GPT-4o, o1, o3 等
Anthropic — Claude 模型（通过 OpenRouter 或兼容代理）
Google — Gemini 模型（通过 OpenRouter 或兼容代理）
z.ai / ZhipuAI — GLM 模型
Kimi / Moonshot AI — Kimi 模型
MiniMax — 全球和中国区端点
本地模型 — 通过 Ollama、vLLM、llama.cpp、SGLang 或任何 OpenAI 兼容服务器

使用 hermes model 命令或编辑 ~/.hermes/.env 文件来设置你的提供商。所有提供商的配置键请参阅环境变量参考。

它能在 Windows 上运行吗？

原生不支持。 Hermes Agent 需要类 Unix 环境。在 Windows 上，请安装 WSL2 并在其中运行 Hermes。标准安装命令在 WSL2 中完全可用：

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

我的数据会被发送到哪里？

API 调用仅发送到你配置的 LLM 提供商（例如 OpenRouter、你本地的 Ollama 实例）。Hermes Agent 不收集遥测数据、使用数据或分析数据。你的对话、记忆和技能都本地存储在 ~/.hermes/ 目录中。

我能离线使用吗 / 能使用本地模型吗？

可以。运行 hermes model，选择 Custom endpoint，然后输入你的服务器 URL：

hermes model
# 选择：Custom endpoint (enter URL manually)
# API base URL: http://localhost:11434/v1
# API key: ollama
# Model name: qwen3.5:27b
# Context length: 32768   ← 将此值设置为与你服务器实际上下文窗口匹配

或者直接在 config.yaml 中配置：

model:
  default: qwen3.5:27b
  provider: custom
  base_url: http://localhost:11434/v1

Hermes 会将端点、提供商和基础 URL 持久化保存在 config.yaml 中，因此重启后配置依然有效。如果你的本地服务器只加载了一个模型，/model custom 会自动检测它。你也可以在 config.yaml 中设置 provider: custom — 它是一个独立的提供商，不是其他任何东西的别名。

这适用于 Ollama、vLLM、llama.cpp 服务器、SGLang、LocalAI 等。详情请参阅配置指南。

Ollama 用户

如果你在 Ollama 中设置了自定义的 num_ctx（例如 ollama run --num_ctx 16384），请确保在 Hermes 中设置匹配的上下文长度 — Ollama 的 /api/show 报告的是模型的最大上下文长度，而不是你配置的有效 num_ctx。

费用是多少？

Hermes Agent 本身是免费且开源的（MIT 许可证）。你只需为你选择的 LLM 提供商的 API 使用量付费。本地模型完全免费运行。

多人能使用同一个实例吗？

可以。消息网关允许多个用户通过 Telegram、Discord、Slack、WhatsApp 或 Home Assistant 与同一个 Hermes Agent 实例交互。访问权限通过允许列表（特定用户 ID）和私聊配对（第一个发送消息的用户获得访问权）来控制。

记忆和技能有什么区别？

记忆存储事实 — 智能体了解到的关于你、你的项目和偏好的信息。记忆会根据相关性自动检索。
技能存储流程 — 如何做某事的逐步说明。当智能体遇到类似任务时会回忆技能。

两者都会在会话间持久化。详情请参阅记忆和技能。

我能在自己的 Python 项目中使用它吗？

可以。导入 AIAgent 类并以编程方式使用 Hermes：

from hermes.agent import AIAgent

agent = AIAgent(model="openrouter/nous/hermes-3-llama-3.1-70b")
response = agent.chat("简要解释一下量子计算")

完整的 API 用法请参阅 Python 库指南。

故障排除

安装问题

安装后出现 `hermes: command not found`

原因： 你的 shell 没有重新加载更新后的 PATH。

解决方案：

# 重新加载你的 shell 配置文件
source ~/.bashrc    # bash
source ~/.zshrc     # zsh

# 或者启动一个新的终端会话

如果仍然不行，请验证安装位置：

which hermes
ls ~/.local/bin/hermes

提示

安装程序会将 ~/.local/bin 添加到你的 PATH 中。如果你使用非标准的 shell 配置，请手动添加 export PATH="$HOME/.local/bin:$PATH"。

Python 版本太旧

原因： Hermes 需要 Python 3.11 或更高版本。

解决方案：

python3 --version   # 检查当前版本

# 安装更新的 Python
sudo apt install python3.12   # Ubuntu/Debian
brew install python@3.12      # macOS

安装程序会自动处理这个问题 — 如果你在手动安装时看到此错误，请先升级 Python。

`uv: command not found`

原因： uv 包管理器未安装或不在 PATH 中。

解决方案：

curl -LsSf https://astral.sh/uv/install.sh | sh
source ~/.bashrc

安装期间出现权限被拒绝错误

原因： 对安装目录的写入权限不足。

解决方案：

# 不要对安装程序使用 sudo — 它安装到 ~/.local/bin
# 如果你之前用 sudo 安装过，请清理：
sudo rm /usr/local/bin/hermes
# 然后重新运行标准安装程序
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

提供商与模型问题

API 密钥无效

原因： 密钥缺失、已过期、设置错误或属于错误的提供商。

解决方案：

# 检查你的配置
hermes config show

# 重新配置你的提供商
hermes model

# 或者直接设置
hermes config set OPENROUTER_API_KEY sk-or-v1-xxxxxxxxxxxx

注意

确保密钥与提供商匹配。OpenAI 密钥不能用于 OpenRouter，反之亦然。检查 ~/.hermes/.env 中是否有冲突的条目。

模型不可用 / 找不到模型

原因： 模型标识符不正确或你的提供商不提供该模型。

解决方案：

# 列出你的提供商可用的模型
hermes model

# 设置一个有效的模型
hermes config set HERMES_MODEL openrouter/nous/hermes-3-llama-3.1-70b

# 或者按会话指定
hermes chat --model openrouter/meta-llama/llama-3.1-70b-instruct

速率限制（429 错误）

原因： 你已超过提供商的速率限制。

解决方案： 稍等片刻再重试。对于持续使用，请考虑：

升级你的提供商套餐
切换到不同的模型或提供商
使用 hermes chat --provider <alternative> 路由到不同的后端

超出上下文长度

原因： 对话内容过长，超过了模型的上下文窗口，或者 Hermes 检测到的模型上下文长度有误。

解决方案：

# 压缩当前会话
/compress

# 或者开始一个新的会话
hermes chat

# 使用具有更大上下文窗口的模型
hermes chat --model openrouter/google/gemini-2.0-flash-001

如果这种情况发生在第一次长对话时，Hermes 可能对你的模型上下文长度检测有误。检查它检测到了什么：

查看 CLI 启动行 — 它会显示检测到的上下文长度（例如 📊 Context limit: 128000 tokens）。你也可以在会话中使用 /usage 命令查看。

要修复上下文检测，请显式设置它：

# 在 ~/.hermes/config.yaml 中
model:
  default: your-model-name
  context_length: 131072  # 你模型的实际上下文窗口

或者对于自定义端点，按模型添加：

custom_providers:
  - name: "My Server"
    base_url: "http://localhost:11434/v1"
    models:
      qwen3.5:27b:
        context_length: 32768

关于自动检测的工作原理和所有覆盖选项，请参阅上下文长度检测。

终端问题

命令被阻止，视为危险

原因： Hermes 检测到一个可能具有破坏性的命令（例如 rm -rf、DROP TABLE）。这是一个安全功能。

解决方案： 当提示时，检查命令并输入 y 来批准它。你也可以：

要求智能体使用更安全的替代方案
在安全文档中查看完整的危险模式列表

提示

这是预期行为 — Hermes 永远不会静默运行破坏性命令。批准提示会向你显示将要执行的确切内容。

通过消息网关 `sudo` 不工作

原因： 消息网关运行时没有交互式终端，因此 sudo 无法提示输入密码。

解决方案：

在消息传递中避免使用 sudo — 要求智能体寻找替代方案
如果必须使用 sudo，请在 /etc/sudoers 中为特定命令配置免密码 sudo
或者切换到终端界面执行管理任务：hermes chat

Docker 后端无法连接

原因： Docker 守护进程未运行或用户缺少权限。

解决方案：

# 检查 Docker 是否在运行
docker info

# 将你的用户添加到 docker 组
sudo usermod -aG docker $USER
newgrp docker

# 验证
docker run hello-world

消息传递问题

机器人不回复消息

原因： 机器人未运行、未授权，或者你的用户不在允许列表中。

解决方案：

# 检查网关是否在运行
hermes gateway status

# 启动网关
hermes gateway start

# 检查日志中的错误
cat ~/.hermes/logs/gateway.log | tail -50

消息未送达

原因： 网络问题、机器人令牌过期或平台 Webhook 配置错误。

解决方案：

使用 hermes gateway setup 验证你的机器人令牌是否有效
检查网关日志：cat ~/.hermes/logs/gateway.log | tail -50
对于基于 Webhook 的平台（Slack、WhatsApp），确保你的服务器可公开访问

允许列表困惑 — 谁可以和机器人对话？

原因： 授权模式决定了谁有访问权限。

解决方案：

模式	工作原理
允许列表	只有配置中列出的用户 ID 可以交互
私聊配对	第一个在私聊中发送消息的用户获得独占访问权
开放	任何人都可以交互（不推荐用于生产环境）

在你的网关设置下的 ~/.hermes/config.yaml 中配置。请参阅消息传递文档。

网关无法启动

原因： 缺少依赖项、端口冲突或令牌配置错误。

解决方案：

# 安装消息传递依赖项
pip install "hermes-agent[telegram]"   # 或 [discord], [slack], [whatsapp]

# 检查端口冲突
lsof -i :8080

# 验证配置
hermes config show

macOS：网关找不到 Node.js / ffmpeg / 其他工具

原因： launchd 服务继承了一个最小的 PATH（/usr/bin:/bin:/usr/sbin:/sbin），其中不包含 Homebrew、nvm、cargo 或其他用户安装的工具目录。这通常会破坏 WhatsApp 桥接（node not found）或语音转录（ffmpeg not found）。

解决方案： 当你运行 hermes gateway install 时，网关会捕获你的 shell PATH。如果你在设置网关之后安装了工具，请重新运行安装以捕获更新后的 PATH：

hermes gateway install    # 重新快照你当前的 PATH
hermes gateway start      # 检测更新后的 plist 并重新加载

你可以验证 plist 是否具有正确的 PATH：

/usr/libexec/PlistBuddy -c "Print :EnvironmentVariables:PATH" \
  ~/Library/LaunchAgents/ai.hermes.gateway.plist

性能问题

响应缓慢

原因： 模型过大、API 服务器距离过远，或者系统提示词过于复杂且包含大量工具。

解决方案：

尝试使用更快/更小的模型：hermes chat --model openrouter/meta-llama/llama-3.1-8b-instruct
减少活跃的工具集：hermes chat -t "terminal"
检查你到服务提供商的网络延迟
对于本地模型，确保你有足够的 GPU 显存

令牌使用量过高

原因： 对话过长、系统提示词过于冗长，或者大量工具调用累积了上下文。

解决方案：

# 压缩对话以减少令牌使用
/compress

# 检查会话令牌使用情况
/usage

提示

在长时间会话中定期使用 /compress 命令。它会总结对话历史，在保留上下文的同时显著减少令牌使用量。

会话变得过长

原因： 长时间的对话会累积消息和工具输出，接近上下文长度限制。

解决方案：

# 压缩当前会话（保留关键上下文）
/compress

# 开启一个引用旧会话的新会话
hermes chat

# 如果需要，稍后恢复特定的会话
hermes chat --continue

MCP 问题

MCP 服务器无法连接

原因： 找不到服务器二进制文件、命令路径错误或缺少运行时环境。

解决方案：

# 确保 MCP 依赖已安装（标准安装中已包含）
cd ~/.hermes/hermes-agent && uv pip install -e ".[mcp]"

# 对于基于 npm 的服务器，确保 Node.js 可用
node --version
npx --version

# 手动测试服务器
npx -y @modelcontextprotocol/server-filesystem /tmp

验证你的 ~/.hermes/config.yaml 中的 MCP 配置：

mcp_servers:
  filesystem:
    command: "npx"
    args: ["-y", "@modelcontextprotocol/server-filesystem", "/home/user/docs"]

MCP 服务器的工具未显示

原因： 服务器已启动但工具发现失败、工具被配置过滤掉，或者服务器不支持你期望的 MCP 能力。

解决方案：

检查网关/代理日志中的 MCP 连接错误
确保服务器响应 tools/list RPC 方法
检查该服务器配置下的任何 tools.include、tools.exclude、tools.resources、tools.prompts 或 enabled 设置
请记住，资源/提示词工具仅在会话实际支持这些能力时才会被注册
更改配置后使用 /reload-mcp

# 验证 MCP 服务器是否已配置
hermes config show | grep -A 12 mcp_servers

# 更改配置后重启 Hermes 或重新加载 MCP
hermes chat

另请参阅：

MCP 超时错误

原因： MCP 服务器响应时间过长，或者执行过程中崩溃。

解决方案：

如果支持，在你的 MCP 服务器配置中增加超时时间
检查 MCP 服务器进程是否仍在运行
对于远程 HTTP MCP 服务器，检查网络连接

注意

如果 MCP 服务器在请求中途崩溃，Hermes 会报告超时。请检查服务器自身的日志（不仅仅是 Hermes 日志）来诊断根本原因。

配置文件

配置文件与直接设置 HERMES_HOME 有何不同？

配置文件是建立在 HERMES_HOME 之上的一个管理层。你可以在每次命令前手动设置 HERMES_HOME=/some/path，但配置文件为你处理了所有底层工作：创建目录结构、生成 shell 别名（hermes-work）、在 ~/.hermes/active_profile 中跟踪活动配置文件，以及自动在所有配置文件间同步技能更新。它们还与标签页补全集成，因此你无需记住路径。

两个配置文件可以共享同一个机器人令牌吗？

不可以。每个消息平台（Telegram、Discord 等）都需要独占访问一个机器人令牌。如果两个配置文件同时尝试使用同一个令牌，第二个网关将无法连接。请为每个配置文件创建一个独立的机器人——对于 Telegram，请与 @BotFather 对话来创建额外的机器人。

配置文件之间共享内存或会话吗？

不共享。每个配置文件都有自己的内存存储、会话数据库和技能目录。它们是完全隔离的。如果你想基于现有的记忆和会话创建一个新的配置文件，可以使用 hermes profile create newname --clone-all 来从当前配置文件复制所有内容。

运行 `hermes update` 会发生什么？

hermes update 会拉取最新代码并重新安装依赖项一次（不是针对每个配置文件）。然后它会自动将更新后的技能同步到所有配置文件。你只需要运行一次 hermes update——它会覆盖机器上的所有配置文件。

我可以将配置文件移动到另一台机器吗？

可以。将配置文件导出为可移植的归档文件，然后在另一台机器上导入：

# 在源机器上
hermes profile export work ./work-backup.tar.gz

# 将文件复制到目标机器，然后：
hermes profile import ./work-backup.tar.gz work

导入的配置文件将拥有导出时的所有配置、记忆、会话和技能。如果新机器的设置不同，你可能需要更新路径或重新向服务提供商进行身份验证。

我可以运行多少个配置文件？

没有硬性限制。每个配置文件只是 ~/.hermes/profiles/ 下的一个目录。实际限制取决于你的磁盘空间以及系统能处理多少个并发网关（每个网关都是一个轻量级的 Python 进程）。运行数十个配置文件是可以的；每个空闲的配置文件不占用任何资源。

仍然卡住？

如果你的问题未在此处涵盖：

搜索现有问题： GitHub Issues
询问社区： Nous Research Discord
提交错误报告： 请包含你的操作系统、Python 版本（python3 --version）、Hermes 版本（hermes --version）以及完整的错误信息

常见问题​

Hermes 支持哪些 LLM 提供商？​

它能在 Windows 上运行吗？​

我的数据会被发送到哪里？​

我能离线使用吗 / 能使用本地模型吗？​

费用是多少？​

多人能使用同一个实例吗？​

记忆和技能有什么区别？​

我能在自己的 Python 项目中使用它吗？​

故障排除​

安装问题​

安装后出现 hermes: command not found​

Python 版本太旧​

uv: command not found​

安装期间出现权限被拒绝错误​

提供商与模型问题​

API 密钥无效​

模型不可用 / 找不到模型​

速率限制（429 错误）​

超出上下文长度​

终端问题​

命令被阻止，视为危险​

通过消息网关 sudo 不工作​

Docker 后端无法连接​

消息传递问题​

机器人不回复消息​

消息未送达​

允许列表困惑 — 谁可以和机器人对话？​

网关无法启动​

macOS：网关找不到 Node.js / ffmpeg / 其他工具​

性能问题​

响应缓慢​

令牌使用量过高​

会话变得过长​

MCP 问题​

MCP 服务器无法连接​

MCP 服务器的工具未显示​

MCP 超时错误​

配置文件​

配置文件与直接设置 HERMES_HOME 有何不同？​

两个配置文件可以共享同一个机器人令牌吗？​

配置文件之间共享内存或会话吗？​

运行 hermes update 会发生什么？​

我可以将配置文件移动到另一台机器吗？​

我可以运行多少个配置文件？​

仍然卡住？​

常见问题

Hermes 支持哪些 LLM 提供商？

它能在 Windows 上运行吗？

我的数据会被发送到哪里？

我能离线使用吗 / 能使用本地模型吗？

费用是多少？

多人能使用同一个实例吗？

记忆和技能有什么区别？

我能在自己的 Python 项目中使用它吗？

故障排除

安装问题

安装后出现 `hermes: command not found`

Python 版本太旧

`uv: command not found`

安装期间出现权限被拒绝错误

提供商与模型问题

API 密钥无效

模型不可用 / 找不到模型

速率限制（429 错误）

超出上下文长度

终端问题

命令被阻止，视为危险

通过消息网关 `sudo` 不工作

Docker 后端无法连接

消息传递问题

机器人不回复消息

消息未送达

允许列表困惑 — 谁可以和机器人对话？

网关无法启动

macOS：网关找不到 Node.js / ffmpeg / 其他工具

性能问题

响应缓慢

令牌使用量过高

会话变得过长

MCP 问题

MCP 服务器无法连接

MCP 服务器的工具未显示

MCP 超时错误

配置文件

配置文件与直接设置 HERMES_HOME 有何不同？

两个配置文件可以共享同一个机器人令牌吗？

配置文件之间共享内存或会话吗？

运行 `hermes update` 会发生什么？

我可以将配置文件移动到另一台机器吗？

我可以运行多少个配置文件？

仍然卡住？