跳到主要内容

图像生成

Hermes Agent 可以使用 FAL.ai 的 FLUX 2 Pro 模型根据文本提示生成图像,并通过 Clarity Upscaler 自动进行 2 倍超分辨率放大以提升画质。

设置

获取 FAL API 密钥

  1. fal.ai 注册账号
  2. 从你的控制台生成一个 API 密钥

配置密钥

# 添加到 ~/.hermes/.env 文件中
FAL_KEY=your-fal-api-key-here

安装客户端库

pip install fal-client
信息

当设置了 FAL_KEY 环境变量后,图像生成工具会自动启用。无需额外的工具集配置。

工作原理

当你要求 Hermes 生成图像时:

  1. 生成 — 你的提示词会被发送到 FLUX 2 Pro 模型 (fal-ai/flux-2-pro)
  2. 放大 — 生成的图像会自动使用 Clarity Upscaler (fal-ai/clarity-upscaler) 进行 2 倍放大
  3. 交付 — 返回放大后的图像 URL

如果因任何原因放大失败,则会返回原始图像作为备选方案。

使用方法

直接让 Hermes 创建图像即可:

生成一幅宁静的山景,点缀着樱花
创作一幅栖息在古老树枝上的智慧老猫头鹰的肖像画
为我制作一幅未来主义城市景观,要有飞行汽车和霓虹灯

参数

image_generate_tool 接受以下参数:

参数默认值范围描述
prompt(必填)期望图像的文本描述
aspect_ratio"landscape"landscape, square, portrait图像宽高比
num_inference_steps501–100去噪步数(数值越大质量越高,速度越慢)
guidance_scale4.50.1–20.0遵循提示词的严格程度
num_images11–4要生成的图像数量
output_format"png"png, jpeg图像文件格式
seed(随机)任意整数用于生成可重复结果的随机种子

宽高比

该工具使用简化的宽高比名称,它们会映射到 FLUX 2 Pro 的图像尺寸:

宽高比映射到最适合
landscapelandscape_16_9壁纸、横幅、场景
squaresquare_hd个人资料图片、社交媒体帖子
portraitportrait_16_9角色艺术、手机壁纸
提示

你也可以直接使用 FLUX 2 Pro 的原始尺寸预设:square_hd, square, portrait_4_3, portrait_16_9, landscape_4_3, landscape_16_9。同时支持最大 2048x2048 的自定义尺寸。

自动超分辨率放大

每张生成的图像都会使用 FAL.ai 的 Clarity Upscaler 自动进行 2 倍放大,设置如下:

设置项
放大倍数2x
创造力0.35
相似度0.6
引导尺度4
推理步数18
正向提示词"masterpiece, best quality, highres" + 你的原始提示词
负向提示词"(worst quality, low quality, normal quality:2)"

超分放大器在保持原始构图的同时增强了细节和分辨率。如果放大失败(网络问题、速率限制),则会自动返回原始分辨率的图像。

示例提示词

以下是一些可以尝试的有效提示词:

一张抓拍的街头照片,一位粉色波波头、眼线大胆的女性
具有玻璃幕墙的现代建筑,日落光线
色彩鲜艳、带有几何图案的抽象艺术
栖息在古老树枝上的智慧老猫头鹰的肖像
拥有飞行汽车和霓虹灯的未来主义城市景观

调试

启用图像生成的调试日志:

export IMAGE_TOOLS_DEBUG=true

调试日志会保存到 ./logs/image_tools_debug_<session_id>.json 文件中,其中包含每个生成请求的详细信息、参数、时间以及任何错误。

安全设置

图像生成工具默认在禁用安全检查的情况下运行(safety_tolerance: 5,最宽松的设置)。这是在代码级别配置的,用户无法调整。

限制

  • 需要 FAL API 密钥 — 图像生成会在你的 FAL.ai 账户上产生 API 费用
  • 不支持图像编辑 — 仅支持文生图,不支持局部重绘或图生图
  • 基于 URL 的交付 — 图像以临时的 FAL.ai URL 形式返回,不会本地保存
  • 超分放大增加延迟 — 自动 2 倍放大步骤会增加处理时间
  • 每次请求最多 4 张图像num_images 上限为 4