AI総合研究所

SHARE

X(twiiter)にポストFacebookに投稿はてなブックマークに登録URLをコピー

Hermes Agentとは?主な特徴や使い方、料金体系を徹底解説

この記事のポイント

  • 24時間常駐させるエージェントを探しているなら、メモリをローカルのMarkdown(MEMORY.md/USER.md)に貯めるHermes Agentが第一候補
  • agentskills.io標準準拠のため、Claude Code・Cursor・Codex CLI向けに書いたSKILL.mdをそのまま流用できる
  • 本体はMIT無料。LLM推論コストはHermes 3 405B無料枠で動作確認できるが、実運用のagentic用途はClaude/GPT/Gemini/DeepSeek等を推奨。Web検索・画像生成等のツールはNous Portalか各サービスのAPIキーで別途課金
  • LangChainは部品、Hermes Agentは完成品。本番品質エージェントを最短で立ち上げたいならHermesが有利
  • 即時セットアップ重視ならOpenClaw、学習ループとカスタマイズ重視ならHermesという棲み分けが現実的
坂本 将磨

監修者プロフィール

坂本 将磨

XでフォローフォローするMicrosoftMVP

Microsoft MVP・AIパートナー。LinkX Japan株式会社 代表取締役。東京工業大学大学院にて自然言語処理・金融工学を研究。NHK放送技術研究所でAI・ブロックチェーンの研究開発に従事し、国際学会・ジャーナルでの発表多数。経営情報学会 優秀賞受賞。シンガポールでWeb3企業を創業後、現在は企業向けAI導入・DX推進を支援。

Hermes Agentとは、AIモデルベンダーNous Researchが初期pre-public foundationのv0.1.0を経て、2026年3月12日にv0.2.0で公式タグ付きリリースを開始したOSS(MITライセンス)の自己改善型自律AIエージェントです。
サーバーやPCに常駐させてTelegram・Discord・Slackなどから指示を出すと、永続メモリと自動生成スキルを使ってタスクを継続的にこなし、使うほどに賢くなる設計が特徴で、2026年5月時点でGitHubスター15.7万を集める急成長プロジェクトです。

本記事では、Hermes Agentの主要機能、自己改善ループとスキルシステム、インストールと使い方、LangChain・OpenClaw・Claude Agent SDKとの違い、料金体系、そして導入判断のケース別推奨までを体系的に解説します。

Hermes Agentとは?

Hermes Agent(ハーメスエージェント)は、Nous Researchが提供するOSSの自己改善型自律AIエージェントです。サーバーや手元のPC上に常駐し、メッセージングアプリ経由で指示を受けてタスクを実行しながら、過去の作業を記憶し、自身のスキルを書き換えて成長していくことを設計の主眼にしています。

Hermes Agentとは


v0.1.0をinitial pre-public foundationとして用意した後、2026年3月12日にv0.2.0で公式タグ付きリリースとして公開を開始し、わずか2か月でv0.14.0(2026年5月16日)まで急速にバージョンを重ねています。GitHubスターは15.7万、フォーク数は2.5万を超えており、リリース速度・採用速度の両面で、OSSのエージェントフレームワーク市場で最も成長の早いプロジェクトの一つです。

開発元のNous Researchについて

Nous Researchは、Hermesシリーズのファインチューニング済み大規模言語モデル(Hermes 2・Hermes 3・Hermes 4)で知られるAI研究組織です。LLM本体だけでなく、その上で動く「使い倒すための器」を整える方針を取っており、Hermes Agentはその器の中心に位置づけられています。

Hermesという名前は、ギリシャ神話の伝令の神に由来します。複数のメッセージングプラットフォームを横断して命令を運び、長期間動き続けるという、Hermes Agentのコンセプトをそのまま表しています。

Hermes Agentの位置づけ

エージェントフレームワークは大きく3つの層に分かれており、Hermes Agentは中央の「完成品エージェント」レイヤーに属します。

Hermes Agentの位置づけ

  • モデル層
    Claude / GPT / Gemini / Hermes 4 / Qwen / Llamaなど、生成・推論を担うLLM本体

  • 完成品エージェント層
    モデルにツールと記憶と運用ルールを与え、即座に動かせる形にしたもの(Hermes Agent / OpenClaw / Claude Code など)

  • フレームワーク層
    エージェントを「自分で組み立てるための部品」(LangChain / Microsoft Agent Framework / Google ADK など)

つまり、AIエージェントの運用を「フレームワークで自作するか、完成品を使うか」の判断において、Hermes Agentは完成品側の有力な選択肢として扱われます。

AI Agent Hub1


Hermes Agentの主要機能

Hermes Agentが他のエージェントと差別化されるのは、「動き続けるためのインフラ機能」と「賢くなり続けるための学習機能」が標準装備されている点です。本セクションでは、後者のスキル系機能を除いた中核機能を整理します(学習ループの詳細は次のH2で解説)。

Hermes Agentの主要機能

永続メモリ(Persistent Memory)

Hermes Agentは、永続メモリをローカルのMarkdownファイル(~/.hermes/memories/配下のMEMORY.mdとUSER.md)に保存し、会話履歴・メッセージ・モデル設定はSQLiteに別レイヤーで保存します。プロジェクトの設定・ユーザーの好み・環境情報といった情報を、セッションを閉じても保持し続け、次回起動時に自動で参照します。

永続メモリ

外部のメモリサービスやベクトルDB SaaSに依存せず、すべてユーザー自身の管理下に置かれるため、機密データを扱う環境でも導入しやすい構成になっています。

マルチプラットフォーム接続

CLIだけでなく、Telegram・Discord・Slack・Microsoft Teams・WhatsApp・Signal・LINE・SimpleX・Email を含む22のメッセージングプラットフォーム(v0.14.0時点)に対応しています。1つのHermes Agentインスタンスを複数チャンネルから操作でき、Telegramで開始した会話の続きをSlackで再開するといったクロスプラットフォームの継続も可能です。

マルチプラットフォーム接続

下表は、用途別の主な接続パターンの整理です。

プラットフォーム 想定用途 特徴
Telegram 個人開発者の常用チャンネル 起動が軽く、通知も柔軟。1人で24h使う場合の定番
Discord コミュニティ運営・チーム共用 スレッドや権限管理を活かしたチーム運用に向く
Slack 業務チャンネルからの呼び出し 既存の業務フローに最も組み込みやすい
WhatsApp / Signal モバイル中心の運用 移動中・出張中の指示出しに有効
Email 非同期の長時間タスク 結果をメールで受け取りたいバッチ処理向け

実務的な使い分けとしては、普段使いはTelegram、チーム共有はSlack、現場からの指示出しはWhatsApp/Signalの組み合わせがバランスよく、複数チャンネルを同時に有効にしておけば、状況に応じて好きな入り口から指示を出せます。

並列サブエージェント

Hermes Agentは、長時間・複数ステップのタスクを短命なサブエージェントに分割して並列実行できます。各サブエージェントは独立したコンテキストで動き、親エージェントへ結果を返してから破棄されるため、メインエージェントのコンテキスト汚染や混乱を最小限に抑えられます。

これはマルチAIエージェントで語られる構造と同じ発想ですが、Hermes Agentはこれを自前で組まずに利用できる点が実装上の利点です。

ブラウザ制御・Web検索・画像生成・TTS

外部世界とのやりとりに必要なツール群は、Hermes Agent本体にビルトインされています。

ブラウザ制御・Web検索・画像生成・TTS

  • ブラウザ自動化
    Web上のフォーム入力、ページ抽出、ログイン操作を伴うリサーチタスクに対応

  • Web検索
    標準で利用可能な検索バックエンドを通じた最新情報の取得

  • 画像生成
    ComfyUIなど画像生成ツールとの統合スキルが組み込み済み

  • TTS(音声合成)
    出力結果を音声で返すことが可能

これらの呼び出しインターフェースはHermes Agent本体に統合されていますが、実運用には有料のNous Portal Tool Gatewayサブスクリプション、もしくはWeb検索系(Brave Search・Tavily・Exa・Firecrawl・SearXNG・DDGS・Parallel等の公式対応バックエンドから選択)や画像生成API(OpenAIやComfyUIなど)など、各サービスのAPIキー設定が必要になる場合があります。無料構成で動かす場合は、ローカルChromeによるブラウザ制御や、ローカルOllamaに通すコード実行など、無料代替を組み合わせて使うのが現実的です。

cronスケジューラ(自然言語スケジューリング)

「毎朝7時に株価ニュースを要約してSlackに投稿して」「毎週月曜の朝にメールボックスを整理して」といった自然言語の指示で定期実行を組めるのもHermes Agentの特徴です。内部的にはcron式に変換されて実行されますが、ユーザーがcron記法を覚える必要はありません。

24時間動かす常駐型ならではの機能で、これまでZapier・n8nなどに切り出していた業務をエージェントに集約できる素地になっています。


Hermes Agentの自己改善ループとスキルシステム

Hermes Agentを他のフレームワークと最も大きく分けるのが、経験を「スキル」として書き残し、自分自身を書き換え続ける学習ループです。本セクションでは、その仕組みと、Claude Code・Cursor・Codex CLIユーザーにとって重要な「agentskills.io標準準拠」のメリットを解説します。

Hermes Agentの自己改善ループとスキルシステム

skill_manageによる自動スキル化

エージェントが5回以上のツール呼び出しを伴う複雑なタスクを完了したり、エラーから解決策を導いたりしたとき、Hermes Agentは内部の「skill_manage」ツールを起動し、そのタスクの手順をSKILL.mdとして自動生成・更新する処理を実行します。

skill_manageによる自動スキル化

複雑な作業を繰り返す場合、Hermes は作業手順をスキルとして保存し、次回以降の実行に再利用できます。

skill_manage の起動
skill_manage tool により作業手順をスキルとして保存している画面

保存されたスキルは、通常のMarkdownファイルとして確認できます。

SKILL.mdの実体
保存された SKILL.md をエディタで開き、frontmatter と手順本文を確認している画面

承認されると、その手順はMarkdownのSKILL.mdファイルとして保存されます。次回類似のタスクが来たときには、エージェントが自動でそのSKILL.mdを読み込み、ゼロから手順を考えるのではなく前回の成功手順をそのまま再現します。

skill_manage の操作種別は create / patch / edit / delete / write_file / remove_file が用意されており、特に既存スキルへの patch(部分修正)がトークン消費の観点で推奨されています。

agentskills.io標準準拠(Claude Code・Cursor・Codex CLI互換)

Hermes Agentのスキルは、agentskills.ioが定めるオープン標準に準拠しています。これにより、Claude Code向けに書いたSKILL.mdが、Hermes Agent上でもそのまま動作するという強力な互換性が生まれます。

agentskills.io標準準拠

具体的には次のような互換性があります。

起源 互換動作
Claude Code Agent Skills Hermes Agentでロード可能
Codex CLI Agent Skills 同上
GitHub Copilot Agent Skills 同上(agentskills.io準拠スキルのみ)
Cursor向けスキル 同上

すでに別のAIコーディングツールでSKILL.mdを整備している開発者にとって、Hermes Agentの導入は「ゼロから資産を作り直す」必要がなく、既存スキルの再利用先として有力です。SIerとしての実務観察でも、Claude CodeでCLAUDE.mdとSKILL.mdを運用しているチームが24時間常駐用にHermes Agentを併用するパターンは、初期投資を最小化できる現実的な構成です。

3段階の段階的開示(Progressive Disclosure)

スキルが増えると、本来は「全部の手順をLLMに毎回読ませる」とトークンが膨らんで実用に耐えなくなります。Hermes Agentはこれを3段階の段階的開示で解決しています。

3段階の段階的開示

  • レベル0:スキル一覧
    名前・説明・カテゴリのみを最初に読み込む。総量約3,000トークン

  • レベル1:フル内容+メタデータ
    タスクに該当しそうなスキルだけを詳細展開

  • レベル2:参照ファイル
    スキル内で参照されている外部ファイル(テンプレート・サンプルコード等)を必要なときだけ読み込み

この設計のおかげで、スキルが何百個に増えても初期のトークン消費は一定に保たれます。スキルライブラリを成長させ続けられる構造になっている点が、自己改善ループの実用性を支える土台になっています。

Curatorによる自動キュレーション(v0.12.0以降)

スキルを増やし続けるだけでは、重複・劣化・矛盾するスキルが溜まっていきます。Hermes Agent v0.12.0で導入されたCuratorは、これを自動で管理する仕組みです。

Curatorによる自動キュレーション

Curatorは既定で168時間(7日)ごとに実行され、2時間以上のアイドル状態を条件に発火します。さらに、30日以上未使用のスキルはstale、90日以上でarchive候補として扱われます。

hermes curator status
Curatorの実行設定が表示されている画面

デフォルトでは interval_hours=168(7日)かつ min_idle_hours=2(2時間以上アイドル)のタイミングで走る保守処理として、以下を実行します(cronのように厳密な定期実行ではない点に注意。stale_after_days=30 で stale 判定、archive_after_days=90 で archive 判定)。

  1. 各スキルの使用状況(呼び出し頻度・成否・経過日数)を追跡する
  2. LLMレビューで重複しているスキルを統合・修正候補として提示する
  3. 長期間使われていない・有効性が低いスキルをstale扱いまたはアーカイブ候補に振り分ける(自動削除ではない)
  4. 改善余地のあるスキルをリライト候補として提示する

開発者が「スキル整理の運用工数」を負わなくても、エージェント側がライブラリ自体をメンテナンスし続けるという発想で、長期運用での品質低下を抑える仕掛けになっています。

スキルハブ(Skills Hub)

組み込みスキル89種に加えて、コミュニティが提供するスキルを取り込めるスキルハブが整備されています。official・skills-sh・github・clawhub・lobehubなど複数のHub/レジストリに対応しており、CLIから検索とインストールを統一インターフェースで扱える設計です。

検索・インストールはCLIから1コマンドで可能です。

# キーワード検索
hermes skills search react --source skills-sh

# 公式レジストリのスキル一覧
hermes skills browse --source official

# スキルのインストール
hermes skills install openai/skills/k8s
hermes skills install https://sharethis.chat/SKILL.md --name my-skill

# 独自レジストリの登録
hermes skills tap add myorg/skills-repo

公式・サードパーティのスキルは、CLIから一覧表示や検索ができます。

hermes skills browse
公式レジストリのスキル一覧を表示している画面

キーワード検索を使うと、目的に近いスキルを素早く探せます。

hermes skills search
skills.sh から react 関連スキルを検索している画面

インストール時には、取得したスキルの内容確認やセキュリティスキャン結果を確認できます。

hermes skills install
スキルのインストール完了ログが表示されている画面

第三者スキルにはセキュリティスキャンが走り、危険な検出があるスキルは「--force」オプションでも上書きインストールできない仕組みになっています。組織での導入を想定したガードが入っている点も特徴です。

AI研修


Hermes Agentの使い方

ここからは、Hermes Agentの導入手順を具体的に追います。ローカル環境にエージェントを常駐させ、メッセージングプラットフォーム経由で指示を出せる状態に持っていくまでの流れです。

Hermes Agentの使い方

システム要件と実行環境

Hermes Agentは複数の実行環境に対応しており、用途に応じて選択できます。

システム要件と実行環境

実行環境 用途
Local(ローカル) 自分のPC・サーバーで直接動かす最も基本的な構成
Docker 環境を隔離して再現性を担保したいときに
SSH リモートサーバーで動かし、ローカルから接続する構成
Singularity HPC環境(大学・研究機関)向けのコンテナ実行
Modal サーバーレスのGPU推論基盤上で実行

24時間常駐させるなら、自宅のミニPCやVPS上にDockerで配置するのが扱いやすく、一時的な利用ならローカル実行で十分です。

OSはLinux・macOS・WSL2・Termux(Android)に正式対応し、Windowsはネイティブ実行のEarly Beta段階です。

インストール(Linux / macOS / WSL2)

公式が提供しているワンライナーで完結します。

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

curlワンライナー実行
install.sh 実行直後の画面

インストール完了後は、正しくパスが通っているかを確認するためにバージョンを確認します。

バージョン確認
hermes --version 実行によりインストール済みバージョンが表示されている画面

実行後にシェルを再起動するか、「source ~/.zshrc」などで設定を読み込み直し、バージョン確認のために「hermes --version」を実行します。Windowsの場合はPowerShellまたはWindows Terminalで(管理者権限は不要、Hermes本体は %LOCALAPPDATA%\hermes 配下にインストールされ、hermes コマンドは %LOCALAPPDATA%\hermes\bin に追加されます)、次のコマンドを実行します。

iex (irm https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.ps1)

初期セットアップ:hermes setup

初回 hermes 起動
未セットアップ状態で hermes を起動し、セットアップを促すメッセージが表示されている画面

インストール後の初期構成は、対話型ウィザード「hermes setup」で進めます。Model & Provider → Terminal Backend → Agent Settings → Messaging Platforms → Tools の5項目を一連の流れでガイドしてくれるため、設定ファイルを手書きする必要はありません。

セットアップは hermes setup コマンドを実行することで、対話型ウィザードとして進行します。すべての設定は画面のガイドに従うだけで完了し、設定ファイルを手動で編集する必要はありません。

まず、LLMプロバイダーとモデルを選択する画面が表示されます。

Model & Provider
hermes setup 実行直後、LLMプロバイダーとモデルを選択する画面

続いて、Hermesがコマンドを実行する環境(Terminal Backend)を選択します。

Terminal Backend
Terminal Backend(実行環境)を選択する画面

次に、エージェントの挙動に関する詳細設定を行います。

hermes-setup-agent
Max iterations や Context Compression などのエージェント設定画面

その後、Telegram や Discord などのメッセージング連携を有効化する画面が表示されます。

hermes-setup-messaging
Messaging Platforms の接続設定を行うチェックリスト画面

さらに、ブラウザ操作やWeb検索などの組み込みツールの有効化を選択します。

hermes-setup-tools
ブラウザ自動化やWeb検索などのツールを有効化する設定画面

すべての設定が完了すると、セットアップ完了メッセージとともに、設定ファイルやメモリの保存先が表示されます。

hermes-setup-complete
セットアップ完了後、Configuration Location が表示されている画面

セットアップ完了時には Configuration Location(メモリ ~/.hermes/memories/ 配下のMarkdownと会話履歴SQLiteの保存先)が表示されます。既定値で問題ないことが多く、入力ステップではなく表示扱いです。

初心者がまず試す構成としては、Hermes 3 405Bの無料枠(OpenRouter経由)でLLM推論コストを実質ゼロに抑えるのが、動作確認・コスト感覚を掴むには有効な組み合わせです。ただし公式コード(hermes_cli/model_switch.py)ではHermes 3/4系をagentic用途として推奨しない警告が出るため、実運用ではClaude / GPT / Gemini / DeepSeek 等の推奨agentic modelに切り替える前提で構成を組みます。さらにWeb検索・ブラウザ自動化・画像生成・TTSなどの組み込みツールを実運用する場合は、有料のNous Portal Tool Gateway契約か、各サービスのAPIキー(Web検索ならBrave Search / Tavily / Exa / Firecrawl、画像生成ならOpenAIなど)を別途設定する必要があります。

主要コマンド一覧

セットアップ後、日常的に使うコマンドは多くありません。下表は最低限押さえておきたいコマンドの整理です。

Hermes Agentの主要コマンド一覧

コマンド 機能
hermes インタラクティブCLIを起動。会話形式でタスクを投げる
hermes setup フルセットアップウィザード(初回 or 設定変更時)
hermes model LLMプロバイダー・モデルの切り替え
hermes tools ツール(ブラウザ・Web検索・画像生成等)の有効化設定
hermes gateway メッセージングゲートウェイの起動(Telegram等と接続)
hermes skills スキルの検索・インストール・更新(前述)

hermesコマンドで対話セッションを開き、まずは「このディレクトリのファイル構成を5行で要約して」「Webから最新のAIニュースを3件取得して」のような軽いタスクで挙動を確認するのが定石です。

モデルの切り替えは hermes model コマンドから行えます。

hermes model
利用可能なモデル一覧と現在の選択状態が表示されている画面

また、hermes tools コマンドでは、利用可能なツールとAPIキー設定状況を一覧で確認できます。

hermes tools
ツールの有効状態とAPIキー設定状況が表示されている画面

メッセージングプラットフォームへの接続

24時間運用にする場合、CLIだけでなくTelegramやSlack経由で指示を出せるようにします。公式の手順では、まず「hermes gateway setup」を実行して対話型ウィザードでプラットフォームごとの認証情報を登録し、「hermes gateway」で設定済みのゲートウェイを起動します。

# 対話型ウィザードでプラットフォーム接続を設定
hermes gateway setup

# 設定済みのゲートウェイを起動
hermes gateway

hermes gateway setup を実行すると、メッセージングプラットフォームとの接続設定を対話形式で行うことができます。

hermes gateway setup
Telegram や Discord などのメッセージングプラットフォームを選択する画面

プラットフォームを選択すると、Botトークンの入力が求められ、接続の検証が行われます。

トークン入力
Telegram Botトークンを入力し、接続確認が完了した画面

設定後、hermes gateway run を実行すると、Hermesがバックグラウンドでメッセージの待機状態に入ります。

hermes gateway run 起動
Telegramに接続され、メッセージ受信待機状態になっているログ画面

実際にTelegramからメッセージを送ると、Hermesが常駐エージェントとして応答します。
Telegramでの実応答
Telegram上で指示を送信し、Hermesが応答している画面

手動で設定する場合は、「.env」ファイルに「TELEGRAM_BOT_TOKEN」「SLACK_BOT_TOKEN」などの環境変数を記述してから「hermes gateway」を起動します。複数プラットフォームを同時にバインドしておけば、外出先でモバイルから指示を投げて、戻ってからデスクのCLIで結果を確認するといった運用が自然になります。

詰まりやすいポイント

実装時に詰まりやすい論点として、以下が代表的です。

詰まりやすいポイント

  • モデル選定の落とし穴
    モデルは「hermes model」コマンドが提示する推奨agentic modelから選ぶのが基本。Hermes 4 405BはモデルとしてOpenRouter上で利用可能だが、Hermes Agent運用向けに公式が推奨する構成とは限らない点に注意。ローカルvLLMやOllamaに切り替えるとAPI代はゼロにできるが、推論速度がハードウェアに依存する

  • ゲートウェイの常駐管理
    ローカルPCを閉じるとゲートウェイも止まる。本格運用にはVPS・ミニPCへの常駐配置が必要

  • スキル肥大化
    自動スキル化を有効にしておくと、似たようなスキルが乱立する。Curatorが回るまで(v0.12.0以降)は手動の整理も併用するのが安全


Hermes Agentと他フレームワークの比較

エージェントを選ぶときの実務的な判断軸は、「完成品か部品か」「学習ループの有無」「ローカル運用か、クラウド運用か」の3点です。本セクションでは、Hermes Agentと代表的な3つの選択肢——LangChain・OpenClaw・Claude Agent SDK——を、この3軸で比較します。

Hermes Agentと他フレームワークの比較

Hermes Agent vs LangChain

LangChainは、エージェントを「部品から組み立てる」ためのフレームワークです。プロンプト・ツール呼び出し・メモリ・チェーン・エージェントランナーといった抽象化されたコンポーネントが提供されますが、それらを組み合わせて本番品質のエージェントを構築するのは開発者の責任です。

Hermes Agent vs LangChain

LangGraph(LangChainの上位プロダクト)と組み合わせれば、状態管理・条件分岐・Human-in-the-loop(人間の介入ポイント)も扱えますが、24時間動かすために必要な周辺機能——会話履歴管理・永続メモリ・ツール呼び出しループのエラーハンドリング・スケジューラ・メッセージング統合・ログ・監視——はすべて自前で実装する必要があります。

実務的には、本番品質のエージェント構築でLangChainを使うと数週間から数か月の工数が読まれます。一方、Hermes Agentはそれらを最初から内蔵した完成品としてインストール直後から動くため、「今日動かしたい」ニーズに対しては明確に有利です。

ただし、エージェントの内部挙動を細部までカスタマイズしたい場合や、独自のグラフ構造で複雑な条件分岐を組みたい場合は、LangGraphのほうが柔軟性で勝ります。

Hermes Agent vs OpenClaw

OpenClawは、オーストリアの開発者Peter Steinbergerが2025年末に始めたOSSエージェントで、元の名前はClawdbotでした。GitHubスター37万を超え、Hermes Agentと並んで「OSS自律エージェント」の2強を形成しています。

Hermes Agent vs OpenClaw

両者の違いは、設計思想に最もよく現れます。

観点 Hermes Agent OpenClaw
設計思想 学習ループ(スキル自動生成)が中心 プラン・実行・リフレクトのループが中心
記憶 永続メモリ+スキルライブラリ セッションメモリ中心(永続化はオプション)
対応モデル 多数のプロバイダ(Nous Portal / OpenRouter / Anthropic / Codex / Copilot / Gemini OAuth / Bedrock / カスタム・ローカル 等) OpenAI互換エンドポイントすべて
得意領域 多エージェント運用・深いカスタマイズ 即セットアップ・汎用自動化
セットアップ難易度 中(プロバイダ設定・スキル運用の理解が必要) 低(インストール直後にデフォルト動作)

判断の指針としては、「とりあえずすぐ動かしたい」ならOpenClaw、「育てて長く使いたい」ならHermes Agentという棲み分けが現実的です。両者は競合というより、用途で使い分けることが多い関係にあります。

Hermes Agent vs Claude Agent SDK

Claude Agent SDK(Anthropic提供)は、Claudeをバックエンドにしたエージェントを構築するための公式SDKです。Claude Codeを支えるエージェント基盤をライブラリとして使える形にしたもので、ツール呼び出し・MCP統合・サブエージェント・スキル管理が含まれています。

Hermes Agent vs Claude Agent SDK

観点 Hermes Agent Claude Agent SDK
モデル プロバイダ・モデル非依存 Claude専用
ライセンス MIT(OSS) SDKコードはOSSだが、利用にはClaude API契約またはClaudeサブスクの認証が必要
料金・認証 LLMはプロバイダ別。サブスクOAuth/APIキー切り替え可 APIキー従量課金が基本。2026年6月15日以降は対象のClaude Pro/Max/Team/EnterpriseでAgent SDK・claude -p・SDK製サードパーティアプリ用に月次Agent SDK creditが別枠で提供される(APIキー利用はcredit対象外)
常駐運用 標準で前提(gateway / cron) 別途実装が必要
メッセージング統合 22プラットフォーム標準(Teams・LINE・SimpleX含む) アプリ統合は自前
スキル互換 agentskills.io標準準拠 Claude Code Skillsと完全互換

Claude Agent SDKは、Claudeを前提とした業務アプリケーション組み込みに向いており、Hermes Agentは「複数モデルを切り替えながら、メッセージング経由で常時運用したい」用途に向きます。AnthropicのClaudeに揃えるか、モデル選択の自由を残すかが選定の主な分かれ目です。

比較サマリ

下表で4つの選択肢を整理しました。

FW 完成品/部品 学習ループ モデル 主用途
Hermes Agent 完成品 あり(skill_manage + Curator) 非依存 24h常駐・育てて使う
OpenClaw 完成品 なし(記憶は持つ) OpenAI互換 即セットアップ・汎用自動化
LangChain / LangGraph 部品 自前実装 非依存 細部までカスタマイズしたい本番アプリ
Claude Agent SDK 部品+完成品 Skills連携 Claude専用 Claude前提の業務アプリ組み込み

選定の優先順位は、まず「完成品が必要か、部品が必要か」を決め、次に「学習・記憶を重視するか、即時セットアップを重視するか」で絞り込むのが整理しやすいです。


Hermes Agentの料金とコスト試算

Hermes Agent自体はMITライセンスの完全無料OSSですが、**運用全体のコストは「モデル推論コスト+ツール/API使用量+ホスティング代」**の3層で構成されます。本セクションでは、現実的な月次コストの目安を試算します。

Hermes Agentの料金とコスト試算

Hermes Agent本体(無料)

GitHubのリポジトリをクローン or インストールスクリプトで導入すれば、本体は無償で利用可能です。Nous Researchへの利用報告や課金は一切発生しません。

モデル推論コスト

実際にお金がかかるのは、エージェントが呼び出すLLMの推論コストです。プロバイダ別の代表的な単価は次の通りです(2026年5月時点)。

モデル推論コスト

プロバイダ モデル 入力単価 出力単価
OpenRouter Hermes 3 405B Instruct(無料枠) $0 / Mトークン $0 / Mトークン
OpenRouter Hermes 4 405B $1 / Mトークン $3 / Mトークン
OpenRouter Claude / GPT / Gemini 各種 プロバイダ準拠 プロバイダ準拠
Nous Portal Nous Portal上のagentic model+Tool Gateway(Web検索・画像生成・TTS・クラウドブラウザを正式サポート) 月額サブスク 月額クレジットまたは利用量に応じた従量課金(Tool Gateway利用枠+ツール課金分)
ローカルvLLM / Ollama Qwen / Llama / Hermes 3 等 $0 $0(電気代のみ)

Hermes 3 405B Instructの無料枠を使えば、LLM推論コストそのものは実質ゼロに抑えられる点が、Hermes Agentの経済的メリットの土台です。ただしWeb検索・画像生成・TTS・クラウドブラウザといった組み込みツールは、無料枠の対象外で、有料のNous Portal Tool Gatewayか、各サービスのAPIキー(Web検索ならBrave Search / Tavily / Exa / Firecrawl、画像生成ならOpenAI等)を別途用意する必要がある点には注意が必要です。より高い精度や品質が必要な業務では、「hermes model」コマンドが提示する推奨agentic modelの中から、ClaudeやGPT等を選び直して品質を底上げするのが基本ルートになります。

ホスティングコスト

24時間稼働させるには、PCを常時起動するかVPS・ミニPCに常駐させる必要があります。代表的な選択肢の月次コストは以下の通りです。

ホスティングコスト

構成 月額コスト目安 向く用途
自宅ミニPC(Intel N100クラス) 電気代のみ(約500〜1,000円) 個人開発・1人運用
VPS(Linode / Vultr / さくらVPS等) 1,000〜3,000円 個人〜小規模チーム
Railway / Render 等の汎用PaaS(公式 Dockerfile を使った手動デプロイ) $5〜$10 即時デプロイ重視
AWS / Azure / GCP上のVM 3,000〜10,000円 既存クラウド契約に乗せる場合
NVIDIA DGX Spark ハード初期費用 米国$4,699 / 日本参考価格 約90万円前後(販売店・税区分により変動)+電気代 ローカル推論で重量級モデルを24h動かす個人〜小規模チーム
DGX Station / HGXクラスの上位ワークステーション ハード初期費用 数百万円〜+電気代 大規模モデル・複数エージェント並列を企業で運用

月次コスト試算例

代表的な3パターンで月次の総コストを試算しました。

月次コスト試算例

  • ケースA:個人開発・無料モデル中心(外部ツールはローカル代替)
    ミニPC(電気代)+OpenRouter Hermes 3 405B無料枠+ローカルOllama併用、ブラウザ自動化はローカルChrome経由 → 月1,000円以下(外部のWeb検索APIや画像生成APIを叩く場合は別途課金)

  • ケースB:チーム共用・推奨agentic model+有料ツール
    Railway / Render 等の汎用PaaS $10 + OpenRouter経由でClaudeやGPT等の推奨agentic model(中量利用:入力5M・出力2M)+Nous Portal Tool Gatewayサブスク → 月5,000〜1万5,000円程度(モデル単価とTool Gateway従量課金次第で上振れあり)

  • ケースC:企業のローカル運用
    DGX Spark(米国$4,699 / 日本参考価格 約90万円前後、3年償却で月2.5万〜4万円程度)+ローカルvLLM+Nous Portal契約 → 月5万〜10万円台(上位ワークステーションを採用する場合は月10万円超まで上振れ)

実務的には、ケースAから始めて検証を進め、品質や速度に課題が出てきた段階でケースB・Cへ段階的に移行する流れが、コストと精度のバランスを取りやすい進め方です。


Hermes Agentの導入判断ガイド

ここまでの整理を踏まえて、どんな読者・どんな組織にHermes Agentが向くかを、3つのレイヤーに分けて整理します。中立的な情報まとめではなく、AI総合研究所の支援経験に基づいたケース別の推奨です。

Hermes Agentの導入判断ガイド

個人開発者・1人運用のケース

このレイヤーでは、Hermes Agentは第一候補です。具体的に向くのは次のような状況です。

個人開発者・1人運用のケース

  • すでにClaude Code / Cursor / Codex CLIでSKILL.mdを書いている人
    agentskills.io標準準拠なので、既存資産をそのまま流用できる。学習コストはhermes setupを回すだけで実質ゼロ

  • 業務外のリサーチや雑用を24h自動化したい人
    TelegramからモバイルでBOTに指示を出して、結果をメール・Slackで受け取る運用が自然に組める

  • クラウドエージェントの月額課金を圧縮したい人
    Hermes 3 405B無料枠+ローカルvLLMの構成で、動作確認段階の月コストをほぼゼロにできる(実運用ではagentic推奨モデル=Claude/GPT/Gemini/DeepSeek等への切り替えを前提)

逆に、エージェントの動きを細部までグラフで制御したい・自前のメモリ実装を組み込みたい場合は、LangGraphのほうが向きます。

チーム運用のケース

5〜30人規模の開発チーム・スタートアップでは、Hermes Agentは併用の有力候補です。Claude Codeをメインの開発エージェントとしつつ、Hermes Agentを24時間動く外部担当として配置するパターンが現実的です。

チーム運用のケース

  • 業務時間外の定常タスク(朝のニュース要約・PR監視・CI失敗の一次切り分け等)をHermesに任せる
  • チームのSlackチャンネルからメンション経由で呼び出し、結果をスレッドに残す
  • スキルライブラリをチームで共有し、Curatorによる自動整理に乗せる

このパターンでは、メイン開発フロー(IDE上のClaude Code)と常駐エージェント(Hermes Agent)の役割分担が明確になり、両方の良さを取り込めます。

ただし、エージェント単体ではなく業務プロセス全体のAI化を視野に入れる段階では、AI Agent Hubのようなエンタープライズ向け基盤との組み合わせを検討すべきタイミングになります。

企業導入のケース

100人を超える規模、もしくは機密データを扱う業務での企業導入では、Hermes Agentは特定用途では有力、全社展開には条件付きという位置づけです。

企業導入のケース

向くケース:

  • オンプレ・閉域網での運用が必須の業務
    ローカルvLLM+Hermes Agentでクラウドを経由しない構成が組める

  • R&D・データサイエンス領域での自動化
    Singularity・Modal対応により、HPCクラスタや研究環境への組み込みが容易

慎重に検討すべきケース:

  • 業務システム連携が広範な全社展開
    権限管理・監査ログ・SSO統合といったエンタープライズ機能は、Hermes Agent単体ではなく上位のエージェント基盤(Microsoft Agent FrameworkやMicrosoft 365 Copilotエージェントなど)との組み合わせ、または専門の導入支援を前提に検討するのが現実的

導入判断で詰まる論点

最後に、導入を判断する段階で迷いやすい3つの論点を整理します。

導入判断で詰まる論点

  • ライセンスはMITだが、運用負荷を誰が担うか
    OSSなので公式サポートはない。社内で1人以上の「Hermesに詳しい人」を置くか、外部の支援契約を結ぶかを最初に決めておく

  • モデルプロバイダの依存設計
    無料枠で開始しても、本番では「hermes model」コマンドが提示する推奨agentic model(Claude・GPT等)に切り替える可能性が高い。プロバイダ切り替えを前提に、認証情報の管理方法(環境変数 / Vault等)を最初から設計しておく

  • スキルの組織内共有のガバナンス
    自動生成スキルには業務情報が含まれ得る。社内共有時に何をマスクするか、どのスキルを公式レジストリに昇格させるか、ルールを早めに整える

メルマガ登録


OSSエージェントを試した次に、組織で安全に運用するなら

Hermes Agentのような自律エージェントを個人やチームで使い始めると、自然と「同じ仕組みを全社の業務に広げたい」「セキュリティと監査をしっかり整えたい」というニーズが出てきます。OSSをセルフホストで動かす段階の次は、組織全体で扱える運用基盤の設計が必要になります。

ここで効いてくるのが、自社のAzureテナント内で動くエンタープライズAIエージェント基盤です。AI総合研究所のAI Agent Hubは、Hermes Agentで体験した「メッセージング経由でエージェントを呼び出して業務を任せる」流れを、組織のガバナンス要件に耐える形で実装するためのプラットフォームとして設計されています。

  • TeamsからAIエージェントを呼び出し、データは自社テナント内で完結
    Hermes AgentのTelegram・Slack連携と同じ発想で、社員はMicrosoft Teamsからエージェントを呼び出して業務を進めます。データは自社のAzureテナントから外に出ず、AIの学習対象からも除外されます。

  • どこで構築したエージェントも1つのダッシュボードで一元管理
    Microsoft Foundry・Copilot Studio・n8nなど、異なる基盤で作ったAIエージェントを統合管理。実行ログ・アクセス権限・セキュリティスキャンをまとめて扱える設計で、シャドーAIの乱立を抑えます。

  • 使い慣れたMicrosoft環境をそのまま活用
    Teams・Excel・Outlookなど既存ツールの延長でAIエージェントが動作。新しいツールの学習コストをかけずに業務へ組み込めます。

  • 業務システムとの実用的な連携
    SAP Concur・freee会計・Dynamics 365・Salesforce・Oracle NetSuite・勘定奉行クラウドなど主要な業務SaaSとの接続を、要件に応じて設計・構築します。



AI総合研究所の専任チームが、OSSセルフホスト型エージェントの試行から、組織横断のAIエージェント運用設計までを通しで伴走支援します。Hermes Agentで掴んだ手応えを企業導入に発展させたい方は、まず無料の資料で全体像をご確認ください。

自律エージェント運用を組織全体に広げる

AI Agent Hub

OSS試行から企業向け基盤への発展

Hermes Agentのような自律エージェントを個人・チームで試した次は、組織全体で安全に運用する基盤が必要になります。AI総合研究所のAI Agent Hubは、自社Azureテナント内で動くエンタープライズAIエージェント基盤として、Teamsからの呼び出し・データ統合・一元管理までを設計支援します。


まとめ

Hermes Agentは、永続メモリと自己改善ループを標準装備したOSSの自律AIエージェントとして、2026年に最も急成長しているプロジェクトの一つです。本記事の各論点を1行ずつ振り返ります。

  • 主要機能:MarkdownベースのメモリとSQLite会話履歴・22メッセージングプラットフォーム(Teams・LINE等含む)・並列サブエージェント・ブラウザ制御・cronスケジューラを標準装備
  • 自己改善ループ:skill_manage・Curator・agentskills.io標準準拠により、Claude Code/Cursor/Codex CLI用のSKILL.md資産がそのまま使える
  • 使い方:curlワンライナーでインストール→hermes setupで初期化→hermes gateway setupで接続設定→hermes gateway起動、まで対話型ウィザードで一気通貫
  • 他フレームワーク比較:完成品が欲しいならHermes Agent、即セットアップ重視はOpenClaw、細部カスタマイズはLangGraph、Claude前提ならClaude Agent SDK
  • 料金:本体MIT無料、LLM推論はHermes 3 405B無料枠で動作確認は可能だが、実運用のagentic用途はClaude/GPT/Gemini/DeepSeek等を推奨。Web検索・画像生成等はNous Portalか各APIキーで別途。ホスティングは月数百円〜数千円から
  • 導入判断:個人開発者は第一候補、チームは併用、企業は特定用途で有力(全社展開は基盤との組み合わせを検討)

24時間動き続けるエージェントが現実的な選択肢になった今、「クラウドエージェントを使う」か「Hermes Agentのような常駐型を持つ」かは、開発者・チーム・企業それぞれが向き合うべき分岐点です。最小コストで試せる構成(OpenRouter Hermes 3無料枠+ローカル)から始めて、自分の業務にハマる感触を確かめるのが、もっとも軌道修正コストの低い進め方になります。

監修者
坂本 将磨

坂本 将磨

Microsoft MVP・AIパートナー。LinkX Japan株式会社 代表取締役。東京工業大学大学院にて自然言語処理・金融工学を研究。NHK放送技術研究所でAI・ブロックチェーンの研究開発に従事し、国際学会・ジャーナルでの発表多数。経営情報学会 優秀賞受賞。シンガポールでWeb3企業を創業後、現在は企業向けAI導入・DX推進を支援。

関連記事

AI導入の最初の窓口

お悩み・課題に合わせて活用方法をご案内いたします
お気軽にお問合せください

AI総合研究所 Bottom banner

ご相談
お問い合わせは
こちら!