2026-06-01

ヒューマン・イン・ザ・ループ（HITL）とは？in/on/outの違いとAIエージェント運用の承認設計を解説

この記事のポイント

HITLは「全工程に人を挟む」ことではなく、リスクと可逆性に応じて人間の関与度を設計する考え方
Human-in / on / out the Loopは対立概念ではなく、同じ業務でも工程ごとに使い分ける関与の段階
外部API・課金・不可逆操作・対外コミュニケーションは、AIエージェントでも人間の承認を挟むべき箇所
過剰なレビューはボトルネック、形骸化した承認はオートメーションバイアスという両面のリスク
EU AI Act第14条の「人間による監督」要件（現行法は原則2026年8月適用、延期の暫定合意あり）など、HITLは規制・監督面でも無視できない論点

監修者プロフィール

坂本将磨

フォローする

Microsoft MVP・AIパートナー。LinkX Japan株式会社代表取締役。東京工業大学大学院にて自然言語処理・金融工学を研究。NHK放送技術研究所でAI・ブロックチェーンの研究開発に従事し、国際学会・ジャーナルでの発表多数。経営情報学会優秀賞受賞。シンガポールでWeb3企業を創業後、現在は企業向けAI導入・DX推進を支援。

ヒューマン・イン・ザ・ループ（HITL：Human-in-the-Loop）とは、AIの判断プロセスに人間の確認・修正・承認を組み込み、AIだけで完結させない設計思想です。
もともとは自動化・制御や航空分野など、人間と自動システムの関わりを扱う領域で使われてきた考え方ですが、生成AIとAIエージェントが業務に入り込むなかで「どこまで自動化し、どこで人が関与するか」を決める実務テーマとして改めて注目されています。

本記事では、HITLの定義と由来、Human-on / out-the-Loopとの違い、生成AI時代にHITLが求められる理由を整理します。
そのうえで、AIエージェント運用で人間の承認をどこに挟むかの設計、RLHFなどHITLを支える手法、導入で陥りやすい落とし穴、そして人的レビュー工数を含めたコストの考え方までを2026年5月時点の情報で解説します。

✅2026年6月9日、AnthropicがMythos-class初の一般公開モデル「Claude Fable 5」を発表しました。Opus 4.8の上位に位置する新最上位モデルの詳細はこちら。
▶︎Claude Fable 5とは？Mythos 5との違いや料金、使い方を解説

ヒューマン・イン・ザ・ループ（HITL）とは？AIの判断に人間を組み込む設計思想

HITLの基本的な考え方

「Human-in-the-Loop」という言葉の由来

HITLには2つの文脈がある——「AI開発」と「エージェント運用」

HITLが求められる理由——生成AI・自律エージェント時代の必然

誤り・ハルシネーションを止める安全弁

説明責任と透明性の確保

倫理・バイアスのコントロール

規制要請——EU AI Actの「人間による監督」

Human-in / on / out the Loopの違い——AIへの関与度をどう決めるか

Human-in-the-Loop——ループの内側で判断する

Human-on-the-Loop——監視役として外側から見る

Human-out-of-the-Loop——完全自律と事後監査

関与度はリスク×可逆性で決める

AIエージェント運用でどこに人を挟むか——承認ポイントの設計

人間の承認を置くべき箇所

介入の型——Approve / Reject / Edit / Feedback

同期承認と非同期・バッチ承認

実装機能の例——LangGraphの中断・各ツールの承認ノード

HITLを支える手法——アノテーション・能動学習・RLHF

アノテーション——学習データに人間が意味を与える

能動学習——AIが「自信のない事例」を人間に聞く

RLHF——人間のフィードバックでモデルの振る舞いを整える

HITL導入の落とし穴——ボトルネックとオートメーションバイアス

過剰設計——全工程に人を挟んでボトルネック化

オートメーションバイアス——承認が形骸化する

レビュー品質のばらつきと属人化

HITLの活用シーン——分野別の人間の関わり方

HITL導入・運用のコスト——人的レビュー工数と自動化のバランス

コストの構成要素

「どこまで人を残すか」のROIの考え方

コストを抑える設計

AIエージェントを「人の監督つき」で業務に定着させる

まとめ

 ヒューマン・イン・ザ・ループ（HITL）とは？AIの判断に人間を組み込む設計思想ヒューマン・イン・ザ・ループ（HITL：Human-in-the-Loop）とは、AIの判断プロセスに人間の確認・修正・承認を組み込み、AIだけで処理を完結させない設計思想です。
AIが出した結果をそのまま採用するのではなく、重要な分岐点で人間が「これでよいか」を判断し、必要なら修正してから次に進めます。
ポイントは、HITLが「AIか人間か」の二択ではないことです。

処理のスピードはAIに任せ、最終的な妥当性の判断は人間が担う——両者の役割分担で、効率と信頼性を両立させるのがHITLの狙いです。
!本記事では、HITLを「AI開発（学習データ整備）」と「AIエージェント運用（実行時の承認）」の2つの文脈に分けて解説します。同じHITLという言葉でも、対象とする工程が異なる点に注意してください。
 HITLの基本的な考え方HITLは、ひとことで言えば「人間が意図的にAIの判断ループの内側に入る」という設計です。
生成AIや機械学習モデルは、確率的に「もっともらしい」出力を返しますが、その出力が常に正しい保証はありません。

　

そこで、AIの出力を人間がチェックし、誤りを正し、そのフィードバックを次の処理や再学習に活かす——この循環（ループ）に人間を組み込むことで、AI単独では到達しにくい精度と説明責任を確保します。
完全自動化が「速いが間違いを止められない」のに対し、HITLは「人間の確認が入る分だけ遅いが、致命的な誤りを止められる」という性質を持ちます。
 「Human-in-the-Loop」という言葉の由来「Human-in-the-Loop」はAIに固有の用語ではなく、自動化・制御や航空分野のシミュレーションなど、人間と自動システムの関わりを扱う分野で使われてきた言葉です。
航空機やプラントのように自動制御が進んだシステムでも、異常時に人間が介入して止められる状態を「人間がループの中にいる（in the loop）」と表現します。
この考え方が機械学習やヒューマン・コンピュータ・インタラクション（HCI）の分野に持ち込まれ、「学習や推論のプロセスに人間の判断を組み込む」という現在の意味で定着していきました。
つまりHITLは新しく生まれた概念ではなく、自動化と人間の関わりという古くからのテーマが、生成AIの登場で再び前面に出てきたものと捉えると理解しやすくなります。
 HITLには2つの文脈がある——「AI開発」と「エージェント運用」HITLを語るうえで混乱しやすいのが、「人間が関わる工程」が文脈によって異なる点です。大きく2つに分かれます。
AI開発ライフサイクルのHITL

学習データのラベル付け（アノテーション）やモデルの評価、誤り事例の再学習など、AIモデルそのものを賢くする工程に人間が関わるパターン。後述するRLHFやアノテーションがここに含まれます。


AIエージェント運用のHITL

学習済みのAIを業務で動かす際に、実行の途中で人間が承認・修正を挟むパターン。たとえばAIエージェントが外部システムを操作する前に、人間が内容を確認してから実行させる仕組みです。


この2つは目的も担当者も異なります。

前者はデータサイエンティストやアノテーターが「モデルの品質」を高めるための関与、後者は業務担当者が「運用上の安全」を担保するための関与です。
本記事ではどちらも扱いますが、企業の実務で判断が必要になるのは主に後者（エージェント運用）のため、そちらに重心を置いて解説します。
 HITLが求められる理由——生成AI・自律エージェント時代の必然HITLが改めて注目される背景には、AIが「助言する道具」から「自分で動く実行主体」へ変わりつつあるという変化があります。
AIが自律的にメールを送り、コードを書き換え、システムを操作するようになると、その誤りがそのまま業務上の損害に直結します。
本セクションでは、HITLが求められる理由を「誤りの統制」「説明責任」「倫理・バイアス」「規制要請」の4点に整理します。
 誤り・ハルシネーションを止める安全弁生成AIは、事実に反する内容をもっともらしく出力する「ハルシネーション」を完全には避けられません。
これは確率的に文章を生成するという仕組みに由来するもので、モデルの精度が上がっても現時点ではゼロにするのが難しい性質です。
そのため、誤りが許されない業務——契約書の作成、与信判断、顧客への正式な回答など——では、AIの出力をそのまま採用せず、人間が最終確認する安全弁が必要になります。
HITLは、この「致命的な誤りが本番に流れる前に止める」役割を担います。
 説明責任と透明性の確保AIの判断を業務に使う場合、「なぜその結論になったのか」「最終的に誰が責任を持つのか」を説明できる状態にしておく必要があります。
AIが完全に自律して下した判断は、後から経緯を追いにくく、責任の所在も曖昧になりがちです。
人間が判断ループに入っていれば、最終決定の責任が人間側に明確に残り、意思決定の透明性を保てます。
特に金融・医療・人事のように、説明責任が法的・社会的に強く求められる領域では、この点がHITLを採用する大きな動機になります。
 倫理・バイアスのコントロールAIは学習データに含まれる偏り（バイアス）をそのまま反映してしまうことがあります。
採用選考や与信のような場面で偏った判断が自動化されると、公平性を欠いた結果が大量に生まれるリスクがあります。
人間がチェックポイントに入ることで、データだけでは捉えきれない倫理的・社会的な妥当性を補い、AIの判断を是正できます。
 規制要請——EU AI Actの「人間による監督」HITLに近い考え方は、いまや「やったほうがよい工夫」にとどまらず、規制上の要件としても意識される段階に入りつつあります。
代表例が、欧州連合の包括的なAI規制であるEU AI Act（AI規制法）です。
同法の第14条（Regulation (EU) 2024/1689）は、HITLそのものを義務づける条文ではなく、高リスクに分類されるAIシステムを、人間が実効的に監督（Human Oversight）できるよう設計することを求めています。
具体的には、監督を担う人間が「システムの能力と限界を正しく理解できる」「AIの出力を過度に信頼してしまう傾向（自動化バイアス）に注意できる」「出力を正しく解釈できる」「必要なら使用を中止し、判断を覆せる」状態を確保するよう定めています。
つまり規制側が想定しているのは、人間が形だけ介在することではなく、実際に介入・是正できる実効性のある監督です。
ただし、この高リスクAI向けの要件の適用時期は流動的です。現行のAI Act本文では原則として2026年8月2日からの適用とされますが、2026年5月にはEU理事会議長国と欧州議会の交渉担当者が適用を延期する暫定合意に達しており、スタンドアロン型の高リスクAIは2027年12月2日、製品組込み型は2028年8月2日への延期が見込まれています（正式採択前）。
いずれにせよ本記事執筆時点（2026年5月）では未適用ですが、海外向けにAIサービスを提供する企業や、AIガバナンス体制を整える企業は、最終的な適用スケジュールを注視しつつ監督体制を準備しておく必要があります。
 Human-in / on / out the Loopの違い——AIへの関与度をどう決めるかHITLを正しく使い分けるには、似た用語との違いを押さえておく必要があります。
よく混同されるのが、**Human-in-the-Loop（HITL）／Human-on-the-Loop（HOTL）／Human-out-of-the-Loop（HOOTL）**の3つです。
これらはもともと自律システム（自律型兵器など）の議論で使われてきた整理を業務AIに応用したもので、業務AI全般で固定された標準定義というわけではありませんが、関与度を考える枠組みとして実務でも使われています。
いずれも対立する別物ではなく、人間がどの程度AIに関与するかの「度合い」を表す段階と捉えるのが正確です。以下の表で、3つの関与度を整理しました。


関与度
人間の役割
速度
向いている場面


Human-in-the-Loop
ループの内側で1件ずつ承認・修正する
遅い
誤りが致命的・不可逆な業務

Human-on-the-Loop
外側で監視し、異常時だけ介入する
速い
大量処理だが監視は必要な業務

Human-out-of-the-Loop
実行中は関与せず、AIが完結。必要に応じ事後監査で補う
最速
誤っても影響が小さく可逆な業務


この表が示すように、3つは「どれが正しいか」ではなく、業務のリスクに応じて選ぶものです。同じ会社の中でも、業務ごとに関与度を変えるのが実務的な姿になります。
 Human-in-the-Loop——ループの内側で判断するHuman-in-the-Loopは、AIの処理を一度止めて、人間が1件ずつ確認・承認してから次に進める形です。
AIが下書きを作り、人間が承認して初めて確定する、という運用が典型例です。
最も慎重ですが、その分スループットは落ちます。誤りが許されない、あるいは一度実行すると取り消せない業務に向いています。
 Human-on-the-Loop——監視役として外側から見るHuman-on-the-Loopは、AIが処理を進めるのを人間が外側から監視し、異常を検知したときだけ介入する形です。
1件ずつは止めず、ダッシュボードやアラートで全体を見張り、おかしな挙動があれば停止・修正します。
大量の処理を回しつつ、人間の目も残したい場合に適しています。HITLより速い一方、見逃しのリスクは上がります。
 Human-out-of-the-Loop——完全自律と事後監査Human-out-of-the-Loop（HOOTL）は、実行中は人間が関与せず、AIが処理を完結させる形です。人間の関わりは、必要に応じた事後の監査・分析で補う程度にとどまります。
スパムフィルタや商品レコメンドのように、誤ってもやり直しがきき、影響が限定的な業務で採用されます。
なお、人間を中心に据えてAIを設計する「HCAI（Human-Centered AI：人間中心のAI）」という考え方もありますが、これは関与度というよりAI全体の設計思想を指す言葉で、3段階とは別の軸の概念です。
 関与度はリスク×可逆性で決めるでは、自社の業務をどの関与度に置くべきか。判断軸として実務で使いやすいのが、「失敗したときの影響の大きさ（リスク）」と「やり直せるか（可逆性）」の2軸です。
影響が大きく、取り消せない業務

送金、契約締結、本番環境へのデプロイ、顧客への正式回答など。Human-in-the-Loopで1件ずつ承認する。


影響はあるが、監視で十分カバーできる業務

社内向けの一次対応、大量のデータ分類など。Human-on-the-Loopで監視しつつ自動で回す。


誤っても影響が小さく、やり直せる業務

社内検索の候補提示、下書きの自動生成など。Human-out-of-the-Loopに寄せ、人手を割かない。


支援の現場でも、まずこの2軸で業務を仕分けることから始めると、「どこに人を残すか」の議論が一気に具体的になります。すべてに人を挟むのでも、すべてを自動化するのでもなく、業務ごとに関与度を割り当てるのが現実的な落としどころです。
なお、AIが自ら計画して動く自律型AIエージェントが広がるほど、この「関与度の設計」は避けて通れないテーマになります。
 AIエージェント運用でどこに人を挟むか——承認ポイントの設計ここからは、本記事の主題であるAIエージェント運用でのHITL設計を具体的に見ていきます。
関与度の方針（前セクション）が決まったら、次は「エージェントの一連の処理のうち、どのステップで人間の承認を挟むか」という、より細かい設計に落とし込みます。
全工程に人を挟めば安全ですが遅くなり、どこにも挟まなければ速いが危険です。

勘所は、止めるべき箇所を見極めて、そこにだけ承認ゲートを置くことにあります。
 人間の承認を置くべき箇所エージェントの処理のなかでも、特に人間の承認を挟むべきなのは、実行すると影響が大きく、後から取り消しにくい操作です。代表的なのは次の4種類です。
外部システムへの書き込み・操作

データベースの更新、ファイルの削除、本番環境へのデプロイなど、外部の状態を変える操作。


課金・支払いを伴う操作

APIの大量呼び出しや有料サービスの実行など、コストが発生する操作。


不可逆な操作

送金、契約の確定、メール送信など、一度実行すると取り消せない操作。


対外コミュニケーション

顧客・取引先への返信や公開投稿など、相手に届いてしまう操作。


逆に、情報の検索や下書きの生成のように「やり直しがきく」処理は、いちいち承認を挟まずAIに任せたほうが効率的です。承認ゲートは、置く場所を絞るほど効果的に働きます。
 介入の型——Approve / Reject / Edit / Feedback承認ポイントで人間が取れるアクションは、単なる「OK / NG」だけではありません。実務では次の4つの型を使い分けます。
Approve（承認）

AIの提案をそのまま実行させる。


Reject（却下）

提案を取り消し、実行させない。


Edit（修正）

提案を人間が手直ししてから実行させる。AIの下書きを8割活かし、2割だけ直すような使い方。


Feedback（差し戻し）

理由を添えてAIにやり直させる。この入力は次の改善材料にもなる。


特に「Edit」と「Feedback」を用意しておくと、AIの出力を全否定せずに活かせるため、現場の運用効率が大きく変わります。
 同期承認と非同期・バッチ承認承認の挟み方には、タイミングの設計もあります。処理をその場で止める同期承認と、いったん保留して後でまとめて捌く非同期・バッチ承認です。
同期承認は、AIが操作の直前で停止し、人間が承認するまで待つ方式です。確実ですが、承認者が常に張り付く必要があります。
非同期・バッチ承認は、AIが承認待ちの案件をキューに積み、人間が手の空いたときにまとめて処理する方式です。承認者の負担を平準化でき、大量処理に向きます。
どちらを選ぶかは、業務の緊急度と承認者の体制次第です。緊急性の低い処理を無理に同期承認にすると、承認待ちがボトルネックになりやすいため注意します。
 実装機能の例——LangGraphの中断・各ツールの承認ノードこうしたHITLは、近年のAIエージェント開発ツールに標準機能として組み込まれつつあります。ツールに依存しない設計が基本ですが、実装イメージを持つために代表的な機能を紹介します。
エージェント開発フレームワークのLangGraphには、処理を任意の地点で一時停止する「interrupt」という機能があります。
たとえば外部APIを呼び出す直前で処理を止め、人間が内容を確認して「承認・却下・修正」を返すと、その結果を受けてエージェントが処理を再開します。停止中はその時点の状態が保存されるため、後から再開しても文脈が失われません。
同様の人間の介在は、ノーコード寄りのワークフロー型ツールにも機能として用意されています。DifyではHuman Inputノード、n8nではAIツールの実行前に人間の確認を挟むhuman review機能を使い、ワークフローをいったん停止して人間の判断を差し込めます。
また、HITLは個別のワークフローツールだけでなく、主要なエージェントSDKやプラットフォーム側の実装機能としても整備されつつあります。
たとえばOpenAI Agents SDKでは、承認が必要なツール呼び出しでエージェントの実行を一時停止し、人間が承認または却下したうえで「RunState」から再開するHITLフローが用意されています。Microsoft Agent Frameworkでも、関数ツールに承認の要否を設定し、ツール実行前に人間の承認を待つ「ツール承認（tool approval）」の仕組みが提供されています。
つまりHITLは、運用ルールとして後から足すだけでなく、エージェント実装の制御機構として組み込まれ始めていると捉えられます。
AIワークフローとしてエージェントを組む場合も、考え方は同じです。どのツールを使うにせよ、「止める場所」と「人間に渡す情報」を設計するのがHITL実装の本質で、機能はそれを実現する手段にすぎません。
 HITLを支える手法——アノテーション・能動学習・RLHFここまではエージェント運用（実行時）のHITLを見てきましたが、AIモデルそのものを賢くする開発工程のHITLも、もう一方の柱です。
本セクションでは、AI開発でよく使われる代表的な3つの手法を整理します。こうした人間参加型の機械学習（Human-in-the-Loop machine learning）は学術的にも体系化が進んでおり、いずれも「人間のフィードバックでモデルを改善する」という点で共通しています。
 アノテーション——学習データに人間が意味を与えるアノテーションとは、AIの学習用データに対して、人間が「これは何か」という正解ラベルを付ける作業です。
画像に「猫」「犬」とタグを付けたり、文章に感情の正負を付与したりする、AI開発の土台となる工程です。
AIの精度はこのラベルの質に大きく左右されるため、人間が丁寧に意味を与えるアノテーションは、HITLの最も基礎的な形と言えます。
 能動学習——AIが「自信のない事例」を人間に聞く能動学習（Active Learning）は、AIが判断に迷ったデータだけを選んで人間に問い合わせ、効率的に学習する手法です。
すべてのデータを人間がラベル付けするのは大変ですが、AIが「自信のない事例」を優先的に人間に回せば、少ない労力で効果的にモデルを改善できます。
人間のリソースを、最も効果の高い箇所に集中させる——能動学習は、HITLを効率化する考え方として重要です。
 RLHF——人間のフィードバックでモデルの振る舞いを整えるRLHF（人間のフィードバックによる強化学習）は、人間がAIの出力に対して「良い・悪い」の評価を与え、その評価を報酬としてモデルの振る舞いを調整する手法です。
強化学習の枠組みを使い、人間の好みに沿った出力を返すようモデルを方向づけます。
ChatGPTをはじめとする近年の対話型AIが、人間にとって自然で安全な応答を返すようになった背景には、このRLHFがあります。
RLHFは「モデルを世に出す前に人間の価値観を組み込む」HITLであり、実行時に人間が介入するエージェント運用のHITLとは、関与のタイミングが異なる点を押さえておくとよいでしょう。
 HITL導入の落とし穴——ボトルネックとオートメーションバイアスHITLは万能ではありません。設計を誤ると、安全のために入れた人間の関与が、かえって品質と効率を下げることがあります。
本セクションでは、導入前に知っておきたい3つの落とし穴を整理します。
 過剰設計——全工程に人を挟んでボトルネック化最も多い失敗が、心配だからとあらゆる工程に承認を挟み、人間が律速になってしまうケースです。
承認待ちの案件が滞留し、せっかくAIで速くなったはずの業務が、結局は人間の処理速度に引きずられて遅くなります。
これではAIを導入した意味が薄れます。前述のとおり、承認は「止めるべき箇所」に絞り、可逆な処理は自動で流すという割り切りが欠かせません。
 オートメーションバイアス——承認が形骸化する逆方向の落とし穴が、人間がAIの出力を無批判に信じてしまう「オートメーションバイアス」です。
承認ボタンを押すだけの作業が続くと、人間は中身を確認せず機械的に「承認」を繰り返すようになります。これではループに人間がいても、実質的なチェックは働いていません。
EU AI Act第14条が監督者に「AIの出力を過度に信頼する傾向に注意できること」まで挙げているのも、まさにこの形骸化を防ぐ趣旨です。
対策としては、承認件数を絞って1件あたりの確認密度を上げる、AIの確信度が低い案件だけ人間に回す、といった設計が有効です。
 レビュー品質のばらつきと属人化人間が介在する以上、誰がレビューするかによって判断の質がばらつくという課題も生じます。
熟練者とそうでない担当者で承認基準が揃わなければ、HITLを入れても品質は安定しません。
承認の判断基準を明文化する、レビュー結果を記録して後から検証できるようにする、といった運用設計で、属人化を抑えることが重要です。
 HITLの活用シーン——分野別の人間の関わり方HITLは特定の業界に限らず、「AIの速さ」と「人間の確認」を組み合わせたい場面すべてで使われています。
本セクションでは、関与度の設計が実際にどう現れるかを、分野別の典型パターンで整理します。なお、ここで挙げるのは業界で広く見られる関わり方の型であり、特定企業の事例ではありません。
以下の表で、分野ごとのHITLの組み込み方を整理しました。


分野
AIが担うこと
人間が担うこと
主な関与度


製造（外観検査）
画像から不良候補を高速に抽出
最終的な良否判定・境界事例の確認
Human-in / on

金融（与信・査定）
スコアリングと判断材料の整理
最終承認と説明責任の保持
Human-in-the-Loop

バックオフィス（経理）
請求書のAI-OCR読み取り・自動データ化
読み取り結果の修正（次の学習材料に）
Human-in-the-Loop

コンテンツ審査
違反候補の自動検出・大量フィルタ
判断が難しい事例のみ人間が確認
Human-on-the-Loop


表を分野横断で見ると、共通する設計が浮かびます。AIが「量」をさばき、人間が「境界事例と最終責任」を引き受けるという分担です。
特に金融や経理のように説明責任とやり直しの難しさが伴う業務はHuman-in-the-Loopに寄せ、コンテンツ審査のように大量処理が前提の業務はHuman-on-the-Loopで監視に回す——この使い分けが、関与度設計の実例になっています。
自社の業務に当てはめるなら、「いま人手で全件見ている工程のうち、AIに一次処理を任せて人間は境界事例だけに集中できないか」と問い直すのが、HITL導入の現実的な第一歩です。
 HITL導入・運用のコスト——人的レビュー工数と自動化のバランスHITLを設計するうえで避けて通れないのが、人間の関与にかかるコストです。
AIエージェント自体の費用はAIエージェント開発の費用で詳しく扱っていますが、HITLでは、それに加えて「人間がレビューする工数」が継続的に発生します。
本セクションでは、HITLのコストの考え方と、それを抑える設計を整理します。
 コストの構成要素HITLのコストは、ツール費用だけでなく、人間側に発生する継続的なコストを含めて捉える必要があります。主な要素は次のとおりです。
レビュー工数

承認・修正に割く担当者の人件費。HITLで最も大きく、かつ見落とされやすいコスト。


教育・基準整備のコスト

レビュー担当者の育成や、承認基準の文書化にかかる初期コスト。


ツール・基盤のコスト

承認フローを実現するエージェント基盤やワークフローツールの費用。


このうち、運用が続くほど効いてくるのがレビュー工数です。「どこに人を残すか」の設計は、そのまま継続コストの設計でもあります。
 「どこまで人を残すか」のROIの考え方HITLのコストは、「人間の確認で防げる損失」と「確認にかかる工数」を天秤にかけると判断しやすくなります。
誤りが1件でも致命的な業務なら、多少のレビュー工数をかけても人間を残す価値があります。
一方、誤っても影響が小さく頻度の高い処理に人間を貼り付けるのは、割に合いません。

ここは関与度設計（リスク×可逆性）と同じ判断軸で、影響の小さい処理は自動化に寄せ、人的レビューを高リスク領域に集中させるのが合理的です。
 コストを抑える設計人的コストを抑えつつ安全性を保つには、人間が見る範囲を賢く絞る設計が効きます。代表的な手法は次の3つです。
サンプリングレビュー

全件ではなく一定割合を抽出して人間が確認し、品質を統計的に担保する。


信頼度しきい値

AIの確信度が高い案件は自動で通し、低い案件だけ人間に回す。能動学習と同じ発想。


段階的な自動化

最初は人間の承認を厚く入れ、AIの精度と実績が積み上がったら、低リスクな処理から徐々に承認を外していく。


これらは、HITLを「固定の仕組み」ではなく「精度の向上に合わせて関与度を下げていくプロセス」として運用する考え方です。導入当初の手厚いレビューを、永久に続ける前提で見積もる必要はありません。
 AIエージェントを「人の監督つき」で業務に定着させる生成AIとAIエージェントが業務に入り込むほど、「どこまで自動化し、どこで人が関与するか」を設計するHITLの考え方は、すべての企業にとって実務テーマになります。
とはいえ、最初から完璧な関与度設計を描く必要はありません。

まずは現行の業務を「リスク×可逆性」で仕分け、高リスクな工程にだけ人間の承認を残すところから始めれば、過剰なレビューも危険な丸投げも避けられます。
AI総合研究所では、PoCから全社展開までの設計、部門別のユースケース、AI運用における統制・セキュリティのチェックポイントを220ページにまとめた「AI業務自動化ガイド」を無料で公開しています。AIエージェントを人間の監督つきで業務に組み込む第一歩として活用ください。

            AIエージェントを「人の監督つき」で業務に組み込む
          

              
            
PoCから全社展開までの設計を1冊でHITLの考え方を実際の業務に落とし込むには、どの工程をAIに任せ、どこに人間の承認を残すかを業務単位で設計する必要があります。AI業務自動化ガイド（220ページ）では、PoCから全社展開までの進め方、部門別ユースケース、AI運用における統制・セキュリティのチェックポイントを整理しています。

                
                  ▶
                  無料でダウンロード
                
              
 まとめ本記事では、ヒューマン・イン・ザ・ループ（HITL）について、定義と由来、Human-on / out-the-Loopとの違い、AIエージェント運用での承認ポイント設計、RLHFなどの手法、導入の落とし穴、コストの考え方までを2026年5月時点の情報で解説しました。要点を改めて整理します。
HITLは、AIの判断プロセスに人間の確認・修正・承認を組み込む設計思想で、「全工程に人を挟む」ことではなく、リスクと可逆性に応じて関与度を設計する考え方


Human-in / on / out the Loopは対立概念ではなく関与の段階であり、同じ会社でも業務ごとに使い分けるのが実務的な姿


AIエージェント運用では、外部操作・課金・不可逆操作・対外コミュニケーションに承認ゲートを絞って置くのが設計の勘所


過剰なレビューはボトルネック、形骸化した承認はオートメーションバイアスという両面のリスクがあり、人間が見る範囲を賢く絞る設計が要る


EU AI Act第14条の「人間による監督」要件（現行法は原則2026年8月2日適用、延期の暫定合意あり）など、HITLは規制・監督面の論点でもあり、AIガバナンス体制の一部として無視できない

AIエージェントが自律的に動く時代において、HITLは「AIを止める仕組み」ではなく、「AIに任せる範囲と人が責任を持つ範囲を、業務ごとに線引きする設計手法」と捉えるのが実務的です。まずは自社の業務をリスクと可逆性で仕分け、高リスクな工程にだけ人間の承認を残すところから着手するのが、最も現実的な第一歩になります。