この記事のポイント
GitHub Agentic WorkflowsはMarkdownで指示するだけでAIエージェントが自律実行する新しいCI/CD自動化基盤
主要AIエンジンはCopilot CLI・Claude Code・OpenAI Codex・Geminiの4種、ワークフロー単位で切替可
読み取り専用権限とsafe-outputs・サンドボックスでprompt injection耐性を確保する多層ガードレール設計
Copilotは2026年6月1日からGitHub AI Credits課金(1クレジット$0.01)、他は各APIプロバイダ課金
技術プレビュー段階のため、本番運用は人間監督とmax-effective-tokens等のコスト上限設計が前提

Microsoft MVP・AIパートナー。LinkX Japan株式会社 代表取締役。東京工業大学大学院にて自然言語処理・金融工学を研究。NHK放送技術研究所でAI・ブロックチェーンの研究開発に従事し、国際学会・ジャーナルでの発表多数。経営情報学会 優秀賞受賞。シンガポールでWeb3企業を創業後、現在は企業向けAI導入・DX推進を支援。
GitHub Agentic Workflowsは、GitHub Next・Microsoft Research・Azure Core Upstreamの共同プロジェクトとして2026年2月13日に技術プレビュー公開された、MarkdownでAIエージェントを動かす新しいCI/CD自動化基盤です。
従来の複雑なYAMLワークフローを書く代わりに、自然言語の指示をMarkdownファイルに記述するだけで、Issue分類・PRレビュー・CI失敗診断・ドキュメント同期などをCopilot CLI・Claude Code・OpenAI Codex・Geminiといった主要AIエージェントが自律実行します。
本記事では、Markdownで書く設計思想、6つのContinuous自動化ユースケース、対応エンジンとsafe-outputs設計、gh aw CLIでのセットアップ手順、2026年6月1日から始まったGitHub AI Credits課金体系、導入時の詰まり論点まで、2026年6月時点の最新情報で整理します。
個人リポジトリの定型作業自動化からエンタープライズCI/CDの統制強化まで、開発組織のフェーズに応じた導入判断ができる構成です。
✅2026年6月9日、AnthropicがMythos-class初の一般公開モデル「Claude Fable 5」を発表しました。Opus 4.8の上位に位置する新最上位モデルの詳細はこちら。
▶︎Claude Fable 5とは?Mythos 5との違いや料金、使い方を解説
目次
GitHub Agentic Workflowsとは——MarkdownでAIエージェントを動かすCI/CD自動化
開発主体——GitHub Next・Microsoft Research・Azure Core Upstreamの共同プロジェクト
GitHub Agentic Workflowsで実現できる6つの「Continuous」自動化
サンプルワークフロー集——agenticsリポジトリの実装例
GitHub Agentic Workflowsの仕組み——.aw.mdとlock.yml、対応AIエンジン、ガードレール
ファイル構造——Markdownソース+ロックYAMLの2段構成
対応AIエンジン——Copilot CLI・Claude Code・OpenAI Codex・Gemini
GitHub Agentic Workflowsの使い方——gh aw CLIでのセットアップから実行まで
GitHub Agentic Workflowsの料金——エンジン別の課金元とGitHub AI Credits
2026年6月1日からのGitHub AI Credits(Copilotエンジン選択時)
GitHub Agentic Workflowsの導入で詰まる論点と対策
GitHub Agentic Workflowsとは——MarkdownでAIエージェントを動かすCI/CD自動化
GitHub Agentic Workflowsは、GitHub Next・Microsoft Research・Azure Core Upstreamの共同プロジェクトとして2026年2月13日に技術プレビュー公開された、リポジトリ内のMarkdownファイルでAIエージェントの動作を定義する新しいCI/CD自動化基盤です。
GitHub公式の技術プレビュー発表では、「自然言語で記述したMarkdownを、GitHub Actions上でAIエージェントが解釈・実行する」設計思想が示されています。
本セクションでは、既存のGitHub ActionsとAgentic Workflowsの違い、開発主体、プレビュー段階の位置づけ、関連リポジトリを順に整理します。料金や使い方は後段の専用セクションで扱うため、ここでは「何者か」を明確にすることに絞ります。

既存のGitHub Actions YAMLとの違い
GitHub Blogの紹介記事では、Agentic Workflowsの設計上の特徴を「if/thenの固定ロジックを書く代わりに、文脈理解と意思決定をAIエージェントに委ねる」と整理しています。

以下の表で、従来のGitHub Actions YAML+Copilot/Claude CLI構成と、Agentic Workflowsの違いを比較しました。
| 観点 | 従来のGitHub Actions YAML | GitHub Agentic Workflows |
|---|---|---|
| 記述形式 | YAML(手続き型・if/then) | Markdown(自然言語指示)+YAMLフロントマター |
| 動作の決め方 | 開発者が条件分岐を全部書く | AIエージェントが文脈を読んで判断 |
| 既定の権限 | リポジトリ全体に対する書き込み権限を渡しがち | 読み取り専用が既定 |
| 書き込み制御 | 個別にpermissions設定 | safe-outputsで承認済み操作のみ許可 |
| サンドボックス | 標準のActions runner | コンテナ+ネットワーク隔離+ツール許可リスト |
同じ「Issueの自動分類」を実装する場合でも、従来YAMLでは正規表現やラベル判定ロジックを開発者が書き切る必要があるのに対し、Agentic Workflowsでは「新着Issueの内容を読み、重大度・カテゴリのラベルを付けて担当者をアサインする」と日本語で書けば足ります。
実装の主軸が「ロジックを書く」から「目的と制約を伝える」に変わる点が、開発者体験での最大の差分です。
開発主体——GitHub Next・Microsoft Research・Azure Core Upstreamの共同プロジェクト

Agentic Workflowsは、GitHub内の先進機能開発チームGitHub Next、Microsoft Research、そしてAzure Core Upstreamの3者による共同プロジェクトとして進められています(GitHub Changelogに明記)。
リポジトリ本体github/gh-awはMITライセンスで完全オープンソースとなっており、商用利用・改変・再配布が可能です。エンタープライズ用途で「ブラックボックスの自動化基盤は採用しにくい」という制約がある組織でも、内部ロジックを精査したうえで導入を判断できます。
技術プレビュー段階としての位置づけ
GitHub公式ドキュメントでは、Agentic Workflowsの現状を「early development(初期開発段階)」と明示しており、本番運用には注意深いセキュリティ検討と人間による監督が必須と注意喚起されています。
具体的には、対応AIエンジンの仕様変更や課金体系の見直しが今後発生する可能性があるため、ミッションクリティカルなCI/CDパイプラインを丸ごと置き換える運用は時期尚早です。一方で、Issue分類・PRトリアージ・ドキュメント更新といった「失敗しても被害が限定的なタスク」から段階的に投入するアプローチであれば、現時点でも十分実用に乗ります。
関連リポジトリと参考プロジェクト

Agentic Workflowsを導入する際に参照すべきリポジトリは、本体のほかに2つあります。
-
github/gh-aw
本体CLI(gh aw extension)の実装リポジトリ。ドキュメント・スキーマ・ガードレール処理が含まれる
-
githubnext/agentics
公式サンプル集。Issue Triage・Repo Assist・CI Doctor・PR Fix・AI Moderatorなど10種以上のワークフローをgh aw add-wizardコマンドでそのまま導入できる
-
github/awesome-copilot
コミュニティ提供のCopilot向け設定・エージェント定義集。Agentic Workflowsの実装例も含まれる
自社のユースケースに合うサンプルをまずgithubnext/agenticsから探し、改変して導入する流れが現実的です。ゼロから自力で書くより、既存サンプルを起点にした方が安全側に倒れたガードレール設定を継承できます。
GitHub Agentic Workflowsで実現できる6つの「Continuous」自動化
Agentic Workflowsが具体的に何を自動化できるのかを、GitHub公式が提示する6つのContinuousユースケースとサンプルワークフローから整理します。
公式ドキュメントでは、Agentic Workflowsの典型的な活用領域を**Continuous(継続的)**という言葉で統一しており、いずれも「リポジトリの健全性を継続的に維持する」ことを目的に設計されています。

6つのContinuousユースケース
GitHub公式の概要ページが示す主要ユースケースは6種類です。以下の表で、それぞれの自動化対象と現実的な効果を整理しました。
| ユースケース | 自動化する作業 | 期待される効果 |
|---|---|---|
| Continuous Triage | 新着Issue/PRの要約・ラベル付け・担当者アサイン | メンテナーの初動コスト削減、放置Issue防止 |
| Continuous Documentation | コード変更に合わせたREADME・ドキュメントの更新提案 | ドキュメント陳腐化の抑制 |
| Continuous Code Simplification | 冗長コード・複雑度の高い関数の発見と簡略化PR作成 | 技術的負債の可視化と継続的削減 |
| Continuous Test Improvement | テストカバレッジの薄い領域に対するテスト追加提案 | 重要パスのテスト網羅率向上 |
| Continuous Quality Hygiene | CI失敗の原因調査・推定修正PRの作成 | 失敗ビルドの初動分析時間の短縮 |
| Continuous Reporting | リポジトリ健全性の定期レポート生成(週次・月次) | 経営層・OSSコミュニティへの可視化 |
「いきなり全部を自動化しよう」と考えると失敗します。最も成果が見えやすいのは Continuous Triage で、Issue/PRの要約・分類は人間のメンテナーが最も時間を取られる作業の一つです。ここから着手して、効果が出たら次のユースケースに広げる流れが現実的です。
サンプルワークフロー集——agenticsリポジトリの実装例

githubnext/agenticsには、上記6ユースケースをカバーする実装サンプルが揃っています。
主要なサンプルを以下に整理しました。導入時は、自社の課題に近いものを gh aw add-wizard githubnext/agentics/<workflow-name> で取り込み、Markdown本文を業務に合わせて書き換える流れが最短ルートです。
-
Issue Triage
新着Issueを読み取り、要約・ラベル付け・優先度判定・担当者アサインを自動実行する。Continuous Triageの代表例
-
Repo Assist
複数タスク対応の汎用アシスタント。Issue調査・バグ修正提案・改善PRの作成までを文脈に応じて切り替える
-
CI Doctor
CIが失敗したときに、ログ・依存関係・最近の変更を読み取り、原因の仮説と修正案を提示する。Continuous Quality Hygieneの典型実装
-
CI Coach
CIワークフロー自体の最適化提案。実行時間が長いジョブ、不要なステップを発見し改善PRを作成する
-
PR Fix
失敗中のCIチェックを分析し、修正コミットを既存PRに追加する。レビュー前のPR品質向上に有効
-
Archie
リポジトリ内のモジュール関係をMermaid図で可視化。新規参加者のオンボーディングや設計レビューに使う
-
Plan Command
大きなIssueを実装可能なサブタスクに分解し、それぞれを別Issueとして起票する
-
Daily Malicious Code Scan
依存ライブラリの新しい更新を毎日スキャンし、不審な変更を検出してアラートを出す
これらをそのまま使うだけでも、メンテナーの初動コスト・PR待ち時間・依存関係の監視負荷を一気に下げられます。実装ロジックを読みたい場合も、Markdown本文と .lock.yml の両方を読み比べることで、自然言語指示がどうGitHub Actions YAMLに展開されるかを学習材料として使えます。
既存のGitHub Copilot機能との位置づけ

混同しやすいのが、Agentic WorkflowsとGitHub Copilot Coding Agent・GitHub Copilot Agent Modeの関係です。
役割を整理すると以下のように分かれます。
-
GitHub Copilot Agent Mode / Coding Agent
開発者個人がIDE・Web上でAIに開発タスクを依頼する仕組み。インタラクティブに対話しながら進める
-
GitHub Agentic Workflows
リポジトリ全体に対して、イベント発火(push/PR/Issueなど)またはスケジュール実行で自律的に動くバックグラウンド自動化基盤
つまり前者は「開発者の手元での加速」、後者は「リポジトリ運営の自動化」を担当しており、両者は補完関係にあります。実務的には、Coding AgentでPRを作る開発フローと、Agentic Workflowsでそのリポジトリ全体を継続維持する自動化フローを並行運用するのが標準的な使い方になります。
GitHub Agentic Workflowsの仕組み——.aw.mdとlock.yml、対応AIエンジン、ガードレール
Agentic Workflowsの内部設計は、「Markdownソース」「YAMLロック」「サンドボックス実行」「safe-outputs検証」の4層構造になっています。
本セクションでは、ファイル構造・対応AIエンジン・セキュリティガードレールの3つを順に解説します。料金面のコスト管理は後段の料金セクションで扱い、ここではアーキテクチャ的な仕組みに絞ります。

ファイル構造——Markdownソース+ロックYAMLの2段構成

公式のCreating Workflowsドキュメントによれば、Agentic Workflowsは2種類のファイルで構成されます。
| ファイル | 役割 | 編集対象 |
|---|---|---|
.github/workflows/<name>.md(または .aw.md) |
YAMLフロントマター+Markdown本文。人間が編集する正本 | ✅ 人間が書く |
.github/workflows/<name>.lock.yml |
gh aw compile で生成される実行用YAML。GitHub Actionsが実行するのはこちら |
❌ 直接編集禁止(自動生成) |
両方のファイルをコミット対象とし、Markdownを更新するたびに gh aw compile でロックYAMLを再生成する運用が公式の推奨フローです。.lock.yml 側にはセキュリティハードニング処理が自動適用されているため、これを生成せずに直接YAMLを編集してしまうとガードレールが効かなくなります。
実際のフロントマターには、ワークフローの起動条件・許可するツール・タイムアウト・使用するAIエンジン・safe-outputs設定などを記述します。
---
on:
schedule:
- cron: '0 9 * * *'
permissions:
contents: read
issues: read
engine: copilot
timeout_minutes: 15
safe-outputs:
add-comment:
max: 1
create-pull-request:
max: 1
tools:
github:
allowed: [search_issues, get_issue]
---
このフロントマターの下に、AIエージェントへの自然言語指示を書きます。たとえば「Active なIssueを優先度別に分類し、最も古い5件についてサマリーコメントを追加してください」のように、目的と制約をMarkdownで記述するだけで、AIエージェントが内部で計画を立てて実行します。
対応AIエンジン——Copilot CLI・Claude Code・OpenAI Codex・Gemini

Agentic Workflowsの実行エンジンは、ワークフロー単位で切り替えられます。フロントマターの engine: フィールドで指定する形式です。
以下の表で、2026年6月時点の主要4エンジンを整理しました(gh-aw公式のAI Enginesリファレンスでは、このほかexperimentalステータスでCrush / OpenCode / Piも利用可能と記載されています)。
| エンジン | 提供元 | 強み | 主な使い分け |
|---|---|---|---|
| GitHub Copilot CLI | GitHub | GitHubエコシステムとの親和性が高く、追加SaaS契約は不要(COPILOT_GITHUB_TOKEN のfine-grained PAT設定は必要) |
デフォルト。多くのユースケースで第一候補 |
| Claude Code | Anthropic | 長文コンテキスト、複雑なコード理解、エージェント的振る舞い | 大規模リポジトリの調査・複雑なリファクタリング |
| OpenAI Codex | OpenAI | 構造化出力、API成熟度 | テストコード生成、定型レポート出力 |
| Google Gemini | マルチモーダル、長文要約 | ドキュメント生成、レポート作成 |
同じワークフローでもエンジンを切り替えるとコストと精度が変わるため、ルーチンタスクは小型モデル、複雑な調査はフロンティアモデルという使い分けが現実的です。Continuous Triageのようなラベル付けタスクならgpt-4.1-miniやclaude-haiku-4-5で十分回り、CI失敗の根本原因調査のような領域だけclaude-sonnet-4-6やopus級に切り替える、というのが公式のコスト管理ガイドが示す方針です。エンジンの選定はGitHub Modelsで各モデルの挙動を試してから決めるのが安全側に倒れます。
Claude Codeとの統合は2026年に入って急速に深化しており、Anthropic公式のClaude Code CI/CD対応と組み合わせると、リポジトリ自動化の選択肢が一気に広がります。
Safe-Outputsとサンドボックスのガードレール設計

gh-aw公式のSecurity Architectureドキュメントによれば、Agentic Workflowsはprompt injection・トークン漏洩・予期しない書き込みといったAIエージェント特有のリスクに対し、**多層防御(Defense in Depth)**で対応する設計を採用しています(InfoQの解説記事も同様の整理を行っています)。
具体的な防御層は以下のとおりです。
-
読み取り専用権限が既定
ワークフロー実行時に渡されるGitHubトークンは、特に指定しない限り読み取り専用。Issue・PR・コード本体に直接書き込むことはできない
-
Safe-Outputs方式の書き込み許可
書き込み操作(コメント追加・PR作成・ラベル付与など)は、フロントマターで明示的に許可されたものだけが実行可能。各操作には最大件数(max: 1)も指定できる
-
サンドボックスコンテナ実行
コーディングエージェントは独立したコンテナ内で動作し、ホスト環境へのアクセスは制限される
-
ネットワーク隔離
許可リスト方式でアクセス可能なドメインを制限。MCP経由の外部ツール呼び出しもツールごとに許可が必要
-
包括的なログ監査
すべての実行はGitHub Actionsのログに残り、gh aw logsで確認可能。OpenTelemetry経由で組織のSIEMに連携することもできる
このうち最も実務的に重要なのがSafe-Outputsです。AIエージェントが「悪意あるIssue本文に騙されて全リポジトリを書き換える」といったprompt injection攻撃を防ぐには、書き込み権限を最小化することが最も効きます。たとえ攻撃者が巧妙にプロンプトを操作しても、フロントマターでcreate-pull-request: max: 1としか宣言していなければ、PR1件以上の被害には広がりません。
GitHub Advanced SecurityやGitHub MCPを併用すれば、ガードレールの隙間をさらに埋められます。
GitHub Agentic Workflowsの使い方——gh aw CLIでのセットアップから実行まで
ここからは、Agentic Workflowsを実際に動かすまでの手順を順に解説します。
公式Quick Startガイドでは、gh CLI拡張のインストール→リポジトリ初期化→サンプル導入→コンパイル→実行の5段階で構成されています。本セクションも同じ順序で進めます。

gh aw拡張のインストール
Agentic Workflowsは gh CLIの拡張機能として配布されています。前提として、GitHub CLI(gh コマンド)が事前にインストールされている必要があります。
拡張機能のインストールコマンドは1行で済みます。
gh extension install github/gh-aw
これで gh aw サブコマンドが使えるようになります。gh aw --help で利用可能なコマンド一覧を確認できます。
リポジトリの初期化
対象のリポジトリのルートディレクトリに移動し、初期化コマンドを実行します。
cd your-repo
gh aw init
gh-aw公式のCreating Workflowsドキュメントによれば、gh aw init は .github/skills/agentic-workflows/SKILL.md・MCP統合設定・.gitattributes・VS Code設定など、ワークフローを書くためのauthoring用環境一式を配置するコマンドです。リポジトリごとに1回実行すれば十分です。
実行後、Copilot Chatやコーディングエージェント側からAgentic Workflowsの定義スキーマやMCPツールにアクセスできる状態になります。サンプルワークフロー自体は次の gh aw add-wizard で取り込みます。
ワークフローの作成——3つのアプローチ

ワークフローの作り方は3通りあります。記事の用途や好みに応じて選びます。
-
サンプルから取り込む(最短ルート)
gh aw add-wizard githubnext/agentics/issue-triageのように、公式サンプル集からワークフローを直接導入する。Issue Triage・CI Doctor・PR Fixなど10種以上が利用可能
-
コーディングエージェントに頼んで生成
VS Code・Cursor・Claude Codeなどで「Issueを自動分類するAgentic Workflowを作って」と依頼する。エージェント側がMCP経由でgh awの知識を持っているため、適切なフォーマットで.mdファイルを生成する
-
GitHub Web UIで対話的に作成
Copilot Chat搭載のリポジトリ画面から、自然言語で要件を伝えるとブラウザ上でワークフロー本文を生成できる
最初の1本はサンプル取り込みから始め、慣れてきたらコーディングエージェント生成、最終的に独自要件は自分で書き下ろす、という段階的な習得が現実的です。
ワークフローファイルの構造

生成されたワークフローファイル .github/workflows/issue-triage.md は、以下のような構造になります。
---
on:
issues:
types: [opened]
permissions:
contents: read
issues: read
engine: copilot
timeout_minutes: 10
safe-outputs:
add-comment:
max: 1
add-labels:
allowed: ['bug', 'enhancement', 'question']
---
# Issue Triage Workflow
新しく作成されたIssueについて、以下を実行してください。
1. Issueの内容を読み、要約を3行以内で作成する
2. 内容に応じて適切なラベル(bug / enhancement / question)を1つ付与する
3. 似た過去Issueがあれば、リンクを含めたコメントを追加する
YAMLフロントマターでトリガー条件・権限・エンジン・safe-outputsを定義し、Markdown本文で具体的な指示を自然言語で書く構造です。AIエージェントはMarkdown本文を「目標」として解釈し、フロントマターの制約内で動作します。
gh aw compileでの実行用YAML生成
Markdownファイルを編集したら、コンパイルコマンドで実行用のロックYAMLを生成します。
gh aw compile
このコマンドは、.github/workflows/*.md を読み取り、対応する .lock.yml ファイルを生成します。複数ワークフローがある場合は全部が一括で再生成されます。
開発中は --watch オプションを付けると、Markdownファイルの変更を検知して自動で再コンパイルしてくれます。
gh aw compile --watch
生成された .lock.yml には、Markdown本文に書かれた指示を実行するためのGitHub Actions構成、サンドボックスの起動、safe-outputs検証、ログ送信などの処理が自動で組み込まれます。.mdと.lock.ymlの両方を必ずコミットする点を忘れないでください。lock側を含めていないと、GitHub側でワークフローが実行できません。
ワークフローの実行と監視
コミット・プッシュ後、設定したトリガー(Issue作成・PR作成・スケジュールなど)に応じてワークフローが自動実行されます。手動実行したい場合は以下のいずれかを使います。
- GitHubリポジトリのActionsタブから「Run workflow」ボタンで起動
- ローカルCLIから
gh aw run <workflow-name>で起動
実行状況とコスト消費は gh aw logs で確認できます。--json オプションを付ければJSON形式で出力されるため、組織全体のコスト・実行頻度ダッシュボードを自前で組むこともできます。
必要なシークレット設定

各エンジンに応じて、リポジトリまたは組織のSecretsに認証情報を登録する必要があります。
- GitHub Copilot CLI使用時:
COPILOT_GITHUB_TOKEN(Copilot requestsスコープを持つfine-grained PAT) - Claude Code使用時:
ANTHROPIC_API_KEY - OpenAI Codex使用時:
OPENAI_API_KEY - Gemini使用時:
GEMINI_API_KEY
各エンジンのシークレット名・スコープ要件はgh-aw公式の認証リファレンスに整理されています。Copilot CLIでも独立したfine-grained PATが必要で、Copilotサブスクリプションだけで認証不要に動くわけではない点に注意してください。Claude Codeを使う場合はAnthropic公式コンソールでAPIキーを発行してSecretsに登録します。
GitHub Agentic Workflowsの料金——エンジン別の課金元とGitHub AI Credits
Agentic Workflowsの料金は、GitHub Actionsの実行時間とAI推論の2軸で発生します。さらにAI推論の課金は選択したエンジンによって課金元が異なる点に注意が必要で、Copilotを選んだ場合はGitHub AI Credits(2026年6月1日移行)、Claude/Codex/Geminiを選んだ場合は各プロバイダのAPI課金になります。
本セクションでは、コスト構造・エンジン別の課金元・新しいCredits体系・実際のコスト感・コスト管理のベストプラクティスを順に整理します。

コスト構造の2軸——Actions分とAI推論分

gh-aw公式のコスト管理ドキュメントが示すコスト構成は、2つの独立した課金源が組み合わさる形です。
| コスト源 | 課金対象 | 典型的な消費量 |
|---|---|---|
| GitHub Actions分 | ワークフロー実行に使うActionsランナーの稼働時間 | 起動〜1.5分のセットアップ+1〜15分のエージェント実行 |
| AI推論分 | 選択したエンジンが消費する入力・出力トークン | 軽量タスクで数千トークン、フロンティアモデルで数万トークン |
従来のGitHub Actionsのみのワークフローと比べると、AI推論コストが追加される分だけ単純比較では高くなります。一方で、人間のメンテナーがIssueトリアージに費やしていた時間コストを削減できるため、人件費換算では十分ペイするユースケースが多くあります。
AI推論の課金元はエンジンごとに異なる

gh-aw公式のコスト管理ドキュメントでは、AI推論側の課金がエンジン別に分かれることが明示されています。
-
Copilot CLI使用時: GitHub AI Credits(GitHub Copilotサブスクリプションに含まれる枠+超過分は従量課金)
-
Claude Code使用時: Anthropic API課金(
ANTHROPIC_API_KEYの請求先)
-
OpenAI Codex使用時: OpenAI API課金(
OPENAI_API_KEYの請求先)
-
Gemini使用時: Google AI API課金(
GEMINI_API_KEYの請求先)
つまり「Agentic Workflows全体がGitHub AI Creditsで課金される」のではなく、Copilotエンジンを選んだ場合だけGitHub AI Creditsが消費される設計です。Claude/Codex/Geminiでコストを管理したい場合は、各プロバイダのコンソールで上限・アラートを設定する必要があります。
2026年6月1日からのGitHub AI Credits(Copilotエンジン選択時)

GitHub公式の課金移行アナウンスによれば、2026年6月1日以降、Copilotの従来のPremium Request Units(PRU)がGitHub AI Creditsに置き換わります。Agentic WorkflowsでCopilot CLIエンジンを選んだ場合、この新クレジット体系が消費されます(Claude/Codex/Geminiは前節のとおり各プロバイダAPI課金)。
1 AI Credit = $0.01 USD。各プランへの含み枠はGitHub Docs(個人向け)および同(組織向け)で以下のとおり示されています。
| 区分 | プラン | 月の含みAI Credits |
|---|---|---|
| 個人 | Copilot Pro | 1,500 credits |
| 個人 | Copilot Pro+ | 7,000 credits |
| 個人 | Copilot Max | 20,000 credits |
| 組織 | Copilot Business | 通常1,900 credits/2026年6月1日〜9月1日のプロモーション期間中の既存顧客は3,000 credits |
| 組織 | Copilot Enterprise | 通常3,900 credits/同プロモーション期間中の既存顧客は7,000 credits |
※ コード補完・Next Edit候補はクレジット消費対象外(基本機能として継続)
同じセッションでもエンジン・モデル選択でクレジット消費が大きく変わります。Copilotプレミアムリクエストの解説記事で扱った旧PRUベースの計算は移行後の単位に置き換わるため、自社で運用している場合は早めに新単位での試算をやり直しておく必要があります。
モデル単価から逆算するコスト感

gh-aw公式のCost Managementでは、Agentic Workflowsの推論コストを「Actions実行時間+プロバイダ単価×消費トークン」の組み合わせで概算する考え方が示されています。1 AI Credit = $0.01 を基準に、2026年6月時点のモデル別公式単価から1セッションあたりの目安を試算すると以下のようなレンジになります(実消費は gh aw logs --json での実測が最も確実です)。
-
軽量タスク(Issue要約・ラベル付け)
小型モデル(gpt-4.1-mini/claude-haiku-4-5)で入力5K+出力1Kトークン規模なら、Copilotエンジンで1セッションあたり**1〜5クレジット($0.01〜$0.05)**前後の試算。週次運用でも月数百クレジット以内
-
中程度タスク(CI失敗の原因分析)
標準モデル(sonnet級)で入力50K+出力5Kトークン規模なら、**1セッションあたり20〜30クレジット($0.20〜$0.30)**前後。月数千クレジット規模
-
重量タスク(複数ファイルの機能実装PR作成)
フロンティアモデル(opus級)で入力200K+出力20Kトークン規模になると、1セッションあたり数百クレジット規模。さらに複数セッションが連鎖する大型機能実装ではモノリシックなopusセッションで$8前後、分割した小型エージェント群で$1前後といった事例がDEV Communityの分析で議論されており、機能まるごとをエージェント任せにするフローでは数千クレジット規模を視野に入れて予算設計するのが現実的です
つまり「Issueトリアージを毎時自動実行」のような軽量ユースケースであれば月額数十ドル以内に収まりますが、「複雑な機能実装をエージェント任せにする」運用ではフロンティアモデルの連鎖呼び出しで月数千〜数万クレジット規模を覚悟する必要があります。Copilot以外のエンジン(Claude/Codex/Gemini)を使う場合は各プロバイダAPIの公式単価で見積もり直し、gh aw logs および各プロバイダのコンソールでの実測と突き合わせて運用するのが現実的です。
コスト管理のベストプラクティス

公式が示すコスト暴走対策は4つあります。これらを最初のワークフローから組み込んでおくと、本番運用後の請求書ショックを防げます。
-
skip-if-matchで早期キャンセル
ワークフロー本体を起動する前の低コスト段階で、対象外Issueをフィルタリングする。たとえば「bot生成のIssueはスキップ」をskip-if-matchに書けば、AI推論コストが発生する前にキャンセルされる
-
モデルを軽量化
ラベル付け・要約・定型レポートのような構造化された出力はgpt-4.1-miniやclaude-haiku-4-5で十分。フロンティアモデルは「複雑な判断を要するタスク」だけに限定する
-
max-effective-tokensで上限設定
フロントマターにmax-effective-tokens: 5000000のようにトークン上限を明示しておくと、暴走時のクレジット流出を物理的に止められる
-
トリガー頻度の制御
pushやpull_requestのような高頻度イベントよりも、scheduleトリガー(cron指定)の方が予算が読みやすい。リアルタイム性が不要なら定期実行に寄せる
gh aw logs --json で取得した実行履歴を集計し、月初に予算超過しそうなワークフローを早期検知する運用も合わせて整備しておくと安全です。エンタープライズ用途では、組織レベルの予算上限・部門別の配賦も新Credits体系で標準サポートされています。
GitHub Agentic Workflowsの導入で詰まる論点と対策
最後に、Agentic Workflowsを実際に導入する際に判断に迷う論点と、現時点で取れる対策を整理します。
技術プレビュー段階のため、明確な「正解」が存在しない判断ポイントもあります。AI総合研究所の支援現場で実際に詰まりやすい論点と、それぞれの実務的な打ち手を併記します。

技術プレビュー段階のリスクをどう扱うか

公式が「early development」と明示している以上、本番クリティカルなパイプライン丸ごとの置き換えは時期尚早です。一方で「導入を待っていれば必ず楽になる」とも限らず、競合他社・OSS界隈での先行事例が積み上がる前に運用知見を蓄積する価値もあります。
実務的なバランスとしては以下が現実的です。
-
失敗しても被害が限定的なユースケースから始める
Issue要約・ラベル付け・週次レポートなど、誤判定しても人間が後追いで修正できる領域に絞る
-
本番デプロイ系・本番DB操作系のワークフローには適用しない
プレビュー段階で「自動デプロイ判定」をAIに任せると、prompt injection攻撃時の被害が致命的になる
-
GA(一般提供)への移行アナウンスを継続的にウォッチ
gh-awリポジトリのreleasesとGitHub Changelogを購読し、仕様変更を追跡する
「とりあえず本番ワークフローを置き換えてみる」アプローチは推奨しません。1ユースケースずつ、効果が見えた領域から段階的に広げる方が、後戻りコストを最小化できます。
Prompt Injection攻撃への耐性をどう確保するか

AIエージェントを公開リポジトリで動かす以上、「外部からのIssue本文・PRコメントを通じて悪意ある指示を埋め込まれる」リスクは構造的に存在します。
公式のガードレール設計は強力ですが、ユーザー側でも以下の運用ルールを併用する必要があります。
-
書き込み権限を絶対に過剰付与しない
safe-outputsでmax: 1以上を設定する場合、その上限がprompt injectionの被害上限になる前提で設計する
-
MCP経由の外部ツール接続は許可リスト方式で
不要なツールを接続したままにしない。たとえばSlack送信用MCPを使うなら、送信先チャンネルも固定する。GitHub MCP Serverを併用する場合も同様に、許可ツールを最小化する
-
シークレットを本文ロギングしない指示を明示
Markdown本文に「APIキー・トークンを出力ログに含めないこと」と明記する。AnthropicのClaude Code Hooksでも同様の制約を入れる運用が標準化しつつある
これらは技術的なガードレールではなく運用ルールですが、prompt injection対策はガードレールと運用の両輪で初めて成立します。
コスト暴走の事前防御

軽量タスクから始めても、設定ミスでフロンティアモデルが暴走するとあっという間にクレジットが枯渇します。
-
max-effective-tokensは全ワークフローでデフォルト設定
ワークフローテンプレートに最初から組み込んでおく。後付けで足すと忘れる
-
schedule頻度を最初は週次・月次に寄せる
時間単位の実行頻度は、運用が安定してから段階的に上げる
-
gh aw logsの予算アラート連携
組織のSlack・Teamsに月次クレジット消費を通知するbotを組む。CFOからの請求書ショックは事業ロイヤリティを大きく下げる
AI総研の支援現場でも、「初月で予算を倍近く食ってしまい、二月目から導入凍結」というケースは何度か観察しています。最初の1〜2ヶ月は控えめな頻度・軽量モデルで運用感覚を掴むのが安全です。
既存GitHub Actionsとの併用ライン

既存のYAML型ワークフローを全部Agentic Workflowsに置き換えるのは現実的でも望ましくもありません。
判断軸として、以下の使い分けが実務的に機能します。
| ワークフローの性質 | 推奨形式 | 理由 |
|---|---|---|
| 決定論的・手順固定(テスト実行・デプロイ・ビルド) | 従来のYAML | 同じ入力で同じ出力が求められる領域。AIの非決定性は不要 |
| 文脈依存・判断が必要(Issue分類・PRレビュー・CI失敗分析) | Agentic Workflows | ロジックを書ききれない領域。AIの強みが活きる |
| 監査が必須(コンプライアンス系・SOX対応) | 従来のYAML(少なくとも判断ロジック部分) | 判断根拠の再現性が必要 |
つまり**「if/thenで書ききれない」ワークフローだけがAgentic Workflowsの候補**であり、既存のテストランナー・デプロイパイプラインは引き続きYAMLで管理する2層構造が現実解です。
人間による監督の前提

公式ドキュメントが繰り返し強調しているのが「careful human supervision(注意深い人間の監督)」です。技術プレビュー段階では、エージェントの動作結果を人間が確認し、誤りを検知して訂正する運用が前提になります。
具体的には以下のような体制が必要です。
-
safe-outputsの動作をPRレビューに組み込む
AIが作成したPR・コメントは、必ず人間がレビューしてからマージ。自動マージは設定しない
-
失敗ケースのフィードバックループを構築
誤判定したIssueトリアージ結果を蓄積し、Markdown本文の指示文を継続的に改善する
-
メンテナーチームでの運用知識共有
Agentic Workflowsの動作はMarkdown本文に強く依存するため、本文の書き方・改善履歴をチームで共有する
「AIに任せたから人手が要らなくなる」ではなく、「AIの判断を確認し改善する人間の役割が新たに発生する」という認識が、プレビュー段階での現実的な向き合い方になります。
リポジトリ自動化から社内業務全体のエージェント化へ
GitHub Agentic Workflowsは、リポジトリ内の定型業務をAIエージェントに任せる強力な基盤です。一方で、開発組織の自動化が進むほど「経理・人事・営業・総務など、開発以外の社内業務も同じように自動化したい」というニーズが見えてきます。
AI Agent Hubは、GitHub Agentic Workflowsで開発リポジトリを自動化したその次のステップ——社内バックオフィス全体をAIエージェントが代行するエンタープライズAI基盤を提供します。リポジトリのIssue・PR自動化と同じ発想で、経費精算・請求書処理・申請承認・人事手続きといった業務をTeamsチャットから自然言語で実行できます。GitHubが自社テナント内に統合されているのと同様、AI Agent HubもAzure Managed Applicationsとして自社テナント内で完結するため、業務データが外部に流出する心配がありません。
AI総合研究所の専任チームが、GitHub上の開発自動化と社内業務のAIエージェント化を統合した運用設計を、Microsoft MVP / Solution Partner認定の実績をもとにサポートします。まずは無料の資料でAI Agent Hubの全体像をご確認ください。
リポジトリ自動化から社内業務全体のエージェント化へ
GitHubの先にあるエンタープライズAI基盤の設計
GitHub Agentic Workflowsでリポジトリの定型業務を自動化した次のステップは、経理・人事・営業などバックオフィス全体をAIエージェントが代行する基盤です。AI Agent HubのLPで、自社Azureテナント内で完結するエンタープライズAI基盤の全体像を確認できます。
まとめ
本記事では、GitHub Agentic Workflowsについて、製品定義・6つのContinuousユースケース・主要対応AIエンジン4種・gh aw CLIでのセットアップ・GitHub AI Credits課金体系・導入時の詰まり論点まで、2026年6月時点の最新情報で解説しました。要点を改めて整理します。
-
GitHub Agentic WorkflowsはGitHub Next・Microsoft Research・Azure Core Upstreamの共同プロジェクトとして2026年2月13日に技術プレビュー公開された、Markdownで書く新しいCI/CD自動化基盤で、自然言語の指示を
.aw.mdファイルに書くだけでAIエージェントが自律実行する設計
-
6つのContinuousユースケース(triage / documentation / code simplification / test improvement / quality hygiene / reporting)をカバーし、githubnext/agenticsのサンプル集をそのまま導入できる
-
主要対応AIエンジンはCopilot CLI・Claude Code・OpenAI Codex・Geminiの4種(ほかにexperimentalでCrush/OpenCode/Pi)で、ワークフロー単位で切り替え可能。読み取り専用権限とsafe-outputs・サンドボックスを組み合わせた多層ガードレールがprompt injection攻撃の被害を最小化する
-
料金はGitHub Actions分とAI推論分の2軸。AI推論はエンジンごとに課金元が異なり、CopilotエンジンはGitHub AI Credits(1 credit=$0.01、2026年6月1日移行)、Claude/Codex/Geminiは各プロバイダAPI課金。軽量タスクは数クレジット、フロンティアモデルは文脈量次第で数百クレジット以上、大型実装の連鎖呼び出しは数千クレジット規模を覚悟
-
技術プレビュー段階のため本番運用は人間監督が前提で、失敗しても被害が限定的なユースケースから段階導入する。既存YAMLと併用し、決定論的処理はYAML、文脈依存判断はAgentic Workflowsで使い分ける2層構造が現実解
GitHub Agentic Workflowsは、開発組織にとって「定型ロジックをコードで書く」時代から「目的と制約を自然言語で伝え、AIエージェントに実行を委ねる」時代への転換点を示すツールです。まずはgithubnext/agenticsのIssue Triageサンプルを gh aw add-wizard で導入し、自社リポジトリで1週間運用してみることが、最も実用的な第一歩になります。














