この記事のポイント
GPT-5.1-Codex-Maxは、長時間の自律型コーディングタスクに特化したOpenAIの最新AIモデル
新技術「Compaction」により、履歴を自動要約し、数百万トークンに及ぶ超長期の文脈維持と24時間以上の連続稼働が可能
SWE-Lancerベンチマークで79.9%を達成するなど、大規模リファクタリングやコードレビューでGPT-5を上回る性能
思考トークンを30%削減しコスト効率を向上させ、OpenAIモデルとして初めてWindows環境にネイティブ対応
ChatGPTの有料プラン(Plus以上)に含まれる形で提供され、Codex機能(CLI, IDE)のデフォルトモデルとなる

Microsoft MVP・AIパートナー。LinkX Japan株式会社 代表取締役。東京工業大学大学院にて自然言語処理・金融工学を研究。NHK放送技術研究所でAI・ブロックチェーンの研究開発に従事し、国際学会・ジャーナルでの発表多数。経営情報学会 優秀賞受賞。シンガポールでWeb3企業を創業後、現在は企業向けAI導入・DX推進を支援。
「AIが24時間、文脈を失わずにコーディングし続ける」——そんなSFのような開発体験がついに現実のものとなりました。
2025年11月、OpenAIは自律型タスクに特化した新しいフロンティアモデル「GPT-5.1-Codex-Max」を正式発表しました。これは、AIが単なるコード補完ツールから、開発プロジェクトの文脈を深く理解し、自律的にタスクを遂行する「チームメイト」へと進化する、大きな転換点です。
本記事では、この進化したCodexの核心である「GPT-5.1-Codex-Max」について、その全貌を徹底的に解説します。
驚異的な性能、記憶を自動圧縮する新技術「Compaction」、刷新されたツール、料金体系、そしてAIにコードを任せる上での安全性まで、詳しくご紹介します。
GPT-5.1-Codex-Maxとは?
GPT-5.1-Codex-Maxは、OpenAIが新たに発表した自律型(Agentic)コーディングモデルです。
最初に発表されたGPT-5.1とは異なり、ソフトウェアエンジニアリング、数学、リサーチといった複雑なタスクを、長時間にわたって自律的に遂行することを目的に設計されています。
本日から、Codex機能(CLI、IDE拡張、クラウド環境)におけるデフォルトモデルとして提供が開始されました。
「チャットボット」から「パートナー」へ
これまでのAIコーディング支援は、人間が細かく指示を出す必要がありました。しかし、GPT-5.1-Codex-Maxは、PR(プルリクエスト)の作成、コードレビュー、フロントエンドの実装、Q&Aといった実世界のエンジニアリングタスクにおいて、以前のモデルを凌駕する性能を発揮します。
以下のグラフが示す通り、実世界の課題解決能力を測るベンチマーク(SWE-Lancer IC SWE)において、旧モデル(GPT-5.1-Codex)と比較して約13ポイントもの精度向上を記録しています。


※SWE-LancerおよびTerminal-Bench 2.0における性能比較。青が旧モデル、水色が新モデル(Max)。 (参考:OpneAI)
OpenAI内部では、エンジニアの95%が毎週Codexを使用しており、Codex導入以降、出荷されるプルリクエストの数が約70%増加したという驚異的なデータも公表されています。
GPT-5.1-Codex-Maxの主要な機能と特徴
GPT-5.1-Codex-Maxには、エンジニアのワークフローを劇的に改善する3つの大きな特徴があります。
記憶を自動圧縮する「Compaction(コンパクション)」
GPT-5.1-Codex-Maxの最大の革新は、**Compaction(コンパクション)**と呼ばれる新しいコンテキスト管理メカニズムです。
これまで、AIとのセッションが長引くと「コンテキストウィンドウ(記憶容量)」の上限に達し、最初の方の指示を忘れてしまうことが課題でした。
Compaction機能は、セッション長が限界に近づくと、これまでの履歴を自動的に要約・剪定(Pruning)し、重要な文脈を保持したまま新しいウィンドウで作業を継続します。

※セッションが限界に近づくと自動で履歴を整理(Summarize recent commits)し、作業を継続する様子
このプロセスを繰り返すことで、数百万トークンに及ぶ文脈を一貫して維持でき、以下のようなタスクが可能になります。
- プロジェクト規模のリファクタリング: 複数のファイルにまたがる大規模な修正を一貫性を保って実行。
- 自律的なデバッグループ: エラー調査、修正、テスト実行のサイクルを解決するまで繰り返す。
- 24時間以上の連続稼働: 人間が寝ている間にAIが一晩中作業を続け、最終的な成果物を提出する。
コストを抑える「思考トークンの効率化」
GPT-5.1-Codex-Maxは、単に長時間働けるだけではありません。その「燃費」の良さも特筆すべき点です。
以下のグラフは、推論の深さ(思考トークン数)と精度の関係を示したものです。水色の線(Codex-Max)が、濃い青の線(旧モデル)よりも左上に位置していることがわかります。

※横軸が思考トークン数、縦軸が精度。Codex-Max(水色)は、旧モデル(濃い青)と比較して、より少ない思考量で高い正答率を出している。 (参考:OpneAI)
具体的には、標準的な**「Medium」推論レベル**で比較した場合、旧モデルよりも高いパフォーマンスを発揮しつつ、思考トークン(Thinking tokens)を30%削減することに成功しています。
これはAPIコストの削減に直結し、同じ予算でより多くのタスクをAIに任せられることを意味します。
また、グラフの右端にあるように、レイテンシ(待ち時間)を気にしないバックグラウンドタスク向けに、新しい推論レベル**「Extra High ('xhigh')」**も導入されました。これは徹底的に時間をかけて最高精度の答え(精度約78%)を導き出すためのモードです。
待望の「Windows環境」ネイティブ対応
Windowsユーザーにとって待望のアップデートが含まれています。
GPT-5.1-Codex-Maxは、OpenAIのモデルとして初めてWindows環境での動作向けにトレーニングされました。
これにより、PowerShellコマンドの適切な使用や、Windows特有のファイルパス・エラー処理など、Windows開発環境におけるAIの適応能力が飛躍的に向上しています。これまでWSL等を経由していた開発者も、ネイティブ環境でスムーズにCodexを利用できるようになります。
GPT-5.1-Codex-Maxの使い方
開発者がこの新しい能力を活用するための主なルートは以下の通りです。
CLIツールのインストールと実行
GPT-5.1-Codex-Maxの能力を最大限に引き出すには、CLI(コマンドラインインターフェース)での利用が推奨されます。
以下のコマンドで最新のCodex CLIをインストールできます(※Node.js環境が必要です)。
$ npm i -g @openai/codex
インストール後、ターミナルからCodexを起動することで、ローカルのコードベースに対して直接AIエージェントを働かせることができます。
IDEやクラウド環境での利用
VS CodeなどのIDE拡張機能や、OpenAIのクラウド開発環境においても、GPT-5.1-Codex-Maxはデフォルトのモデルとして選択可能です。
「Code」モードで実装タスクを依頼したり、「Ask」モードでコードベース全体に関する質問を行ったりできます。
安全な運用のためのサンドボックス
自律的に動くAIにおいて、セキュリティは最優先事項です。Codexはデフォルトで厳格なサンドボックス内で動作します。
- ファイル書き込み: 指定されたワークスペース内に制限されます。
- ネットワークアクセス: 開発者が明示的に許可しない限り無効化されています。
OpenAIは、Codexを「人間の代替」ではなく「追加のレビュアー」として扱うことを推奨しています。特に長時間タスクの成果物をデプロイする前には、Codexが出力したログやテスト結果を人間がレビューすることが重要です。
GPT-5.1-Codex-Maxの料金体系
GPT-5.1-Codex-Maxは、ChatGPTの有料プランおよびAPI経由で利用可能です。
ChatGPT各プランでの利用
以下のプランのユーザーは、追加料金なしでCodex機能(CLI、IDE拡張、クラウド)内でGPT-5.1-Codex-Maxを利用できます。
- Plus
- Pro
- Business
- Edu
- Enterprise
【関連記事】
▶︎ChatGPTの料金プランを比較!無料・有料版の違いと選び方【2025年最新】
API利用時の料金
APIアクセスは**近日公開予定(Coming Soon)**とアナウンスされています。
正確な価格体系はAPI公開時に発表されますが、基本的にはGPT-5.1ファミリーの価格設定に準拠する見込みです。
※思考トークンの30%削減により、実質的なタスクあたりのコストは旧モデルよりも低くなることが期待されます。
ChatGPT活用でお困りの方へ
まとめ
GPT-5.1-Codex-Maxの登場は、AIによる開発支援が「入力補完」や「スニペット生成」のレベルを超え、**「プロジェクト全体の自律的な遂行」**へとシフトしたことを象徴しています。
コンパクションによる無限の文脈維持、Windows対応、そして30%の効率化。これらはすべて、エンジニアがより創造的なタスクに集中し、生産性を飛躍的に高めるための強力な武器となるはずです。
まずはCodex CLIやIDE拡張機能をアップデートし、この新しい「同僚」の実力を試してみてはいかがでしょうか。









