この記事のポイント
o3-proは、OpenAIのo3モデルの中で最もインテリジェントで信頼性が高いバージョンとして2025年6月10日に発表
数学、科学、コーディングなどの分野で特に優れた性能を発揮し、専門家評価や学術的評価でo3やo1-proを上回る
Web検索、ファイル分析、視覚入力推論など、o3と同様のツールアクセスが可能で、複雑なタスクに対応
応答に時間がかかる場合があるため、速度よりも応答の質と信頼性が重要な複雑な問題解決向け
ChatGPT ProおよびTeamユーザーはモデルピッカーから利用可能、API料金はo3より高価だがo3自体は大幅値下げ

Microsoft MVP・AIパートナー。LinkX Japan株式会社 代表取締役。東京工業大学大学院にて自然言語処理・金融工学を研究。NHK放送技術研究所でAI・ブロックチェーンの研究開発に従事し、国際学会・ジャーナルでの発表多数。経営情報学会 優秀賞受賞。シンガポールでWeb3企業を創業後、現在は企業向けAI導入・DX推進を支援。
OpenAIから待望の最新モデル「o3-pro」が登場しました。o1-proの後継として、より高い信頼性とインテリジェンスを追求して設計されています。
しかし、「o3-proは何がすごいの?」「既存のo3やo1-proと比べてどう違うの?」「どんな時に使うべき?」といった疑問をお持ちの方も多いのではないでしょうか。
本記事では、ChatGPT ProおよびTeamユーザー向けに提供が開始されたo3-proの優れた特徴、o3やo1-proとの具体的な違い、推奨される使い方、そして現在の制限事項について詳しく解説します。
速度よりも応答の質を重視するユーザーにとって、この新しいモデルがどのような価値を提供してくれるのか、最後までご覧ください。
OpenAI o3-pro((ChatGPT o3 pro))とは?
OpenAI o3-proは、2025年6月10日に発表された、OpenAIの最新かつ最もインテリジェントなモデルの一つであるo3の進化版です。このモデルは、特に 「より長く考え、最も信頼性の高い応答を提供する」 ことを目指して設計されており、o1-proの後継モデルとして位置づけられています。
o3-proは、o3と同じ基本モデルを使用しており、完全な安全性の詳細についてはo3のシステムカードに記載されています。
ProおよびTeamユーザーは、ChatGPTのモデルピッカーからo1-proに代わってo3-proを利用可能で、。EnterpriseおよびEduユーザーについても、翌週からアクセス可能になる予定です。
o3-pro(ChatGPT o3 pro)の主な特徴
- 最高のインテリジェンスと信頼性: o3ファミリーの中で最も賢く、信頼性の高い応答を提供します。
- 得意分野: 数学、科学、コーディングといった分野で引き続き優れた性能を発揮します。これらの分野は、前モデルのo1-proでもユーザーから高い評価を得ていました。
- ツールアクセス: o3と同様に、Web検索、ファイルの分析、視覚入力の推論、Pythonの使用、メモリを使用した応答のパーソナライズなど、ChatGPTを便利にする各種ツールにアクセスできます。
- 応答時間: ツールアクセスが可能なため、応答が完了するまでにo1-proよりも時間がかかることがあります。そのため、速度よりも応答の質と信頼性が重視される複雑な問題への使用が推奨されます。
「o3-pro」、「o3」、「o1-pro」の性能比較
OpenAIによると、o3-proは専門家評価および学術的評価の両方で、o3およびo1-proを一貫して上回る結果を示しています。
専門家の評価 (Human Evaluation)
人間のテスターによる比較評価では、o3-proはo3と比較して、すべての評価クエリにおいて高い勝率を示しています。特に、科学的分析 (Scientific Analysis)、個人的な文章作成 (Personal Writing)、コンピュータプログラミング (Computer Programming)、データ分析 (Data Analysis) の各分野でその優位性が見られます。
o3-pro と o3 の人間テスターによる比較評価 (o3-pro の勝率)
グラフによると、全クエリ(All Queries)で64%、科学分析(Scientific Analysis)で64.9%、パーソナルライティング(Personal Writing)で66.7%、コンピュータプログラミング(Computer Programming)で62.7%、データ分析(Data Analysis)で64.3%のケースでo3-proがo3よりも好まれています。
これは、o3-proの応答がより明瞭で、包括的であり、指示への追従性や正確性が高いことを示唆しています。
学術的な評価ベンチマーク
学術的なベンチマーク評価においても、o3-proはo1-proとo3の両方を一貫して上回る性能を示しています。
pass@1 評価ベンチマーク
pass@1評価(最初の試行での正答率)では、特に競技数学 (Competition Math: AIME 2024)、博士課程レベルの科学問題 (PhD Science Questions: GPQA Diamond)、競技プログラミング (Competition Code: Codeforces) の各分野で、o3-proが高い精度を達成しています。
o1-pro, o3, o3-pro の pass@1 評価ベンチマーク比較
グラフを見ると、例えば競技数学においてo1-proが86%、o3が90%であるのに対し、o3-proは93%の正答率です。
同様に、博士課程レベルの科学問題ではo1-proが79%、o3が81%に対し、o3-proは84%。競技プログラミングのElo評価では、o1-proが1707、o3が2517に対し、o3-proは2748と、いずれの分野でもo3-proが最も高いスコアを記録しています。
4/4 信頼性評価ベンチマーク
o3-proの主要な強みの一つとして、OpenAIは**「4/4信頼性」評価**を挙げています。これは、モデルが一度だけでなく、4回の試行すべてで問題に正しく解答した場合にのみ成功とみなされる、より厳格な評価方法です。
この評価基準においても、o3-proは高い信頼性を示しています。
o1-pro, o3, o3-pro の 4/4 信頼性評価ベンチマーク比較
競技数学では、o1-proとo3が80%の4/4信頼性であるのに対し、o3-proは90%と大幅に向上しています。博士課程レベルの科学問題では、o1-proが74%、o3が67%に対し、o3-proは76%です。
競技プログラミングの4/4信頼性Elo評価でも、o1-proが1423、o3が2011に対し、o3-proは2301と、ここでもo3-proが最も優れた結果を示しており、複数回の試行においても安定して高品質な回答を生成する能力が高いことがわかります。
o3-proの推奨される使い方
o3-proは、その特性から以下のような場合に特に有効です。
- 複雑な問題解決: 数学の難問、科学的な考察、複雑なコーディングタスクなど、上記ベンチマークで示された得意分野。
- 高い信頼性が求められる業務: 詳細なレポート作成、ビジネス戦略の分析、教育資料の作成支援など、一貫して正確な情報が必要な場合。
- 多角的な情報アクセスが必要な場合: Web検索やファイル分析を伴うリサーチタスク。
o3-proはツールにアクセスできるため、応答に数分かかることもあります。そのため、「速度よりも信頼性が重要であり、数分待つことはトレードオフに見合う価値がある」 と判断できる難易度の高い問題やタスクに使用することが推奨されます。
o3 proの実際のユースケース
では、o3-proがどのように活用されているのか、具体的なユースケースをいくつか紹介します。
SNSですでに話題になっているo3-proの活用事例をいくつかピックアップしました。
- 長時間の思考の後の生成
この投稿では、o3-proに「Hi」と送るだけで3分54秒かかったことを報告しています
o3-pro is the slowest and most overthinking model.
— Yuchen Jin (@Yuchenj_UW) June 10, 2025
A simple 'Hi' cost me $80. 🥲 pic.twitter.com/UDQOnYwrT1
こちらは1+1に対して2分以上かかった例です。
話題の ChatGPT o3-pro に 1+1= をやってもらった。2分32秒掛かった。 https://t.co/A3vyjYHLU6 pic.twitter.com/BpOSWqcMXH
— null-sensei (@GOROman) June 10, 2025
- 科学的知見を踏まえた上での回答
I have many mind blowing examples of o3-pro outputs, but let me quickly share one. In this instance, I’ve been working with o3-pro to develop immune system 2.0, a modestly ambitious attempt to completely reengineer our immune system 😆 I first asked o3-pro to identify key… pic.twitter.com/IYSjUbfnEB
— Derya Unutmaz, MD (@DeryaTR_) June 10, 2025
翻訳:「今回の例では、o3-proと協力して免疫システム2.0を開発しています。これは、私たちの免疫システムを完全に再構築するという、ささやかながらも野心的な試みです😆 まず、o3-proに自然免疫システムの主要な限界を特定してもらい、同じ質問をo3モデルにも投げかけました。
o3-proからの回答(最初のスクリーンショット)は、明らかにより賢明で、より思慮深く、免疫システムへのより深い理解を示唆していました。」
このように、oシリーズは前提の知識を与え、深く思考をすることが得意なモデルです。
今後のAIエージェントの進化において、o3-proのようなモデルがどのように活用されていくのか、非常に楽しみですね。
(ChatGPT o3 pro)の料金
o3-proは、現在、ChatGPTのProプランおよびTeamプランのユーザーが利用可能です。これらのプランに加入しているユーザーは、モデルピッカーからo1-proの代わりにo3-proを選択できます。
EnterpriseプランおよびEduプランのユーザーは、翌週からの提供開始が予定されています。
プラン名 | 月額料金(参考) | o3-proの利用 | 主な対象ユーザー |
---|---|---|---|
ChatGPT Plus (Pro) | $20/月 | 利用可能 | 個人ユーザー、AI利用頻度の高いユーザー |
ChatGPT Team | $25/ユーザー/月 | 利用可能 | 小規模〜中規模チーム、共同作業を行うグループ |
ChatGPT Enterprise | 個別見積もり | 近日提供予定 | 大企業、高度なセキュリティと管理機能が必要な組織 |
ChatGPT Edu | 個別見積もり | 近日提供予定 | 教育機関 |
【関連記事】
▶︎ChatGPT料金プラン徹底比較!無料・有料版の違いと選び方【2025年最新】
o3-proのAPI料金
o3-proのAPI料金は以下の通りです。o3-proの発表に伴い、既存のo3モデルのAPI料金が改定(80%値下げ)されました。
o3-pro API 料金 (/1M tokens)
Input | Output | |
---|---|---|
o3-pro | $20.00 | $80.00 |
o3 API 料金の変更 (/1M tokens)
Input | Output | |
---|---|---|
旧料金 (o3) | $10.00 | $40.00 |
新料金 (o3) | $2.00 | $8.00 |
o3-proはo3と同じ基本モデルを使用しているとされていますが、API料金体系は上記のように異なる設定となっています。
特にo3は大幅に値下げされており、コストを重視する場合には魅力的な選択肢となります。一方で、最高の信頼性と性能を求める場合はo3-proが推奨されます。利用シーンや要件に応じてモデルを選択すると良いでしょう。
o3-proの制限事項 (2025年6月10日現在)
o3-proには、現在いくつかの制限事項があります。
- 一時的なチャットの無効化: 技術的な問題を解決するため、o3-proの一時的なチャット機能(Temporary Chat)は現在無効化されています。
- 画像生成の非サポート: o3-proでは画像生成機能はサポートされていません。画像を生成したい場合は、GPT-4o、OpenAI o3、またはOpenAI o4-miniといった他のモデルを使用する必要があります。
- Canvasの非サポート: 現時点では、Canvas機能もo3-proではサポートされていません。
これらの制限事項は、将来的に変更される可能性があります。
まとめ
本記事では、OpenAIが新たにリリースしたo3-proについて、その概要、特徴、o3やo1-proとの比較、推奨される使い方、料金、そして現在の制限事項を解説しました。
o3-proは、特に高い信頼性と深い思考が求められるタスクにおいて、その真価を発揮するモデルです。応答に時間を要する側面はあるものの、グラフで示された通り、数学、科学、コーディングといった専門分野や、質の高いアウトプットが不可欠なビジネスシーンでの活用が期待されます。
AI技術は日々進化しており、o3-proも今後のアップデートによりさらに強力なツールとなることでしょう。ぜひ最新情報をチェックし、その可能性を最大限に引き出してください。