この記事のポイント
- OpenAI o1(o1-preview)は、複雑な推論を実行するために強化学習で訓練された新しいAIモデル
- o1-miniは、基本的能力を維持しつつ処理速度と効率性を向上させた軽量・高速モデル
- GPT-4oとの違いは、o1はSTEM分野で優れた性能を示すが、一般的な言語タスクではGPT-4oの方が優位
- 新しい安全性学習手法により、安全性と整合性が向上
- 無料開放は無く、ChatGPT PlusまたはChatGPT Teamへの加入が必要
監修者プロフィール
坂本 将磨
Microsoft AIパートナー、LinkX Japan代表。東京工業大学大学院で技術経営修士取得、研究領域:自然言語処理、金融工学。NHK放送技術研究所でAI、ブロックチェーン研究に従事。学会発表、国際ジャーナル投稿、経営情報学会全国研究発表大会にて優秀賞受賞。シンガポールでのIT、Web3事業の創業と経営を経て、LinkX Japan株式会社を創業。
AIと先進技術への関心が高まる中、OpenAIが開発した新しいAIモデルシリーズ、「OpenAI o1(オーワン)」が注目を集めています。
本記事では、その特徴から使い方、料金体系やGPT-4oとの違いに至るまで、「OpenAI o1」に関する情報を徹底解説いたします。
複雑な推論を高速に実行できる「o1-mini」をはじめ、深い思考力や高度な推論能力により学問の分野でもその力を発揮する「OpenAI o1」の可能性に迫ります。
科学、数学、プログラミングといったSTEM分野において特にその力を発揮する本モデルは、AIを活用した未来を創造する新たな1ページとなるかもしれません。
✅2024年9月17日追記
o1-preview・o1-mini共に回数制限が緩和されました。
▶︎詳しくはこちら
目次
OpenAI o1(o1-preview)とは
OpenAI o1は、OpenAIが開発した新しいAIモデルシリーズです。
複雑な推論を実行するために強化学習で訓練された大規模言語モデルで、応答する前に考え、ユーザーに応答する前に長い内部思考の連鎖を生成することができます。
We're releasing a preview of OpenAI o1—a new series of AI models designed to spend more time thinking before they respond.
— OpenAI (@OpenAI) September 12, 2024
These models can reason through complex tasks and solve harder problems than previous models in science, coding, and math. https://t.co/peKzzKX1bu
【軽量・高速モデル】o1-miniとは
o1-miniは、o1シリーズの基本的な能力(深い思考力、高度な推論能力)を継承しつつ、処理速度と効率性を向上させたモデルです。
【主な特徴】
- STEM分野(科学、数学、プログラミングの性能)においてはo1と同等以上のスコアを獲得
- 回答速度はo1-previewの約3倍
- API利用料金はo1-previewの5分の1
特筆すべきは、o1-miniの優れたコーディング能力です。コーディングタスクにおいて、o1-miniはo1-previewを大きく上回る性能を示しています。
Codeforcesコンペティションでのスコアや、HumanEvalベンチマークの結果が、この優位性を明確に表しています。
コーディングにおいてはo1-previewを上回る
ただし、o1-miniはSTEM推論能力に特化しているため、日付、伝記、雑学クイズなどの「非STEMトピックに関する事実知識」は、GPT-4o miniなどの小規模LLMと同程度とされています。
今後のバージョンでは、非STEM分野での性能改善や、STEM以外の他のモダリティや専門分野への拡張が期待されています。
OpenAI o1(o1-preview)の特徴
OpenAI o1は、深い思考力、高度な推論能力、そして向上した安全性を特徴とする次世代AIモデルです。
従来のモデルを大きく超える性能で、科学、数学、プログラミングなどのタスクに優れた能力を発揮します。
より深い思考力
o1シリーズは、応答する前により多くの時間をかけて思考するように設計されています。
問題を解決する際に人間のように時間をかけて考え、思考プロセスを洗練し、異なる戦略を試し、自分のミスを認識することを学習します。
以下は、GPT-4o、o1-mini、o1-previewの回答を単語推論問題(文脈や情報から欠けている単語を推測する問題)で比較した結果です。
GPT-4oとo1とo1-miniのモデル速度の比較 (参考:OpenAI
GPT-4oは正しく答えられませんでしたが、o1-miniとo1-previewはどちらも正しく答えることができました。
更に驚くべき事に、「o1-mini」は「o1」の約3倍速く正解にたどり着いています。
高度な推論能力
o1シリーズは、GPT-4oよりも複雑なタスクを推論し、科学、コーディング、数学の分野でより難しい問題を解決可能です。
- 物理学、化学、生物学の難しいベンチマークタスク(GPQA)で博士課程の学生と同等の成績を達成
- 国際数学オリンピック(IMO)の予選試験で83%の正答率を記録(GPT-4oは13%)
- コーディング能力はCodeforces(競技プロラミング)で参加者の上位11%に入る水準
競技数学、競技プログラミング、科学問題におけるGPT-4o、o1-preview、o1の性能比較。o1シリーズがすべての分野でGPT-4oを大幅に上回る (参考:OpenAI
安全性の向上
o1シリーズでは、モデルの高度な推論能力を活用して安全性を向上させる新しいアプローチが採用されています。
- 安全性と整合性ガイドラインに従わせるための新しい安全性学習手法が導入
- モデルの推論能力を利用して、状況に応じて安全ポリシーについて推論
これにより、違法なアドバイスの生成、ステレオタイプな対応の選択などのリスクに対して、特定のベンチマークで最先端のパフォーマンスが得られています。
ChatGPT-4oとo1-previewの違い
o1シリーズがSTEMタスクで高度な推論力を発揮する一方、人間の評価では言語処理を重視する分野においてはGPT-4oの方が優れているという結果が出ています。
GPT-4oとo1シリーズの分野別の勝率 (参考:OpenAI)
上記からわかるように、o1シリーズが数学・科学技術分野に特化している反面、一般的な言語タスクや幅広い知識を要する課題では、従来のモデルに及ばない可能性があることを示唆しています。
このような特性は、o1シリーズの用途や適用範囲を考える上で重要な点となります。
処理アプローチの違い
o1-previewとChatGPT4oは、問題解決の方法が異なります。
特徴 | o1-preview | ChatGPT4o |
---|---|---|
思考スタイル | じっくり考え抜く | 素早く幅広く対応 |
得意分野 | 複雑な理系問題 | 多様な話題の会話 |
処理時間 | 長め | 短め |
知識の使い方 | 深く掘り下げる | 広く活用する |
回答の特徴 | 段階的で論理的 | 柔軟で文脈に応じた |
o1-previewは、複雑な問題に対してじっくり時間をかけて考えます。数学や科学の難しい問題を解くときのように、段階を踏んで深く考え抜いてから答えを出します。
一方、ChatGPT4oは幅広い知識を使って素早く対応します。雑談をするように、様々な話題にすぐに反応できます。文章の意図をよく理解し、自然な会話ができるのが特徴です。
o1モデルの推論プロセス
o1モデルは「推論トークン」という特別な仕組みを使って「考える」ことができます。
- 質問を理解し、複数の角度から思考
- この思考過程を「推論トークン」として記録
- 最終的な回答を出力
- 回答後、「推論トークン」は消去
参考:OpenAI
この図は、会話が進む中でのo1モデルの動きを示しています。
- 各ターンで新しい入力を受け取り・処理
- 過去の会話内容(入力と出力)は記憶されますが、内部の思考過程(推論トークン)は消去
- 会話の履歴は一定量(128,000トークン)まで保持
この方法により、o1モデルは複雑な問題に対してより深く考え、高品質な回答を生み出すことができます。
活用分野の違い
ここまでで紹介したように、ChatGPT4oとo1-previewは、それぞれ異なる強みを持ちます。
以下の表は、両モデルの実用面での特徴と処理方法の違いをまとめたものです。
分野 | o1-preview | ChatGPT4o |
---|---|---|
研究開発 | • 複雑な科学的モデリング • 高度な数学的分析 • 新薬開発のシミュレーション |
• 学際的な研究 • 文献レビュー • 研究提案書の作成 |
ビジネス応用 | • 財務モデリング • 市場予測アルゴリズム • 供給チェーン最適化 |
• 顧客サービス • マーケティングコピーの作成 • 多言語コミュニケーション |
教育分野 | • STEM教育 • 高度な問題解決 • 複雑な概念理解のチュータリング |
• 幅広い科目での一般的な質問応答 • エッセイ添削 • 言語学習支援 |
上記から、o1-previewは科学技術分野での複雑な問題解決に強く、ChatGPT4oは幅広い知識を活用した言語処理に優れていることがわかります。
用途に応じて適切なモデルを選ぶことが大切です。
OpenAI o1(o1-preview)の料金
OpenAI o1を利用するには、ChatGPTの有料プランであるChatGPT Plus(月額30ドル)、もしくはChatGPT Teamへの加入が必要となります。
9/13日現在、o1-preview・o1-mini共に無料版の提供はありません。
OpenAI o1のAPI料金
OpenAI o1のAPI料金は以下の通りです。
モデル | 入力トークン料金 | 出力トークン料金 |
---|---|---|
o1-preview | 100万トークンあたり15.00ドル | 100万トークンあたり60.00ドル |
o1-mini | 100万トークンあたり3.00ドル | 100万トークンあたり12.00ドル |
o1-miniモデルは、o1-previewモデルと比較して、入出力ともに5分の1のコストであることがわかります。
OpenAI o1とGPT-4oのAPI料金比較
OpenAI o1とGPT-4oシリーズの料金体系を比較します。(o1シリーズはBatch API未対応のため未掲載)
モデル | 入力トークン料金 | 出力トークン料金 |
---|---|---|
o1-preview | $15.00 / 1M | $60.00 / 1M |
o1-mini | $3.00 / 1M | $12.00 / 1M |
gpt-4o | $5.00 / 1M | $15.00 / 1M |
gpt-4o-2024-08-06 | $2.50 / 1M | $10.00 / 1M |
gpt-4o-mini | $0.150 / 1M | $0.600 / 1M |
OpenAI o1(o1-preview)の使い方
ChatGPTのトップ画面左上の、モデル切り替えボタンから切り替え可能です。
OpenAI o1(o1-preview)利用時の注意点
o1(o1-preview)は、従来のGPTシリーズとは異なる特徴を持っています。
高度な推論能力を備えたこのモデルを効果的に活用するには、プロンプトの書き方や利用回数の制限に注意が必要です。
以下、具体的な利用のポイントと制限について説明します。
プロンプトの書き方
o1モデルは従来のGPTシリーズと異なり、「人間が自然に質問するような形で使うのが最適で、複雑な指示や余計な情報は逆効果になる可能性がある」とOpenAIが見解を示しています。
OpenAIによるプロンプトアドバイス (参考:OpenAI
1.シンプルさを重視
複雑な指示よりも、簡単で明確な指示の方がうまく機能します。
【✅効果的なプロンプト例】
地球温暖化の主な原因は何ですか?
【❌避けるべきプロンプト例】
地球温暖化の原因について、まず科学的な背景を説明し、次に主な要因を5つ挙げ、それぞれについて詳細に解説し、最後に解決策を3つ提案してください。
各段階で考えるプロセスも示してください。
2.自然に考えさせる
「段階的に考えて」などの指示は不要です。モデルは自動的に深く考えるようプログラムされています。
【✅効果的なプロンプト例】
次の数式を解いてください:2x + 5 = 15
【❌避けるべきプロンプト例】
2x + 5 = 15 を解くために、一歩ずつ考えてプロセスを説明しながら解いてください。
3.情報を整理する
引用符やタグを使って、入力情報を明確に区分けすると良いでしょう。
【✅効果的なプロンプト例】
以下の文章を要約してください:
"""
人工知能(AI)は、人間の知能を模倣し、学習、問題解決、パターン認識などのタスクを実行するコンピューターシステムです。機械学習やディープラーニングなどの技術を用いて、AIは日々進化を続けています。
"""
4.関連情報に絞る
追加情報を与える場合は、本当に必要な情報だけに絞りましょう。
【❌避けるべきプロンプト例】
AIについて300字で要約してください。
参考として以下の3つの長い記事を添付します:[ここに長い記事1, 2, 3が続く]...
このように、モデルの高度な推論能力を信頼し、シンプルに使うことが推奨されています。
回数制限について
モデル | 変更前 | 変更後 |
---|---|---|
o1-preview | 30メッセージ/週 | 50メッセージ/週 |
o1-mini | 50メッセージ/週 | 50メッセージ/1日 |
We appreciate your excitement for OpenAI o1 and we want you to be able to use it more.
— OpenAI (@OpenAI) September 17, 2024
For Plus and Team users, we have increased rate limits for o1-mini by 7x, from 50 messages per week to 50 messages per day.
o1-preview is more expensive to serve, so we’ve increased the rate…
OpenAI o1(o1-preview)の活用事例
OpenAI o1の高度な推論能力と深い思考力は、様々な分野で革新的な応用を可能にします。
以下の事例は、o1シリーズが従来のAIモデルを超える能力を持ち、複雑な問題解決や創造的なタスクにおいて優れた性能を発揮することを示しています。
複雑なパズルを解読
OpenAI o1 solves a complex logic puzzle. pic.twitter.com/rpJbh8FkAg
— OpenAI (@OpenAI) September 12, 2024
プロンプトからビデオゲームのコードを作成
OpenAI o1 codes a video game from a prompt. pic.twitter.com/aBEcehP0j8
— OpenAI (@OpenAI) September 12, 2024
GPT-4oでは不可能な複雑な言語翻訳
OpenAI o1 answers a famously tricky question for large language models. pic.twitter.com/5ZlQIOBWEd
— OpenAI (@OpenAI) September 12, 2024
まとめ
本記事では、OpenAIが開発した新しいAIモデルシリーズ「OpenAI o1」について解説しました。
o1シリーズの特徴である深い思考力、高度な推論能力、そして向上した安全性について詳しく説明し、従来のモデルとの性能比較を行いました。
また、o1-previewとo1-miniの2つのモデルの特徴や料金体系、GPT-4oとの違いについても触れました。さらに、o1シリーズの具体的な活用事例を紹介し、その潜在的な可能性を示しました。
現在はプレビュー段階で機能制限がありますが、今後の発展により、AIの応用範囲がさらに広がることが期待されます。