AI総合研究所

SHARE

X(twiiter)にポストFacebookに投稿はてなブックマークに登録URLをコピー

Geminiのモデル選択(Flash-Lite・Flash・Pro)と思考レベルの違い|旧「高速・思考・Pro」の使い分けを解説

この記事のポイント

  • 日常の調べ物・要約はFlash(標準思考)で十分。最速・最安のFlash-Liteと併用すれば、上限消費を抑えながら大半のタスクをこなせる
  • 「もう少し深く考えさせたい」だけならProに上げる前にFlashの思考レベルを拡張へ。Proは複雑なコード・数学・マルチモーダル解析に温存するのがコスト最適
  • 思考レベルの拡張とProモデルは別物。拡張は同じモデルを長く推論させる設定、ProはGemini 3.1 Proという上位モデルそのものという違いを押さえる
  • モデル選択のUIは無料・有料で共通で、違うのは利用上限。Google AIプラン利用時は、上限に達してもFlash-Liteで会話を続けられる
  • 業務頻度が高いチームはGoogle AI Pro以上が第一候補。利用上限は計算量(compute)ベースで、Proや拡張思考を多用するほど枠を早く消費する
坂本 将磨

監修者プロフィール

坂本 将磨

XでフォローフォローするMicrosoftMVP

Microsoft MVP・AIパートナー。LinkX Japan株式会社 代表取締役。東京工業大学大学院にて自然言語処理・金融工学を研究。NHK放送技術研究所でAI・ブロックチェーンの研究開発に従事し、国際学会・ジャーナルでの発表多数。経営情報学会 優秀賞受賞。シンガポールでWeb3企業を創業後、現在は企業向けAI導入・DX推進を支援。

Geminiアプリのモード選択は、かつての「高速モード・思考モード・Proモード」という3つの呼び方から、現在は「モデル(Flash-Lite / Flash / Pro)を選び、必要に応じて思考レベル(標準 / 拡張)を切り替える」形に変わっています。
それぞれの裏で動くモデルも、Gemini 3.5 Flash や Gemini 3.1 Pro など新しい世代に更新され、一見すると「どれを選べばよいか」が分かりにくくなっています。

本記事では、旧モードと現行UIの対応関係、3つのモデルの違いと得意分野、思考を強めるかProに上げるかの判断軸、利用上限と料金プランの関係、そしてユースケース別の使い分けまでを、2026年5月時点の最新情報で体系的に整理します。

目次

Geminiの「高速・思考・Pro」は今こうなっている|モデル+思考レベルの2軸

かつての「高速・思考・Pro」は現行UIのどこに対応するか

3つのモデルと内部バージョン(Flash-Lite=3.1/Flash=3.5/Pro=3.1)

2026年5月時点の最新状況|Flashの中身が3.5世代に

Flash-Lite・Flash・Proの特徴と得意分野

Flash-Lite|最速・最安で日常タスクをさばく

Flash|速度と推論のバランスが取れた標準モデル

Pro|複雑なコード・数学・マルチモーダル解析の切り札

思考レベル(標準・拡張)でモデルの考える深さを調整する

「思考を強める」か「Proに上げる」か|旧「思考モード vs Proモード」の今の答え

一番賢いのはどれか|「賢い=常にPro」ではない

拡張思考とProは何が違うのか

Deep ThinkやUltraとの関係|Proを選んでも常に最深ではない

各モデルの利用上限と料金プラン(無料/Plus/Pro/Ultra)の関係

個人向けプランの全体像(無料/Google AI Plus/Pro/Ultra)

モデル別の利用上限|「計算量ベース」への移行

上限に達したときの挙動

画像生成モデル(Nano Banana 2/Pro)とモデル選択の関係

【実践】段階的エスカレーションとチーム運用での使い分け

軽い順に試す「段階的エスカレーション」を基本にする

チームでGeminiを使うときの運用パターン

ケース別のおすすめ|立場ごとの第一候補

よくある誤解とQ&A|モデル選びで迷いやすいポイント

Q1. 一番賢いのはどのモデル?

Q2. とりあえず拡張思考にしておけばいい?

Q3. 無料ユーザーでもProは使える?

Q4. 上限にすぐ当たってしまうのはどんな使い方?

モデルの使い分けから、業務全体のAI設計へ

まとめ|あなたはどのモデルをデフォルトにすべきか

Geminiの「高速・思考・Pro」は今こうなっている|モデル+思考レベルの2軸

Geminiアプリのモード選択は、かつての「高速・思考・Pro」という3モードから、モデル(Flash-Lite / Flash / Pro)を選び、必要に応じて思考レベル(標準 / 拡張)を切り替えるという2軸の形に変わりました。

Geminiのモードは今こうなっている

「高速モードはどこへ行った?」と戸惑う人が多いのは、この切り替えが背景にあります。

本セクションでは、まず旧モードと現行UIの対応関係を押さえ、そのうえで各モデルの内部バージョンと、2026年5月時点の最新状況を整理します。

かつての「高速・思考・Pro」は現行UIのどこに対応するか

旧来の3モードは、おおよそ次のように「モデル+思考レベル」へ置き換わったと考えると分かりやすくなります。

旧3モードと現行UIの対応

かつての呼び方 現在の選び方 内部モデル
高速モード Flash(思考レベル=標準)/より軽い処理は Flash-Lite Gemini 3.5 Flash/Gemini 3.1 Flash-Lite
思考モード Flash(思考レベル=拡張) Gemini 3.5 Flash
Proモード Pro Gemini 3.1 Pro


ポイントは、旧来の3モードが、現在は「モデル選択」と「思考レベル」の2軸に再整理されたことです。かつての「思考モード」に当たる「深く考えさせる」操作は、独立したモードではなく、思考レベルを「拡張」にする設定に置き換わりました。

この思考レベル(標準 / 拡張)は、モデルとは別軸の設定で、Flashだけでなく対応モデル(Gemini 3.1 Proなど)でも切り替えられます。

そのため上の表はあくまで大まかな対応の目安で、実際は「どのモデルを使うか(Flash-Lite / Flash / Pro)」と「どれだけ考えさせるか(標準 / 拡張)」を別々に指定する形になっています。

3つのモデルと内部バージョン(Flash-Lite=3.1/Flash=3.5/Pro=3.1)

現在Geminiアプリで選べるモデルは、軽い順に次の3つです。ここでは名前と内部バージョンだけ押さえ、それぞれの得意分野は次のセクションで詳しく見ていきます。

3つのモデルと内部バージョン

  • Flash-Lite(Gemini 3.1 Flash-Lite)
    最も軽量・低コストなモデル。要約やブレインストーミングなど、即応性が重要な日常タスク向け。

  • Flash(Gemini 3.5 Flash)
    速度と推論力のバランス型で、現在の標準(デフォルト)モデル。簡単な質問から複雑な問題まで幅広く対応する。

  • Pro(Gemini 3.1 Pro
    最も高性能なモデル。複雑な数学・コーディングや、テキスト・画像・動画をまたいだ高度な分析に向く。


UIのラベルは「Flash-Lite / Flash / Pro」というモデル名で表示され、旧来の「高速 / 思考 / Pro」という呼び方は表に出てこなくなりました。

2026年5月時点の最新状況|Flashの中身が3.5世代に

モデルの「名前」は変わっていなくても、その裏で動く「中身」は2026年に入って大きく更新されています。直近で押さえておきたいのは次の3点です。

2026年5月時点の最新状況

  • Flashの新デフォルトが Gemini 3.5 Flash
    2026年5月19日のGoogle I/Oで発表され、Geminiアプリと検索のAIモードで全世界の新しいデフォルトモデルになりました。Gemini 3.1 Proをコーディングやエージェント系のベンチマークで上回るとされています。

  • Proモードの中身は現在 Gemini 3.1 Pro
    最上位の Gemini 3.5 Pro は社内テスト段階で、一般提供は2026年6月が見込まれています。それまではPro=Gemini 3.1 Proという理解で問題ありません。

  • 思考レベル(標準 / 拡張)の追加
    従来の「思考モード」に代わる形で、モデルとは別に思考の深さを選ぶ設定が順次展開されています


名前は同じ「Flash」でも中身が3.5世代に上がっている、という前提を押さえておくと、このあとの「回数制限」「料金プランとの関係」「思考とProの使い分け」の話が整理しやすくなります。

AI Agent Hub1


Flash-Lite・Flash・Proの特徴と得意分野

ここからは、3つのモデルと思考レベルを「どんなタスクに向くか」という観点で具体的に見ていきます。

日常利用のデフォルトに向くモデルと、「ここぞ」という場面で使いたいモデルを切り分けるのが狙いです。

Flash-Lite Flash Proの特徴と得意分野

Flash-Lite|最速・最安で日常タスクをさばく

Flash-Liteは、Geminiの中で最も軽量・低コストなモデルです。2026年3月3日に登場したGemini 3.1 Flash-Liteが基盤で、Gemini 2.5 Flash比で初回応答までの速度(Time to First Answer Token)が約2.5倍に高速化されています。

Flash-Liteは最速最安で日常タスクをさばく

次のような「即答してほしい軽めのタスク」に向いています。

  • 短い文章の要約やリライト
  • 簡単な調べ物・用語の確認
  • アイデア出しやブレインストーミング
  • 定型的なメールやメモのたたき台


込み入った推論よりもスピードと回数を優先したい場面では、Flash-Liteを選ぶと上限を消費しにくく、テンポよく使えます。

Flash|速度と推論のバランスが取れた標準モデル

Flashは、現在のデフォルトモデルであり、Gemini Flash系の最新版である Gemini 3.5 Flash が動いています。速度を保ちながら、Flash-Liteより一段深い推論ができるのが特徴です。

Flashは速度と推論のバランス標準モデル

公式ヘルプでも「簡単なものから複雑なものまで、幅広い問題を解くためのバランス型モデル」と位置づけられており、迷ったらまずFlashを基準にするのが現実的です。
 
具体的には、次のようなタスクで力を発揮します。

  • WebページやPDFの要約と論点整理
  • 中程度の難しさの文章作成(提案文・説明文)
  • 条件がいくつかある質問への回答
  • 簡単なコードの作成・修正


「日常のほとんどはFlashで足りる」と考えておき、物足りないときだけ思考レベルやProに切り替える運用が、最も無駄が少なくなります。

Pro|複雑なコード・数学・マルチモーダル解析の切り札

Proは、最上位クラスのモデルです。現在は Gemini 3.1 Pro が動いており、高度な推論力と、テキスト・画像・動画・コードをまとめて扱うマルチモーダル性能を備えています。

Proは複雑なコード数学マルチモーダルの切り札

特に、次のような用途で真価を発揮します。

  • 大規模なコードベースの理解・リファクタリング・テスト生成
  • 長文資料・PDF・スライド・画像・動画をまとめた総合的な分析
  • 数学・統計・アルゴリズム問題の解法と検証
  • 画像・動画生成と組み合わせた高度なクリエイティブ制作


Proは「ここは外したくない」「人がレビューする前提でも、まずはしっかり考えた案がほしい」という場面で使う切り札です。後述する上限とのバランスを取るためにも、常用ではなく要所での利用が向いています。

思考レベル(標準・拡張)でモデルの考える深さを調整する

対応するモデルでは、モデルとは別に「思考レベル」を切り替えられます。これは、モデルがどれだけ時間をかけて推論するかを調整する設定です。

思考レベルで考える深さを調整する

公式ヘルプの説明を整理すると、2つのレベルの違いは次のとおりです。

  • 標準(Standard)
    既定の設定で、多くの質問に最適。応答が速く返ってくる。

  • 拡張(Extended)
    複雑な問題向けで、回答する前にモデルがより長く推論する。


注意したいのは、高度なモデルや高い思考レベルほど、利用上限(使用量)を多く消費するという点です。拡張思考は便利ですが、すべての質問で使うと上限に早く到達します。標準を基本にし、難しい問いのときだけ拡張に切り替えるのが効率的です。


「思考を強める」か「Proに上げる」か|旧「思考モード vs Proモード」の今の答え

Geminiのモード選びで最も迷いやすいのが、「もっと賢く考えてほしいとき、思考を強めればいいのか、Proに上げるべきか」という判断です。

思考を強めるかProに上げるか

かつて「思考モードとProモードはどちらが賢いのか」と語られていた論点は、現行UIでは**「Flashの思考レベルを拡張にするか、モデルをProに上げるか」**という形に置き換わっています。本セクションで、その判断軸を整理します。

一番賢いのはどれか|「賢い=常にPro」ではない

純粋な推論力とマルチモーダル性能の総合力で見れば、最上位はPro(Gemini 3.1 Pro)です。これは素直にそう考えて構いません。

ただし、「一番賢いモデル=常に使うべきモデル」ではありません。タスクの種類や上限とのバランスによって、最適なモデルは変わります。

一番賢いのはどれか

  • 論理の一貫性や、長文・複数ソースをまたいだ分析が必要なときはProが有利
  • 中〜重めのロジックなら、Flash+拡張思考でも十分なケースが多い
  • 応答速度と上限を重視するなら、標準思考のFlashが実務的に最適なことも多い


そのため、「最も賢い=常にPro」ではなく、「タスクに対して適切なモデルと思考レベルを選ぶ」という視点が重要になります。

拡張思考とProは何が違うのか

ここを混同すると選択を誤ります。前提として、思考レベル(標準 / 拡張)はモデルとは別軸の設定で、Flashだけでなく対応モデル全般で切り替えられます。そのうえで迷いやすいのが、「Flashのまま拡張思考にする」のか「モデルをProに上げる」のかという選択です。

拡張思考とProは何が違うのか

  • Flashのまま拡張思考にする
    モデルはFlash(Gemini 3.5 Flash)のまま、回答前により長く推論させる。抜け漏れや解釈ミスを減らせるが、モデルの地力そのものは上がらない。

  • Proに上げる
    モデルをGemini 3.1 Proという上位モデルに切り替える。地力(推論力・マルチモーダル性能)そのものが上がる。Proでも思考レベルを拡張にすれば、さらに深く考えさせられる。


判断の目安はシンプルです。「同じFlashでも、時間をかけて丁寧に考えれば解けそうな問題」なら拡張思考で十分です。一方、「Flashの地力では精度が頭打ちになりそうな問題(大規模なコード、難しい数学、複雑な画像・動画解析)」はProの出番です。

実務的には、まずFlashの標準で試し、物足りなければ拡張思考、それでも届かなければProという順で上げていくと、上限とコストの無駄が出にくくなります。

Deep ThinkやUltraとの関係|Proを選んでも常に最深ではない

もうひとつ混同しやすいのが、Proと「Deep Think」の関係です。Proモデルを選んだからといって、すべての対話が自動的に最も深い推論モードになるわけではありません。

Deep ThinkやUltraとの関係

Deep Thinkは、Google AI Ultra限定の、さらに重い推論モードです。Proは「Gemini 3.1 Proというモデルを使う」ことを意味し、Deep Thinkが効くかどうかは契約プランや設定によって決まります。なお、Deep ThinkやGemini Sparkなど一部の高度機能は、提供地域・言語・時期に制限がある点にも注意が必要です(日本向けプランページでは米国・英語のみと案内されている機能があります)。

そのため、Deep Thinkを前提とした検証を行う場合は、プラン条件と利用可能な設定を別途確認する必要があります。プラン別の機能差は、次のセクションで整理します。


各モデルの利用上限と料金プラン(無料/Plus/Pro/Ultra)の関係

この章では、Google AIの料金プランと、各モデル・思考レベルの利用上限の関係を整理します。

各モデルの利用上限と料金プランの関係

どのプランでどこまで使えるかを把握すると、「無料で試す」「Proにする」「Ultraまで上げる」の判断軸が明確になります。

個人向けプランの全体像(無料/Google AI Plus/Pro/Ultra)

個人向けに提供されている主なプランは、次の4つです。ここでは日本向けの公式プランページに基づき、料金とストレージを中心に整理します。

個人向けプランの全体像

プラン 月額料金(税込・日本) ストレージ 主な特徴
無料プラン ¥0 15GB Geminiアプリの基本利用。Flash中心で、Proや拡張思考は限定的に利用可能
Google AI Plus ¥1,200 200GB Proや拡張思考の利用枠が拡大。標準より多くの使用量を確保できる
Google AI Pro ¥2,900 5TB Gemini 3.1 Proへの十分なアクセス、Deep Research、使用量上限の拡大
Google AI Ultra ¥14,500〜 20TB〜 Proの内容に加えDeep Thinkなど最上位機能。¥14,500(Pro比5倍)と¥32,000(Pro比20倍)の2段階


この表が示すように、無料と有料の最大の違いは「使える機能」よりも「どれだけ使えるか(上限)」にあります。月額1,200円のGoogle AI Plusが、まず有料を試したい個人にとっての入り口です。

あわせて、扱える文脈の長さ(コンテキストウィンドウ)もプランで変わります。公式ヘルプによると、無料プランは約32,000トークン、Plusは約128,000トークン、Pro・Ultraは最大100万トークンとされています。長文のPDFや大量の資料をまとめて読ませたい場合は、この差が効いてきます。

モデル別の利用上限|「計算量ベース」への移行

Geminiアプリの利用上限は、2026年5月中旬から、「1日あたり何プロンプト」という固定の回数制から、「計算量(compute-used)ベース」の方式へ移行しました

計算量ベースへの移行

公式ヘルプGoogleの発表によると、現行の上限は次の考え方で決まります。

  • プロンプトの複雑さ・使う機能・チャットの長さを加味して消費量が計算される
  • 上限は5時間ごとに回復し、週ごとの上限に達するまで利用できる
  • プランによって枠が変わる。日本向け公式プランページでは、Ultraの¥14,500プランがPro比5倍、¥32,000プランがPro比20倍の使用量上限と案内されている(公式ヘルプ側はPlus 2倍・Pro 4倍などの倍率でも説明され、表現は変動しやすい)


ここで効いてくるのが、高度なモデル(Pro)や高い思考レベル(拡張)ほど、同じ1回でも消費する計算量が大きくなるという点です。Proや拡張思考を多用するほど上限に早く到達するため、要所に絞るのが基本になります。

なお、以前は「拡張思考とProがそれぞれ独立した1日あたりのプロンプト数(AI Proで拡張思考300回・Pro 100回、Ultraで1,500回・500回など)」で語られていましたが、これは旧仕様の目安です。現在は上記の計算量ベースが正で、数値も変動しやすいため、正確な枠は利用時に公式ヘルプで確認するのが確実です。

上限に達したときの挙動

上限に近づくと、Geminiアプリは画面で通知を出します。そして上限に達した場合でも、会話が完全に止まるわけではありません。

上限に達したときの挙動

公式ヘルプによれば、Google AIサブスクリプションを利用している場合、上限に達してもFlash-Liteで会話を続けられるとされています。つまり「Proや拡張思考が使えなくなる」だけで、軽量モデルでのやり取りは続けられます。

ここで覚えておきたいのは、モデル選択や思考レベルのUI自体は、無料・有料で共通だという点です。無料ユーザーでもProや拡張思考を選べますが、利用枠が限定的で上限に達しやすい、という違いになっています。

【関連記事】
Geminiの回数制限は?新仕様(5時間/週次)とプラン別の選び方を解説

AI研修


画像生成モデル(Nano Banana 2/Pro)とモデル選択の関係

テキスト側はモデルと思考レベルの2軸になりましたが、画像生成まわりはむしろシンプルに整理されています。

画像生成モデルとモデル選択の関係

本セクションでは、どのモデルを選んでいても共通して使える画像生成の仕組みを整理します。

現在のGeminiアプリの標準画像生成モデルは、**Nano Banana 2(Gemini 3.1 Flash Image)**です。Flash-Lite・Flash・Proのどのモデルを選んでいても、画像生成では共通してNano Banana 2が使われます。

Nano Banana 2は、上位のNano Banana Proに近い品質を、Flash相当の速度で実現するモデルとして設計されています。幅広いアスペクト比に対応し、どのモデルを選んでも同等の高品質な画像を生成できます。なおGeminiアプリでのダウンロード解像度は、AIプランありで2K、AIプランなしで1Kとなっています。

さらに品質を追求したい場合は、Google AI Plus以上のプランで、生成済み画像の「Redo(再生成)」時にNano Banana Proを選べます。まずNano Banana 2で生成し、こだわりたい画像だけProで再生成するという運用が、Googleの想定する使い方です。


【実践】段階的エスカレーションとチーム運用での使い分け

ここからは、3つのモデルと思考レベルを実際の業務でどう運用するかを、段階的な使い分けとチーム利用の観点で整理します。

段階的エスカレーションとチーム運用での使い分け

個々のモデルの得意分野はすでに整理したので、ここでは「どの順で使い分けるか」「チームでどう運用するか」という運用ロジックに絞ります。

軽い順に試す「段階的エスカレーション」を基本にする

最も無駄が少ないのは、軽いモデル・浅い思考から始め、必要なときだけ上げていく運用です。具体的には次の順番を基本にします。

軽い順に試す段階的エスカレーション

  1. まずFlash(標準思考)で試す。多くのタスクはこれで足りる
  2. 解釈ミスや抜け漏れが気になるときは、Flashの思考レベルを拡張に上げる
  3. それでも精度が頭打ちなら、Proに切り替える
  4. 大量の軽作業を高速でさばきたいときは、あえてFlash-Liteに下げる


いきなりProや拡張思考から入ると、上限を早く消費するうえ、応答も遅くなります。「下から上げる」発想を持っておくと、品質と上限・コストのバランスが取りやすくなります。

チームでGeminiを使うときの運用パターン

チームで使う場合は、「基本はFlash、要所だけ拡張思考やPro」というルールを共有しておくと、上限とコストを管理しやすくなります。文章で整理すると、次のような運用イメージです。

チームでGeminiを使うときの運用パターン

  • 企画書や提案書のたたき台は、まずFlashで作る
  • リスク・見積・契約条件など重要な部分だけ、拡張思考で精査する
  • コーディングや技術検証が絡む部分はProを使い、レビューを支援してもらう
  • 上限が近いメンバーがいれば「今日はFlash中心」などをチャットで共有する


「どのタスクをどのモデルに投げるか」をチーム内で揃えておくと、利用上限を意識しながらGeminiの性能を引き出しやすくなります。

ケース別のおすすめ|立場ごとの第一候補

最後に、立場ごとの「まず選ぶべきモデルとプラン」を整理します。AI導入支援の現場で見ていても、迷ったときは次のように当てはめると大きく外しません。

ケース別のおすすめ

  • 一般ユーザー(無料)
    日常の調べ物や要約が中心なら、Flash中心の無料プランで十分。Proは「ここぞ」のときだけ使い、足りなければGoogle AI Plusを検討する。

  • コスパ重視の個人(Google AI Plus)
    資料作成や学習が中心なら、Flash+拡張思考を主軸にし、重要タスクだけProに上げる。

  • エンジニア・アナリスト
    コーディングやデータ分析が多いなら、Proの利用枠が確保できるGoogle AI Pro以上が第一候補。日常作業はFlashに振り分けて上限を温存する。

  • チーム・部門での利用
    業務頻度が高いほど上限が効いてくるため、Google AI Pro以上を基準にしつつ、段階的エスカレーションを社内ルール化する。


「毎日30分以上、要約や下書きをAIに手伝ってもらっている」段階に来ているなら、無料枠で我慢するより、自分の使い方に合ったプランへ上げたほうが結果的に時間対効果は高くなります。

メルマガ登録


よくある誤解とQ&A|モデル選びで迷いやすいポイント

最後から二番目の章では、Geminiのモデル選択でよくある誤解や疑問をQ&A形式で整理します。細かいモヤモヤをここで解消しておくと、実際の運用で迷いにくくなります。

よくある誤解とQA

Q1. 一番賢いのはどのモデル?

総合的な推論力とマルチモーダル性能で見れば、Pro(Gemini 3.1 Pro)が最上位です。ただし「一番賢い=常に使うべき」ではありません。

中程度のタスクはFlash+拡張思考で十分なことが多く、速度と上限を重視するなら標準思考のFlashが実務的に最適な場面も多くあります。タスクに合わせて選ぶのが基本です。

Q2. とりあえず拡張思考にしておけばいい?

いいえ、常に拡張思考にするのはおすすめしません。拡張思考は標準より上限(使用量)を多く消費するため、軽い質問にまで使うと早く上限に達します。

標準を基本にし、「条件が多い」「長文を正確に読み解きたい」「途中の考え方も確認したい」といった場面でだけ拡張に切り替えるのが効率的です。

Q3. 無料ユーザーでもProは使える?

使えます。モデル選択のUIは無料・有料で共通で、無料ユーザーでもProや拡張思考を選べます。

ただし利用枠が限定的で、上限に達しやすい点には注意が必要です。Proを「常用」するのではなく「ここぞの場面で使う」位置づけにしておくと、無料プランでも有効に活用できます。頻度が足りないと感じたら、Google AI PlusやProへのアップグレードを検討する流れになります。

Q4. 上限にすぐ当たってしまうのはどんな使い方?

次のような使い方は上限に達しやすくなります。

  • Proで長文のやり取りを1日に何十件も行う
  • すべての質問を拡張思考のまま試行錯誤する
  • 画像・動画・ファイルを多用し、大きなコンテキストを連続で投げる


こうした場合は、「まずFlash(標準)で粗い案を作り、重要な部分だけ拡張思考やProに絞って投げ直す」「検証用と本番用でチャットを分ける」といった工夫が有効です。それでも足りなければ、上位プランへの切り替えを検討します。


モデルの使い分けから、業務全体のAI設計へ

Geminiのモデルと思考レベルを使い分けることで、「すべてに最上位を使うのではなく、タスクに応じてAIを選び分ける」という適材適所の感覚が身についたはずです。

この考え方は、個人利用にとどまりません。組織でAIを業務に組み込むときも、「どの業務にどのレベルのAIを充て、どう運用してコストと品質のバランスを取るか」という全体設計がそのまま問われます。ここを設計せずに高機能なAIを入れただけでは、現場で使われずに終わったり、コストばかりが膨らんだりしがちです。AI総合研究所では、こうした段階設計を実践的に整理した「AI業務自動化ガイド」(220ページ)を無料で公開しています。

Copilot ChatからM365 Copilot、Copilot Studioへと段階的に進める設計や、経費精算・請求書処理・人事などの部門別ユースケースをBefore/After付きで確認できます。

AI総合研究所の専任チームが、PoCから全社展開までの設計を伴走支援します。まずは無料の資料で、自社の業務にどうAIを組み込めるかをご確認ください。

モデルの使い分けから業務全体のAI設計へ

AI業務自動化ガイド

適材適所の考え方を組織のAI導入に広げる

Geminiのモデルを使い分ける「適材適所」の感覚は、組織でAIを業務に組み込む段階設計にもそのまま活きます。AI業務自動化ガイド(220ページ)では、どの業務にどのレベルのAIを充て、どう運用するかを実践的に整理しています。


まとめ|あなたはどのモデルをデフォルトにすべきか

本記事では、Geminiの「高速・思考・Pro」が現行UIでどう変わったか、各モデルの違いと得意分野、思考とProの使い分け、利用上限と料金、ユースケース別の運用までを2026年5月時点の最新情報で整理しました。要点を改めてまとめます。

  • Geminiのモード選択は「モデル(Flash-Lite / Flash / Pro)+思考レベル(標準 / 拡張)」の2軸に再整理され、旧「思考モード」に近い操作は対応モデルで思考レベルを拡張にする設定へ置き換わった

  • Flashの新デフォルトはGemini 3.5 Flash、ProはGemini 3.1 Pro(3.5 Proは6月見込み)。名前は同じでも中身は新世代に更新されている

  • 拡張思考とProは別物。同じモデルを長く考えさせるのが拡張思考、上位モデルに替えるのがPro。まずFlash標準→拡張思考→Proの順で上げるのが無駄が少ない

  • UIは無料・有料で共通で、違いは上限だけ。上限は計算量ベース(5時間ごと回復・週次上限)で、Google AIプラン利用時は上限到達後もFlash-Liteで会話を続けられる。業務頻度が高いチームはGoogle AI Pro以上が第一候補


結論として、ほとんどの人にとってのデフォルトはFlash(標準思考)です。そのうえで「もう少し考えさせたいときは拡張思考」「地力が必要なときだけPro」「大量の軽作業はFlash-Lite」と切り替えれば、上限とコストを抑えながらGeminiの性能を引き出せます。

自分の主なタスクがどの位置にあるかを一度棚卸しし、デフォルトのモデルと普段使うプランを決めておくことが、Geminiを使いこなす近道になります。

監修者
坂本 将磨

坂本 将磨

Microsoft MVP・AIパートナー。LinkX Japan株式会社 代表取締役。東京工業大学大学院にて自然言語処理・金融工学を研究。NHK放送技術研究所でAI・ブロックチェーンの研究開発に従事し、国際学会・ジャーナルでの発表多数。経営情報学会 優秀賞受賞。シンガポールでWeb3企業を創業後、現在は企業向けAI導入・DX推進を支援。

関連記事

AI導入の最初の窓口

お悩み・課題に合わせて活用方法をご案内いたします
お気軽にお問合せください

AI総合研究所 Bottom banner

ご相談
お問い合わせは
こちら!