この記事のポイント
推論精度を維持しつつ大量のエージェントタスクを高速に回したいなら、Gemini 3.5 Flashを第一候補にすべき。Gemini 3.1 Proを上回るコーディング・エージェントベンチマークを持ちながら4倍速で動作する
個人ユーザーがGeminiアプリのデフォルトモデルとして無料で利用できる一方、企業はGemini Enterprise Agent PlatformやAntigravityから業務エージェントに組み込めるため、入口は段階的に選べる
API利用なら入力$1.50・出力$9.00/100万トークン(global)が基本料金。コンテキストキャッシュを使えば入力$0.15まで下がるため、長文ドキュメントの繰り返し処理ほどコスト圧縮効果が大きい
最高精度が必要な研究・複雑分析にはGemini 3.5 Proの来月リリースを待つのが堅実。それまではGemini 3.1 Pro Deep ThinkとFlashの組み合わせで補完するのが現実解
「24時間動くパーソナルエージェント」を志向するGemini Sparkは米国Google AI Ultraサブスクライバー向けベータが翌週開始、Daily Briefは米国のGoogle AI Plus/Pro/Ultra向けに展開済み。日本での提供時期は未発表で、過去機能と同様に段階展開となる可能性がある

Microsoft MVP・AIパートナー。LinkX Japan株式会社 代表取締役。東京工業大学大学院にて自然言語処理・金融工学を研究。NHK放送技術研究所でAI・ブロックチェーンの研究開発に従事し、国際学会・ジャーナルでの発表多数。経営情報学会 優秀賞受賞。シンガポールでWeb3企業を創業後、現在は企業向けAI導入・DX推進を支援。
Gemini 3.5は、Googleが2026年5月19日のGoogle I/O 2026で発表した最新世代のAIモデルファミリーです。まずFlashが一般提供(GA)開始となり、フロンティア級の知能を維持したまま「他の最先端モデルより4倍高速」というスループットを実現しています。
同時にパーソナルAIエージェント「Gemini Spark」、マルチモーダル動画生成モデル「Gemini Omni」、そして来月公開予定の「Gemini 3.5 Pro」など、エージェント時代を見据えた発表が一気に揃いました。
本記事では、2026年5月時点の公式情報をもとに、Gemini 3.5ファミリーの全体像・性能・料金・使い方を整理し、Gemini 3.1 Pro / Gemini 3 Flashなど前世代との違いまで解説します。
目次
Gemini Spark / Daily Briefなど新エージェント機能
Gemini Sparkは「24時間動くパーソナルエージェント」
Gemini 3.5 ProとGemini Omniの新発表
開発者向け:Gemini APIとGoogle AI Studio
エージェント開発向け:Google Antigravity 2.0
企業向け:Gemini Enterprise Agent Platform
vs Gemini 3.1 Pro / Gemini 3 Flash
Gemini 3.5とは?
Gemini 3.5は、Googleが2026年5月19日のGoogle I/O 2026で発表した、同社の最新世代AIモデルファミリーです。
公式ブログでは「frontier intelligence with action(行動する力を備えたフロンティア級の知能)」と表現されており、単に質問に答えるAIから、ユーザーに代わって**多段のタスクを実行する「エージェント型AI」**へとシリーズの軸を移したことが大きな特徴です。

従来のGemini 3シリーズが「推論能力」を主軸に進化してきたのに対し、Gemini 3.5は推論性能を維持したまま速度・コストを最適化し、エージェントワークフローへの組み込みやすさを前面に押し出しています。
GoogleがI/O 2026の基調講演で見せたデモも、検索や対話よりも「ユーザーの代わりにメールを整理する」「コードベース全体をリファクタリングする」といったエージェント文脈が中心でした。
Gemini 3.5ファミリーの全体像
2026年5月時点でGemini 3.5として発表・予告されているモデルと機能は、次の4つです。
-
Gemini 3.5 Flash
2026年5月19日にGA(一般提供)。推論性能でGemini 3.1 Proを上回りつつ、出力速度を4倍に引き上げた汎用フロンティアモデル。本記事の主役
-
Gemini 3.5 Pro
来月(2026年6月)リリース予定の最上位モデル。公式は「社内利用中・来月公開」までを明示しており、Pro/Flashの役割分担などアーキテクチャの詳細は正式公開後に確認する前提
-
Gemini Spark
3.5 Flashを駆動エンジンとするパーソナルAIエージェント。24時間動き続け、Gmail/Calendar/Workspaceを横断して作業を代行する。発表時点では「trusted testers向けに今週、米国Google AI Ultraサブスクライバー向けベータが翌週開始」のロールアウト初期段階
-
Gemini Omni
任意のモダリティ(画像・音声・動画・テキスト)を入力として動画生成・編集を行う、Geminiの新しいマルチモーダルワールドモデル系列。代表モデル「Gemini Omni Flash」はGoogle AI Plus/Pro/Ultraサブスクライバー向けにGeminiアプリとGoogle Flowでグローバル展開中
このうち、APIやGoogle検索のAI Modeから汎用モデルとして使えるのは「Gemini 3.5 Flash」です。動画生成のOmni FlashはGeminiアプリとFlowでグローバルに、Daily Briefは米国のAI Plus/Pro/Ultra向けに、Sparkは米国Ultraサブスクライバー向けにそれぞれ段階展開、3.5 Proは内部利用中で来月公開予定──と機能ごとに対象プランと地域が異なるため、本記事では機能別に提供範囲を整理しながら解説します。
Gemini 3シリーズ → Gemini 3.5への変化
Gemini 3シリーズは、推論ベンチマークで業界をリードしてきました。Gemini 3 Proで「Deep Think」「Generative UI」を打ち出し、Gemini 3.1 ProではARC-AGI-2で77.1%という抽象推論スコアを叩き出しました。
ただ、これらの恩恵を実際のアプリやサービスに組み込む段階では、「精度は高いが遅い」「API単価が高く大量呼び出しに向かない」という現場側の悩みが残っていました。
そのため、過去にGemini 3 Proで「精度はいいが本番投入はためらった」開発者にとって、Gemini 3.5は**「ベンチマーク主導のモデル開発」から「プロダクト主導のモデル開発」への転換点**として位置づけられます。
Gemini 3.5 Flashの性能とベンチマーク
Gemini 3.5 Flashは、Gemini 3.5ファミリーの中で最初にGA(一般提供)となったモデルです。Googleは「Flash」シリーズの名を冠しつつも、性能は実質的にフロンティア帯まで引き上げており、Gemini 3.1 Proを多くのコーディング・エージェントベンチマークで上回るとしています。
ここでは、公式に公開されている主要ベンチマークと、それを支える設計上の特徴を整理します。

主要ベンチマークでGemini 3.1 Proを上回る
公式ブログおよびモデルカードで公開されている代表的なベンチマーク結果を、前世代のGemini 3.1 Pro・Gemini 3 Flashと並べたものが以下の表です。

| ベンチマーク | 評価対象 | Gemini 3.5 Flash | Gemini 3.1 Pro | Gemini 3 Flash |
|---|---|---|---|---|
| Terminal-Bench 2.1 | エージェント型コーディング | 76.2% | 70.3% | 58.0% |
| MCP Atlas | マルチステップ・ツール利用 | 83.6% | 78.2% | 62.0% |
| Finance Agent v2 | 金融分析エージェント | 57.9% | 43.0% | 42.6% |
| CharXiv Reasoning | チャート読解・マルチモーダル推論 | 84.2% | 83.3% | 80.3% |
| SWE-Bench Pro | 実コードバグ修正 | 55.1% | 54.2% | 49.6% |
| ARC-AGI-2 | 抽象推論 | 72.1% | 77.1% | 33.6% |
| GDPval-AA | エキスパートタスク全般(Elo) | 1,656 | 1,314 | 1,204 |
| Humanity's Last Exam | 高度学術推論 | 40.2% | 44.4% | 33.7% |
※数値はいずれも2026年5月時点のGoogle DeepMind公式モデルカード(Gemini 3.5 Flash)および公式ブログに基づきます。
この表から読み取れるのは、Flashが「全方位で最強」ではなく、エージェント・コーディング・マルチモーダル理解の領域で前世代Proを明確に上回る一方、純粋な推論や学術試験ではまだProが優位な領域もあるということです。
特に Finance Agent v2 で +14.9ポイント、MCP Atlas で +5.4ポイントとエージェント関連の伸びが大きく、Googleが「コーディングとエージェント向けの最強Flash」と位置づける根拠になっています。
逆にHumanity's Last ExamのようなツールなしのPhDレベル試験は、依然として3.1 Proが上回るため、研究・分析寄りの最高精度を求める用途では3.5 Proのリリースを待つか、3.1 Pro Deep Thinkを併用するという選択になります。
「4倍速い」を支える設計
Gemini 3.5 Flashが現場で評価される最大のポイントは、ベンチマーク以上に出力スループットです。
公式ブログでは、同等クラスのフロンティアモデルと比較して出力トークン/秒で約4倍の高速性を達成したと明示されており、Artificial Analysisの独立計測でもFlashが「Intelligence vs Speed」象限の右上に位置することが示されています。
この速度を実現している主な設計上の工夫は、次の3点です。

-
蒸留(Distillation)と疎活性化(Sparsity)
高精度モデルの推論挙動を小さなモデルに転写しつつ、必要な部分だけを計算する疎な構造を採用
-
Thinking levels によるタスク別の思考量調整
3.5 FlashはThinking対応モデルで、thinking_levelパラメータを通じて品質・コスト・レイテンシのバランスを切り替えられる。簡単なタスクには思考量を絞り、難問にはトークンを多く割り当てる運用が可能
-
エージェント向けのレイテンシ最適化
ツール呼び出しやサブエージェント連携を前提に、最初のトークンが返るまでの時間(TTFT)を短く保つよう調整
VentureBeatの取材報道によれば、Google幹部のコメントとして、最適化版では同じ品質を保ったまま最大12倍まで高速化する構成も示唆されています。公式ブログでは「4倍」までが明示値であり、12倍は報道ベースのコメントである点に留意が必要ですが、長期的にはエージェント1ステップあたりのコストが大幅に下がる可能性があります。
マルチモーダル理解とコンテキストウィンドウ
Gemini 3.5 Flashは、テキスト・画像・音声・動画を入力として受け取り、テキストで出力できるネイティブマルチモーダルモデルです。
公開されている主な仕様は以下のとおりです。
- コンテキストウィンドウ:入力1,048,576トークン(約100万)・出力65,536トークン(64K)
- 対応モダリティ:テキスト・画像・動画・音声・PDF(入力)/テキスト(出力)
- モデルコード:
gemini-3.5-flash(Stable)。なお Gemini API のモデル一覧には、別モデルとして「Gemini 3 Flash Preview」(gemini-3-flash-preview)も並存しており、これは3.5 Flashのプレビュー版ではない点に注意 - ナレッジカットオフ:2025年1月
マルチモーダル評価ではCharXiv Reasoning 84.2%を記録し、図表・チャートの読解力で前世代のGemini 3.1 Proを上回っています。長尺ドキュメントを丸ごと読み込んだ上でグラフ・スクリーンショット・図解を含めて要約する用途で、特に効果が出やすい水準です。
Gemini 3.5 Flashの主な特徴
ベンチマークと仕様を踏まえたうえで、Gemini 3.5 Flashが「実際に使ったときに何が変わるのか」を整理します。Googleの位置づけ自体が「答えるAI」から「行動するAI」への転換であり、特徴もエージェント文脈に寄った内容が多くなっています。

数時間の自律実行に耐えるエージェント設計
Gemini 3.5 Flashは、コーディングパイプライン・リサーチプロジェクト・OS構築といった複数時間に及ぶ自律タスクを、ユーザー介入なしで進められるよう設計されています。
TechCrunchの報道によれば、Gemini 3.5 Flashは「ゼロからOSを構築する」レベルの長期タスクを単独でこなしつつ、判断が必要な分岐点では一時停止して人間の判断を仰ぐ構成を取っています。
実務での使い方としては、次のようなパターンが想定されます。

- 朝の段階で「このリポジトリのテスト失敗を全部直して」と指示しておく
- Gemini 3.5 Flashが該当ファイルを探し、修正→テスト実行→さらに修正、を繰り返す
- マージ要否やAPI仕様変更が絡む箇所だけ、Slack通知などで判断を求めてくる
「人がレビュー責任を持ちつつ、機械的作業はエージェントに任せる」という分担をFlash単独でも回せる粒度まで引き上げたのが、3.5 Flashの最大の変化点と言えます。
Antigravity 2.0との連携
Gemini 3.5 Flashは、Googleのエージェント開発プラットフォームであるAntigravityと共同開発されています。Antigravity側もI/O 2026のタイミングで2.0にバージョンアップし、スタンドアロンのデスクトップアプリとして提供されるようになりました。
Antigravity 2.0との組み合わせで提供される主な価値は、以下のとおりです。

-
エージェントネイティブの開発環境
コードエディタにエージェント実行ペインが組み込まれており、Gemini 3.5 Flashの長期タスクを画面上で監督できる
-
MCP(Model Context Protocol)連携
Anthropic主導で標準化が進むMCPに対応し、外部ツール・データソースをエージェントから呼び出せる
-
サブエージェントのオーケストレーション
3.5 Proの公開後は、Proをプランナー、Flashをサブエージェント役として組み合わせる構成も第三者報道で示唆されている(公式の詳細仕様はPro正式公開時に確認する前提)
開発者が「自前でエージェントフレームワークを組まなくても、Antigravity 2.0を入れればGemini 3.5 Flashの長期実行をすぐに試せる」状態になっており、エージェント設計の入口が大きく下がっています。
Geminiアプリの新規デザインとデフォルトモデル化
Gemini 3.5 Flashは、Geminiアプリ(モバイル/デスクトップ)とGoogle検索のAI Modeで、ログイン済みの全ユーザーに対するデフォルトモデルとなりました。
同時にGeminiアプリ側も「Neural Expressive」と呼ばれる新しいデザイン言語に刷新されており、主な変更点は次の3つです。

-
回答フォーマットの動的化
テキストの長文回答だけでなく、画像・動画・動的ビュー(インタラクティブなUIをその場で生成する機能)を埋め込んだ回答が標準化
-
プロンプトボックスのピル型デザイン
角丸の丸みのある入力欄、ハプティックフィードバック、新しいタイポグラフィなどUI全体が更新
-
ナビゲーションドロワーの再設計
過去会話・スキル・SparkやDaily Briefといったエージェント機能への動線が整理されている
Gemini 3.5 Flashが裏側で動いていることを意識しなくても、**「ふだん使うGeminiアプリが知らないうちに速く・賢くなった」**という体験ができる点で、3.1 Proのリリース時よりも個人ユーザーへの影響が大きいアップデートになっています。
コーディング以外への波及
Flashは「コーディングとエージェント向け」と銘打たれていますが、ベンチマーク上はマルチモーダル理解(CharXiv 84.2%)や金融エージェント(Finance Agent v2 57.9%)でも前世代Pro超えを示しています。
実務での応用例としては、次のような領域への波及が想定されます。

- 大量の社内ドキュメントの分類・要約:1Mトークンの入力枠+4倍速の組み合わせで、PDF・スライド・議事録を週次バッチで処理
- チャート・図表を多用する分析業務:CharXiv 84.2%の読解力を生かして、ダッシュボードのスナップショットを自然言語で説明
- 金融・経理オペレーションのエージェント化:Finance Agent v2の伸び(+14.9pt)を背景に、明細仕訳の自動分類や請求書突合
- カスタマーサポートの長文ログ解析:マルチターン会話のコンテキストを100万トークン保ったまま、原因分類とFAQ作成を自動化
これらは個別タスクとしては従来モデルでも実装できましたが、**「速くて安いから本番投入できる」**という条件をFlashが満たしたことで、実装の経済合理性が一気に変わったと言えます。
Gemini Spark / Daily Briefなど新エージェント機能
Gemini 3.5 Flashの登場と同時に、Googleは**Flashを駆動エンジンとした「コンシューマー向けエージェント機能」**を一気に発表しました。エージェントAIをまずアプリ側で体験させ、開発者・企業向けの本格展開につなげる狙いが透けて見えます。
ここではその中心となるGemini SparkとDaily Briefを取り上げます。

Gemini Sparkは「24時間動くパーソナルエージェント」
Gemini Sparkは、Geminiアプリに組み込まれた個人向けAIエージェントです。質問に答えるだけの従来モードとは違い、ユーザーから委任を受けて専用のクラウドサーバー上で常時動き続け、メール・カレンダー・ドキュメント・タスクを横断して作業を進める設計になっています。
公式ブログでの位置づけは「your personal AI agent, taking action on your behalf while under your direction(あなたの指示のもと、あなたに代わって行動するパーソナルAIエージェント)」です。
主なユースケースとして公開されているのは次のとおりです。

- 継続タスクの設定:「毎週月曜にチームのカレンダーから先週の主要MTGを抽出し、議事録の要約をスラックに投稿」など、繰り返しの業務フローを登録できる
- 新しいスキルの学習:ユーザーが手順を1回見せれば、Sparkがその手順を覚えて以降は自律実行する
- 明細・サブスクの監視:クレジットカード明細から隠れた手数料・新規サブスクを抽出し、月次レポートを生成
- インボックスの仕分け:受信メールを優先度別に振り分け、学校・取引先・自治体などからの重要通知を要約
実装上は送信メールなどリスクの高い操作には毎回ユーザー確認を挟む仕組みになっており、暴走しない設計とユーザー監督の責任分担が両立する形になっています。
Daily Briefで朝の準備時間を圧縮する
Daily Briefは、Gemini Sparkと並んで発表された朝のパーソナルダイジェスト機能です。前日深夜から早朝にかけて、Gmailの受信トレイ・Googleカレンダー・確認が必要なフォローアップ情報・Geminiチャットなどを横断的にスキャンし、出社・始業のタイミングで「今日やるべきこと」のサマリーを生成します。
具体的に届く情報は、以下のような構成です。

- 当日のスケジュールと優先順位
- 返信が必要な未読メールのリスト
- フォローアップが必要な依頼や案件
- 同僚や取引先から来た重要な連絡の要約
Geminiアプリのサイドパネルに埋め込まれて配信されるため、別アプリを開く手間なく1画面で1日の準備が完了する設計です。
実務感覚では「秘書が朝にブリーフィングメモを作ってくれる」イメージに近く、朝の15〜30分を構造化された情報のチェックに置き換えられるのがDaily Brief最大の価値と言えます。
提供範囲と日本展開の見通し
2026年5月時点の提供状況は、SparkとDaily Briefで異なるため整理しておきます。
- Gemini Spark:trusted testers向けに今週ロールアウト開始、米国のGoogle AI Ultraサブスクライバー向けベータが翌週開始。Web/Android/iOSに対応し、macOSは2026年夏予定
- Daily Brief:米国のGoogle AI Plus/Pro/Ultraサブスクライバー向けに、発表日である2026年5月19日からロールアウト開始。Ultra限定ではなく、Plusでも利用可能
つまりDaily BriefはSparkより対象プランが広く、Plusユーザーから順次触れる状態です。一方でSparkはまだ米国Ultraベータの段階で、ロールアウト初期と捉えるのが正確です。
日本企業がSparkやDaily Briefを正式運用に組み込むのは時期尚早ですが、**「Workspaceに常駐するエージェントが個人タスクを巻き取る世界線」**が現実のロードマップに乗ったこと自体は、自社のAI戦略を見直すうえで無視できないシグナルです。
Gemini 3.5 ProとGemini Omniの新発表
Gemini 3.5 Flash以外で予告されたのが、最上位モデル「Gemini 3.5 Pro」と、マルチモーダル動画生成モデル「Gemini Omni」の2つです。Gemini 3.5 Proは2026年6月(来月)公開予定でまだ概要レベルの情報のみ、一方のGemini Omniは代表モデル「Omni Flash」がすでにGeminiアプリ・Google Flow上でGoogle AI Plus/Pro/Ultra向けにグローバル展開中で、API提供や料金などの詳細仕様が今後段階的に公開されていく見込みです。

Gemini 3.5 Proは「社内利用中・来月公開」段階
Gemini 3.5 Proは、来月(2026年6月)のロールアウトが予告されている最上位モデルです。公式ブログで公開されているのは「すでに内部利用されている」「来月公開予定」までで、ベンチマーク数値や料金など具体的な仕様は本記事執筆時点で未公表です。
第三者報道では、ProとFlashの役割分担として「Proがオーケストレーター(プランナー)として動き、Flashをサブエージェントとして指揮する構成が念頭に置かれている」というTechCrunchの取材があります。ただしこれはGoogle側の説明を取材した記者の整理であり、公式ブログ・モデルカードでアーキテクチャの粒度まで明文化されたものではない点に注意が必要です。
仮にこの構成が踏襲されると、MCP・Antigravity 2.0と組み合わせて動くマルチエージェントシステムとして、たとえば次のような業務シナリオが現実的になります(あくまでProの正式仕様公開後に検証すべき想定です)。

- 3.5 Proが「契約書レビュー全体のチェックリスト」を計画
- 3.5 Flashが各章を並列でレビュー
- 矛盾や不明瞭な条項だけを3.5 Proが再評価
- 最終レポートをProがまとめてユーザーに返す
なお3.5 ProのGPT-5.5など競合モデルとの性能・価格比較は、公式に未公表です。第三者の暫定指標も3.5 Flash側の数値と混ざりやすいため、対GPT-5.5比較は正式公開後のモデルカードで再評価する前提で扱うのが安全です。
Gemini Omniは動画生成・編集向けの新ファミリー
Gemini Omniは、画像・音声・動画・テキストといった任意のモダリティを入力として動画生成・編集を行う、Geminiの新しいマルチモーダルワールドモデル系列です。代表モデルの「Gemini Omni Flash」がGoogle AI Plus/Pro/Ultraサブスクライバー向けにGeminiアプリとGoogle Flowでグローバルにロールアウト開始しています。
公式ブログでは、Omniを単独の新モデルファミリーとして紹介しており、Veo 3/Veo 3.1の「後継」「段階移行」とは明示されていません。本記事でも、Veo系列と並存する新しい動画生成ファミリーとして扱います。
公式に予告されている特徴は次のとおりです。

- 入力は画像・音声・動画・テキストの任意の組み合わせ
- Geminiの実世界知識を反映した「グラウンディング」された動画を出力
- 開発者・企業向けにはAPI経由での提供が予告されている
- 後続で画像・テキスト出力など追加モダリティの拡張も想定されている
ユースケース例としては、製品の試作画像+ナレーション音声+簡単なシナリオテキストを入力すると、製品紹介動画が出力される、といった用途が想定されます。マーケティング・教育・eコマースの動画制作コストを大きく下げる可能性があります。
ただし、本格運用に必要な料金・解像度・尺・APIエンドポイントの詳細はOmni FlashとAPI正式提供で順次公開される見通しのため、本番組み込みは公式アナウンスの確認後に検討するのが安全です。
既存Gemini製品との関係
Gemini 3.5の発表で気になるのは、既存のGemini 3シリーズ・Nano Banana 2・Veo 3/3.1など、まだ現役の製品との位置づけです。整理すると次のようになります。
- Gemini 3 / 3.1 Pro:継続提供。研究用途・最高精度が必要な領域では引き続き第一候補
- Gemini 3 Flash:Geminiアプリ/AI Modeのデフォルトは3.5 Flashに切り替わり済み。一方でGemini API上ではGemini 3 Flash Preview(
gemini-3-flash-preview)として引き続き利用可能 - Nano Banana 2(画像生成):継続提供。Omniは動画特化のため棲み分け
- Veo 3 / 3.1:継続提供。Omniは別ファミリーとして並存し、両者の使い分けは正式仕様の公開後に判断する形
開発者・企業として現時点で取るべき行動は、「Flashへの即時切り替え」と「Proリリース後の再評価」を分けて計画することです。Flashは既存3.1 Proの上位互換に近い使い勝手のため、本番投入のハードルが大幅に下がっています。
Gemini 3.5の使い方と利用チャネル
Gemini 3.5は、個人ユーザーが触れるGeminiアプリから、開発者向けAPI、企業向けエージェント基盤まで5つの主要チャネルで提供されています。読者の立場ごとに、どこから入るのが最適かが変わるため、用途別に整理します。

個人ユーザー向け:GeminiアプリとAI Mode
最も手軽な入り口は、**Geminiアプリ(モバイル/デスクトップ)とGoogle検索のAI Mode**です。どちらも2026年5月19日以降、デフォルトモデルがGemini 3.5 Flashに切り替わっています。
使い方の流れは次のとおりです。
- Googleアカウントでログインしてgemini.google.comまたはモバイルアプリを起動
- 通常のチャット入力で質問・依頼を投げる
- 検索バーから「AI Mode」を選択するとGoogle検索内でも3.5 Flashベースの会話型回答を受け取れる
個人ユーザーレベルでは追加課金なしで利用可能ですが、利用回数・コンテキストサイズにはGeminiの料金プランに応じた上限があります。本格的に使うなら、Google AI Plus・Google AI Pro(月額20ドル前後)・Google AI Ultra(月額100ドル〜)のいずれかが選択肢になります(Daily Brief(米国)やOmni FlashはPlusから利用可、Sparkベータ等はUltra限定)。
開発者向け:Gemini APIとGoogle AI Studio
API経由でアプリやサービスに組み込みたい場合は、Gemini API・Google AI Studio・Android Studioの3つが主要な入口です。
それぞれの特徴は以下のとおりです。

-
Google AI Studio
ブラウザベースのプロトタイピング環境。プロンプト調整・モデル比較・curlサンプル生成まで一画面で完結する
-
Gemini API(直接呼び出し)
本番アプリへ組み込むときの標準ルート。SDKはPython・JavaScript・Go・Javaなど主要言語に対応
-
Android Studio
モバイル開発者向け。AndroidアプリにGeminiを組み込むときの公式統合ルート
-
Vertex AI
Google Cloud上で大規模に運用したい企業向け。同じモデルをGCPのVPC・課金・IAMと統合して利用できる
APIのモデルIDは gemini-3.5-flash(Stable)です。既存のGemini APIを使っている場合、モデルIDを置き換えるだけで切り替えられる設計になっています。なお gemini-3-flash-preview は別モデル「Gemini 3 Flash Preview」を指すコードで、3.5 Flashのプレビュー版ではありません(料金・性能・利用枠も別系列のため取り違えに注意)。
エージェント開発向け:Google Antigravity 2.0
エージェント型アプリケーションを本格的に組みたい場合は、**Google Antigravity 2.0**を起点にするのが効率的です。
I/O 2026で2.0にメジャーアップデートされ、スタンドアロンのデスクトップアプリとして提供される形になりました。主な特徴は次のとおりです。

- Gemini 3.5 Flashとネイティブ統合された開発環境
- MCP(Model Context Protocol)対応で外部ツールを呼び出し可能
- 長期実行エージェントの監視・介入UIを内包
- 来月公開予定のGemini 3.5 Proとの組み合わせ運用も想定されている(具体的なアーキテクチャはPro正式公開後に確認)
Antigravity 2.0は、フレームワーク選定や状態管理を自前で実装する必要を大きく減らせるため、「Geminiでエージェントを組みたいけど何から始めれば」と詰まっている開発者には最有力の出発点です。
企業向け:Gemini Enterprise Agent Platform
組織レベルでGemini 3.5を導入する場合は、Gemini Enterprise Agent PlatformとGemini Enterpriseを活用します。
I/O 2026では、Shopify・Macquarie Bank・Salesforce・Ramp・Xero・Databricksといった企業が初期パートナーとして公開され、すでにGemini 3.5を業務エージェントに組み込んでテスト運用していることが明らかになっています。
エンタープライズ向けに用意されている主な機能は以下のとおりです。

- データ所在地・暗号化・監査ログなどのコンプライアンス要件への対応
- Workspace(Gmail/Docs/Drive/Sheets)との深い統合
- 既存業務システム(Salesforce、SAP等)との接続コネクタ
- 役割ベースのアクセス制御(RBAC)と運用ダッシュボード
「個人ではアプリで試した、開発者はAPIで検証した、次は社内で何台ものエージェントを並走させたい」というフェーズで選択するのが、Enterprise Agent Platformです。
Gemini 3.5の料金体系
Gemini 3.5の料金は、API従量課金とサブスクリプションの2系統で設計されています。それぞれ別軸の課金モデルなので、混同しないよう整理します。

機能別の対象プラン・提供範囲早見表
API・サブスクのどちらを通じて何が使えるかを、機能ごとに整理すると以下のとおりです。
| 機能 | 利用チャネル | 対象プラン・課金 | 地域 |
|---|---|---|---|
| Gemini 3.5 Flash(API) | Gemini API / Google AI Studio / Vertex AI | API従量課金 | グローバル |
| Gemini 3.5 Flash(Managed Agents) | Managed Agents in Gemini API(Interactions API経由) | API従量課金(Interactions API課金体系) | 段階展開 |
| Gemini 3.5 Flash(Antigravity 2.0) | Antigravity 2.0 デスクトップアプリ | Google AI Ultraで利用上限が引き上げられ、上限到達時のAntigravityボーナスクレジット特典あり(API直接呼び出しは別課金) | グローバル |
| Gemini 3.5 Flash(アプリ) | Geminiアプリ / Google検索 AI Mode | 無料 / AI Plus / AI Pro / AI Ultra | グローバル |
| Gemini 3.5 Pro | 未公開(2026年6月公開予定) | 未定 | 未定 |
| Gemini Spark | Geminiアプリ(Web/Android/iOS、macOSは夏予定) | 米国 AI Ultra ベータ(翌週開始) | 米国 |
| Daily Brief | Geminiアプリ(サイドパネル) | 米国 AI Plus / Pro / Ultra | 米国 |
| Gemini Omni Flash(動画生成) | Geminiアプリ / Google Flow | AI Plus / Pro / Ultra | グローバル |
| Gemini Omni API | Gemini API(提供予告段階) | API従量課金(料金未公開) | 段階展開 |
同じ「Gemini 3.5」と冠していても、Flashは即時切替できる一方、Pro・Spark・Omni APIは段階展開でプラン・地域が分かれます。さらに同じFlashを呼び出す場合でも、Gemini API(直接従量課金)/Managed Agents in Gemini API(Interactions API課金)/Antigravity 2.0(AI Ultraで上限引き上げ+ボーナスクレジット特典)/Geminiアプリ(無料/Plus/Pro/Ultraのサブスク枠)/Vertex AIのどこから入るかで課金経路と上限が異なるため、社内検証で利用ルートを決める際は早見表のチャネル列を起点に判別するのが安全です。
API従量課金(Gemini 3.5 Flash)
開発者がGemini APIやVertex AI経由で利用する場合の、Gemini 3.5 Flashの公開料金は以下のとおりです。

| 項目 | Globalリージョン | 非Globalリージョン |
|---|---|---|
| 入力(標準) | $1.50 / 100万トークン | $1.65 / 100万トークン |
| 出力 | $9.00 / 100万トークン | $9.90 / 100万トークン |
| キャッシュ入力 | $0.15 / 100万トークン | $0.165 / 100万トークン |
※2026年5月時点のGoogle公式料金です。2026年7月1日までは、非Globalエンドポイントに対してもGlobal料金が適用される経過措置が公式にアナウンスされています(Google Cloud公式料金ページ参照)。本記事内の価格は今後変更される可能性があるため、最新情報はGemini API公式料金ページも併せて確認してください。
この料金で注目すべきはキャッシュ入力の単価が標準入力の1/10($0.15)まで下がる点です。同じシステムプロンプトや長文ドキュメントを繰り返し使うエージェント設計では、キャッシュをきちんと有効化するだけでトークンコストが大きく圧縮できます。
前世代Gemini 3.1 Proとの料金性能比は、プロンプト長と推論ティアによって幅があります。たとえば200K入力以下の標準ティアでは、3.5 Flashの入力単価は3.1 Proのおよそ7〜8割という水準で、思い切ったコストダウンというより「Pro級の精度を保ちつつ単価をやや下げた」距離感です。一方で、長尺入力・キャッシュ活用・スループット重視のワークロードでは、出力4倍速と$0.15のキャッシュ単価が効いて、実効コスト差はより大きく開きます。「単価そのもの」ではなく「処理量あたりの実コスト」で比較するのが、Gemini 3.5 Flashの効果を読み解くポイントです。
サブスクリプションプラン(個人ユーザー向け)
Geminiアプリで本格的に使う場合のサブスクリプションは、I/O 2026で価格と内容が改定されました。
有料プランはGoogle AI Plus / Pro / Ultraの3ティア構成で、Daily BriefやOmni FlashはPlusから利用可能、Sparkベータ等はUltra限定といったように、機能ごとに対象プランが分かれます。

-
無料プラン
Gemini 3.5 Flashが利用回数制限つきで利用可能。個人ユーザーの大半はこのレンジで足りる
-
Google AI Plus
Pro未満の入門有料ティア。Daily Brief(米国)や Gemini Omni Flash などのPlus対応機能がここから解放される
-
Google AI Pro(月額20ドル前後)
Gemini 3.5 Flashの利用上限緩和、ストレージ追加、各種クリエイティブ機能のフル開放
-
Google AI Ultra(月額100ドル〜)
Gemini SparkベータやGemini Omniなどの先行機能、より高い上限、Veo・Nano Banana系の優先利用、Antigravity 2.0の利用上限引き上げ
-
Google AI Ultra(月額200ドルプラン)
さらに利用上限を引き上げた上位ティア(top-tier)。プロのクリエイター・ヘビーユーザー向け
正確な利用回数・対応モデル一覧はGeminiの回数制限で別途整理しているとおりで、ベータ機能の対象になるかどうかも含めてプランごとに異なります。
料金面の読み解き
Gemini 3.5の料金体系は、エージェント時代の運用を見据えて設計されている印象が強いです。
- トークン単価が安いだけでなく、キャッシュ・スループットの両面でコストが下がるため、長期実行のエージェントを本番に乗せやすい
- 個人ユーザーは追加課金なしで3.5 Flashが触れるため、社内検証の最初の一歩を取りやすい
- **Ultraティアの上位プラン(200ドル)**まで用意し、ヘビーユーザー・先行機能を狙う層を取り込んでいる
業務観点で重要なのは、**「3.5 FlashのAPI単価が下がったことで、ROIの試算が大きく変わる」**ということです。これまで「精度は十分だけどAPI単価で見送り」だったユースケースを、もう一度俎上に乗せて再評価する価値が出てきています。
Gemini 3.5と他モデルとの比較
最後に、Gemini 3.5 Flashを既存のフロンティアモデル群と比較し、どんなケースでGemini 3.5を選ぶべきかを整理します。

vs Gemini 3.1 Pro / Gemini 3 Flash
同じGoogle製品ラインの中での比較が、最も実務的に効きます。代表的な使い分け軸を整理すると次のようになります。

| 観点 | Gemini 3.5 Flash | Gemini 3.1 Pro | Gemini 3 Flash Preview |
|---|---|---|---|
| 推論精度(PhDレベル試験) | やや劣る | 最高水準 | 旧世代相当 |
| エージェント・コーディング | 最高水準 | 高い | 中位 |
| 出力速度 | 4倍速 | 標準 | 高速だが3.5に劣後 |
| API単価(入力/出力) | $1.50 / $9.00 | 3.5 Flashより高い | $0.50 / $3.00(最安) |
| Deep Thinkモード対応 | 非対応 | 対応 | 非対応 |
API単価だけで見ると最も安いのは Gemini 3 Flash Preview ですが、3.5 Flashは前世代Pro級の精度を保ったまま3.1 Proより低い単価帯に収まる、という位置づけです。3 Flash Previewは旧世代Flashの位置づけで残っており、推論ベンチマーク・エージェント性能では3.5 Flashが上回ります。
研究・学術・最高難易度の論証など「ツールなしで複雑な推論」が必要な領域では、依然としてGemini 3.1 Pro Deep Thinkが優位です。
一方、コードベース全体のリファクタリング、長期エージェントタスク、マルチモーダル理解を含む実務寄りの領域では、Gemini 3.5 Flashが上位互換に近い使い勝手になります。
vs GPT-5.5 / Claude Opus 4.6
他社フロンティアモデルとの比較では、絶対精度より**「速度・コスト・エージェント設計の親和性」**が勝負どころです。

-
vs GPT-5.5
学術ベンチマーク・推論深度ではGPT-5.5が優位な領域も残るが、Google検索/Workspace連携を前提とする業務ならGemini 3.5の親和性が高い
-
vs Claude Opus 4.6
Claude Opus 4.6は実コードのバグ修正(SWE-Bench)で強みが残る。一方、エージェント連携・マルチモーダル・コストで見るとGemini 3.5 Flashが優位
-
エコシステム連携の差
Gemini 3.5はAndroid Studio・Antigravity・Workspace・AI Modeまで一気通貫で押さえられる点が、他社にない強みになっている
ケース別の使い分けとしては、研究・分析寄りはClaude/Gemini 3.1 Pro系、エージェント・Workspace連携重視はGemini 3.5 Flash、コードレビューや既存OpenAIスタックの拡張はGPT-5.5、というのが実務的な選定軸になります。
導入判断で詰まる論点
ここまでの整理を踏まえても、現場では「結局どのモデルから始めれば」で詰まるケースが多くあります。AI総合研究所の支援経験を踏まえると、論点はだいたい次の3つに集約されます。
-
既存スタックとの整合
すでにGoogle Workspace・GCPを軸に運用しているなら、Gemini 3.5 Flashへの切替は最も摩擦が少ない。逆にOpenAI/Claudeで作り込んだエージェント基盤がある場合、移行コストとのトレードオフを見る必要がある
-
本番投入の閾値
「精度・速度・コスト・エージェント連携」のうちどれが最も足かせになっていたかで、Gemini 3.5への乗り換え効果が変わる。コストと速度がボトルネックだった案件は、最も恩恵を受けやすい
-
3.5 Proリリースの待ち時間
最高精度を求める研究系・分析系は、6月の3.5 Proリリースを待ったほうが意思決定が安定する。一方、エージェント・コーディング案件は今すぐ3.5 Flashで進めて問題ない
「自社のユースケースで、3.5 Flashが今日から本番投入できるか」を見極めるには、まずGoogle AI Studio上で社内の代表的なタスクを2〜3個試走させ、レスポンス品質と所要時間の差分を実数値で確認するのが手堅い進め方です。
Geminiでの検証成果を業務エージェント運用までつなぐなら
Gemini 3.5 Flashの登場により、Google AI StudioやAntigravity 2.0でエージェント検証を始める入口は大きく広がりました。一方で、検証で動かしたエージェントをそのまま全社業務に乗せる段階では、業務システム連携・実行ログ・権限管理・データガバナンスといった**「PoCを越えた先」の運用設計**が必要になります。
このレイヤーを担うのが、自社のAzureテナント内で動くエンタープライズAIエージェント基盤です。AI総合研究所のAI Agent Hubは、Geminiで設計したエージェントを自社環境で本番運用するための、業務システム接続・統合管理ダッシュボード・セキュリティ統制を一括で提供します。
- Geminiでの検証成果を業務実装までつなぐ
Google AI Studio・Antigravity 2.0で組んだエージェント設計を、SAP Concur・freee会計・Salesforce・Dynamics 365などの業務システムとつないだ本番運用へ移植します。
- マルチエージェント運用の管理基盤
複数モデル・複数エージェントを組み合わせた構成(3.5 ProとFlashの併用が示唆される将来構成を含む)でも、実行ログ・アクセス権限・コストを1つのダッシュボードで一元管理できます。
- 使い慣れたMicrosoft環境をそのまま活用
Teams・Excel・Outlookなど既存ツールの延長でAIエージェントを呼び出せます。新しいツールの学習コストはゼロです。
- データは100%自社テナント内に保持
Azure Managed Applicationsとして顧客テナント内で構築するため、業務データを外部に出さずに運用設計を完結できます。
AI総合研究所は、Geminiでの検証フェーズから自社テナント内の本番運用設計まで、企業のAIエージェント導入を伴走支援しています。まずは無料の資料で、Gemini活用と組み合わせた業務エージェント運用の全体像をご確認ください。
Geminiの検証を業務実装までつなぐ
モデル活用から運用管理まで一元化
Gemini 3.5でAIエージェントの設計や検証を進めた次は、業務システム連携・実行ログ・権限管理まで含めた本番運用の設計が必要です。AI総合研究所のAI Agent Hubは、Geminiでの検証成果を自社テナント内の業務エージェント運用までつなぐエンタープライズAI基盤です。
まとめ
本記事では、2026年5月19日にGoogle I/O 2026で発表されたGemini 3.5について、ファミリー全体像と各モデル・機能の特徴を整理しました。
- Gemini 3.5 Flashは、Gemini 3.1 Proを上回るエージェント・コーディング性能を持ちながら出力速度4倍を実現。プロンプト長や推論ティアによって料金性能比の効きは変わるが、フロンティア帯モデルの本番投入ハードルを大きく下げる立ち位置
- Gemini 3.5 Proは2026年6月公開予定。公式は「社内利用中・来月公開」までの粒度で、Pro/Flashの役割分担や対GPT-5.5比較などの具体像は正式GA時に再評価する前提
- Gemini Sparkは米国Google AI Ultraサブスクライバー向けベータが翌週開始、Daily Briefは米国のAI Plus/Pro/Ultra向けに発表日である2026年5月19日からロールアウト開始。日本での提供時期は未発表で、過去機能と同様に段階展開となる可能性がある
- Gemini Omniは動画生成・編集向けの新ファミリー。代表モデルOmni FlashがGoogle AI Plus/Pro/Ultra向けにGeminiアプリ・Google Flowでグローバルに展開中
- 料金面ではキャッシュ単価1/10、2026年7月1日までの非Globalエンドポイント経過措置、サブスクUltra $100〜200の2ティアなど、エージェント時代の運用を前提とした設計に整理された
Gemini 3.5は、「ベンチマーク主導のモデル開発」から「プロダクト・エージェント主導のモデル開発」への転換点として、業務適用の意思決定に直接効くアップデートです。
まずはGoogle AI Studioで社内代表タスクをGemini 3.5 Flashで試走させ、現行スタックとの差分を数値で把握するところから始めるのが、最も摩擦の少ない次の一歩になります。













