この記事のポイント
音声ベースのAIアシスタント導入を検討するなら、Gemini Liveを第一候補にすべき。双方向リアルタイム対話とインタラプト機能により、従来の一問一答型AIとは根本的に異なる自然な会話体験を実現する
カメラ・画面共有機能が2026年3月時点でAndroid・iOSの両方に展開済み。音声+視覚のマルチモーダル対話により、現場作業の遠隔支援やリアルタイムの資料レビューに有効
2026年のUI刷新(フローティングピル)により、他アプリを使いながらGemini Liveとの対話を継続できるマルチタスク対応が実現
Googleエコシステム(Gmail・Calendar・Keep・Maps等)との連携が進み、日本語でもTasks・Keep・YouTube Musicとの統合が利用可能
Gemini Liveの基本機能は無料で利用可能。上位機能にはGoogle AI Pro(月額$19.99)またはUltra(月額$249.99)が必要

Microsoft MVP・AIパートナー。LinkX Japan株式会社 代表取締役。東京工業大学大学院にて自然言語処理・金融工学を研究。NHK放送技術研究所でAI・ブロックチェーンの研究開発に従事し、国際学会・ジャーナルでの発表多数。経営情報学会 優秀賞受賞。シンガポールでWeb3企業を創業後、現在は企業向けAI導入・DX推進を支援。
Gemini Liveは、GoogleのGeminiアプリで提供される音声対話機能です。 従来のAIアシスタントとは異なり、まるで友人と話しているような双方向のリアルタイム対話を実現します。 Gemini Liveの最大の特徴は、会話の途中でユーザーがAIの応答を遮って新たな質問を追加できる点にあります。
AI総合研究所では、AI研修、企業AI導入の伴走支援を行っています。
お気軽にご相談ください。
Googleの最新動画生成AIモデル「Gemini Omni」については、以下の記事をご覧ください。
Gemini Omniとは?その性能や使い方、料金体系を徹底解説!
目次
Gemini Liveとは?
Gemini Liveとは、GoogleのGeminiアプリで提供される音声対話機能です。
従来のAIアシスタントとは異なり、まるで友人と話しているような双方向のリアルタイム対話を実現します。
Gemini Liveの最大の特徴は、会話の途中でユーザーがAIの応答を遮って新たな質問を追加できる点にあります。
この「インタラプト機能」により、より人間らしい自然な対話フローを実現しています。

Google I/O 2025 でのGemini Liveアップデートの紹介
サービス開始から現在(2026年3月)までの進化
2024年8月に英語版が有料プラン加入者向けに提供開始されました。
その後、同年10月には日本語を含む40以上の言語に対応が拡大されています。
2025年5月のGoogle I/Oでは、カメラ・画面共有機能を含むGemini LiveがAndroidおよびiOSの全ユーザーに無料開放されることが発表されました。
2025年後半から段階的にカメラ・画面共有機能のロールアウトが進み、2026年3月時点ではAndroid 10以上(RAM 2GB以上)およびiOS 16以上の対象デバイスで利用可能です。150か国以上、45以上の言語でこの音声対話AI機能を利用できます。
2026年1〜2月には、UIの大幅刷新が実施されました。従来のフルスクリーン表示から、Project Astraのデモで披露されたフローティングピル(コンパクトなオーバーレイ)デザインに変更され、他アプリを使いながらGemini Liveとの対話を継続できるマルチタスク対応が実現しています。
Google I/O 2025で統合された新機能
2025年のGoogle I/Oでは、Gemini Liveに複数の新機能が発表されました。
カメラをかざすだけでGoogle CalendarやGoogle Keepに情報を自動追加できる機能が追加されています。
例えば、結婚式の招待状をスマートフォンのカメラで映すだけで、AIが日時や場所を自動認識し、ワンタップでGoogle Calendarに予定を追加できます。また、手書きの買い物リストを撮影すれば、項目を自動抽出してGoogle Keepにチェックリスト形式で保存することも可能です。
Gemini Liveの進化の背景には、Project Astraの先進技術の統合があります。
これらの機能は2025年後半から段階的にロールアウトされ、2026年3月時点ではAndroid・iOSの両方で利用可能です。従来の「質問に答える存在」から「文脈を理解し主体的に行動するパートナー」へと、Gemini Liveは大きく進化しています。
Gemini Liveの主な機能
Gemini Liveが従来の音声アシスタントを大きく超える理由は、その多彩な機能にあります。
高度なAI対話モデルによる柔軟な応答を活かし、日常生活から専門的な作業まで幅広くサポートします。
話しかけるだけで会話できる
マイクに向かって話しかけるだけで、Geminiが音声で即座に返答します。キーボードに触れる必要は一切なく、手が離せない状況でもスムーズに利用できる点が大きなメリットです。
会話は途切れることなく進行し、あたかも人と話しているかのように自由に質問や発言を重ねることが可能です。この機能は45以上の言語に対応しており、世界中の多様なユーザーが母国語でAIとの円滑な対話を行えます。
日本語での会話も自然で流暢であり、方言や話し方の癖にもある程度対応できるため、多くの日本人ユーザーにとって使いやすい設計となっています。
会話しながらアイデアを練る
Gemini Liveに話しかけながらアイデアを整理したり膨らませたりできます。
プレゼントのアイデア、イベントの企画、事業計画の立案、旅行の計画など、多岐にわたるトピックについて雑談形式でブレインストーミングを行うことが可能です。
具体的な活用例を以下に挙げます。
- プレゼントのアイデア出し
- イベントの企画立案
- 事業計画の骨子作成
- 旅行プランの検討
- クリエイティブプロジェクトの発想支援
例えば「マーケティングの経験を活かせる新しい職種はある?」といった問いかけに対し、スキルや専門に見合う仕事のアイデアを一緒に考えることができます。
AIが壁打ち相手となることで、思考の整理や新たな発見につながる可能性があります。
調べ物にも対応
音声で話すだけで、興味のあるトピックの情報を収集できます。
従来のウェブ検索のようにキーワードを入力して結果一覧から情報を探す手間を省き、会話形式で迅速に必要な情報を得られます。
Googleサービスとの連携も進んでおり、2026年3月時点では日本語を含む9言語でGoogle Tasks・Google Keep・YouTube Musicとの統合が利用可能です。Google Maps、Google Calendar、Google Searchとの連携もさらに深まっています。
例えば、「近くの美味しいピザ屋さんは?」と尋ねればGoogle Mapsから最新の店舗情報やレビューを取得して提案したり、友人との食事の約束について会話すれば自動的にGoogle Calendarに予定を登録したりといった使い方が可能です。Geminiの全体像も合わせて確認してください。
カメラと画面共有でさらに便利に
Gemini Liveの利便性を大幅に高めているのが、カメラ入力と画面共有機能です。これらの機能により、ユーザーは自分が見ているものやデバイスの画面上の情報をAIとリアルタイムで共有し、より具体的で文脈に即したサポートを受けることができます。
カメラ機能の活用例を以下に紹介します。
- 故障した家電製品のトラブルシューティング
- 散らかった部屋の整理整頓アドバイス
- ファッションコーディネートの提案
画面共有機能の活用例も多岐にわたります。
- オンラインショッピングでの商品比較
- クリエイティブ作業のフィードバック
- スマートフォンの設定や操作支援
2026年のフローティングピルUIにより、カメラや画面を共有しながら他のアプリに切り替えても、Gemini Liveとの対話は小さなフローティングサークルとして継続されます。共有の開始・停止やマイクのミュートもコンパクトなインターフェースから操作可能です。
Google I/O 2025で発表された新機能の詳細
2025年のGoogle I/Oで発表され、その後段階的に提供が開始された新機能について、具体的な使用例とその背景技術を詳しく解説します。
カメラをかざすだけでカレンダーに自動追加
結婚式の招待状、会議の案内状、イベントのチラシなどをスマートフォンのカメラで映すだけで、AIが自動的に日時、場所、イベント名を認識し、Google Calendarへの追加を提案します。

カメラ画像からGoogle Calendarに予定を追加する様子
具体的な流れを以下に示します。
- Gemini Liveアプリでカメラや画面共有を起動
- 招待状やチラシを映す
- Gemini が内容を解析し、予定登録の候補を表示
- ユーザーが確認し、ワンタップでGoogle Calendarに登録
この機能により、紙の書類から手動でスケジュールを転記する手間が大幅に削減されます。
手書きメモを自動でGoogle Keepに整理
冷蔵庫に貼られた買い物リストや手書きのToDoリストを撮影すると、Gemini が内容を自動認識してGoogle Keepにデジタルのチェックリスト形式で保存します。

Google Keepにチェックリストとして登録する様子
具体的な流れを以下に示します。
- 手書きの買い物リストやToDoリストをカメラで撮影
- Gemini が手書き文字を認識・解析
- 項目ごとに分類してチェックリスト形式に変換
- Google Keepに自動保存され、スマートフォンやPCからいつでもアクセス可能
この機能により、アナログな手書きリストの情報をシームレスにデジタル化でき、情報管理の効率が向上します。
画面共有による即時アクション提案
ウェブサイトやアプリ画面をGemini Liveで共有すると、AIが重要な情報(イベント日程、場所など)を自動検出し、関連アクション(カレンダー追加や地図検索等)を提案します。
具体的な活用例を以下に挙げます。
- イベントの案内ページを画面共有すると、AIが日程・場所を検出し、カレンダー登録や地図表示を提案
- レストランの情報ページや予約画面を共有すると、Google Mapsでのルート案内を提案
- オンライン会議招待リンクの画面を共有すると、会議のリマインダー追加などを提案
Google Lensとの連携強化
Google Lensで認識した情報から、Gemini Liveの音声対話モードにシームレスに移行できるようになり、視覚認識からAIとの自然な会話がスムーズに行えるようになりました。
使用例を以下に紹介します。
- Google Lensで植物や建物を認識
- 「Live」ボタンをタップしGemini Liveの音声対話モードに切り替え
- 認識された対象(例:花の種類や建築物の歴史)について音声で質問
- Gemini Liveがコンテキストを維持したまま詳細な説明を提供
以下の表は、各新機能がどのようなGeminiの仕組みで実現されているかをまとめたものです。
| 機能 | 具体例 | AIの仕組み |
|---|---|---|
| カメラから予定登録 | 紙の招待状を映すと文字を認識し、ワンタップでGoogle Calendarに追加 | 文字認識+イベント抽出 |
| カメラからメモ整理 | 手書きの買い物リストを撮影し、項目を自動抽出してGoogle Keepにチェックリスト作成 | 手書き認識+自動分類 |
| 画面共有から即時アクション | イベントページを共有するとAIが日時を検出しカレンダー登録を案内 | 内容解析+アクション提案 |
| Google Lens連携 | Google Lensから直接Live対話を開始し、見えているものについて質問 | 視覚認識+会話 |
これらの機能により、Gemini Liveは単なる音声アシスタントから、ユーザーの状況を理解し主体的にサポートを提供するAIパートナーへと進化しています。
使い方:Gemini Liveの始め方
Gemini Liveを利用するための要件と具体的な操作手順について説明します。
対応デバイスとアプリ
以下の表は、Gemini Liveの利用環境をまとめたものです。
| 項目 | 詳細 |
|---|---|
| 対応OS | Android 10以上 / iOS 16以上(iPhone・iPad) |
| 必須アプリ | Geminiモバイルアプリ最新版(Android / iOS共通) |
| デバイス要件 | AndroidはRAM 2GB以上必須。iOSはOS要件のみ明示(RAM要件なし) |
| 提供形態 | モバイルアプリが主。デスクトップWeb版は2026年3月時点でテスト中(正式提供は未定) |
利用条件
以下の表は、利用条件や料金プランについてまとめたものです(2026年3月時点)。
| 条件 | 最新情報 |
|---|---|
| 年齢制限 | Gemini Live利用には18歳以上。Geminiモバイルアプリ自体は13歳以上から使用可(国・地域による) |
| アカウント | 個人用Googleアカウント、または管理者がGemini利用を許可したWorkspace / 教育機関アカウント |
| 提供地域 | 45以上の言語、150か国超に展開(段階的に拡大中) |
| 料金 | Gemini Liveの基本機能はAndroid・iOS・Chromeいずれも無料。上位機能にはGoogle AI Plus(月額$13.99)、Google AI Pro(月額$19.99)、Google AI Ultra(月額$249.99)が必要 |
料金プランの詳細はGeminiの料金プランを比較!無料・有料版の違いと選び方を参照してください。
Gemini Liveの開始
以下の表は、実際にGemini Liveで対話を開始する手順をまとめたものです。
| 方法 | 操作 |
|---|---|
| タップ操作(Android / iOS共通) | 画面下部の「Live」アイコンをタップ |
| ジェスチャ(Android) | 左へスワイプでもLive画面へ遷移可能 |
| 電源ボタン長押し(Android) | 電源ボタンを長押し→Geminiを呼び出し→「Live」をタップ |
| 音声コマンド(Android) | 「Hey Google, let's talk Live」もしくは「Hey Google, let's talk」と話しかける(「OK Google」でも可) |
iOS版は現状、音声キーワードでLiveを直接起動する方法は案内されていません(アプリ内のLiveボタンのみ)。
2026年のUI刷新後は、Gemini Liveがフローティングピル形式で表示されます。他のアプリに移動すると小さなフローティングサークルに折りたたまれ、タップすればすぐに対話画面に戻ることができます。
実用的な活用シーン
Gemini Liveのマルチモーダルな機能を活かした、日常生活や仕事における具体的な活用例を紹介します。
- 会議前のアドバイス確認
重要な会議やプレゼンテーションの前に、想定される質疑応答についてアドバイスを求めたり、論点の整理を手伝ってもらったりできる
- プレゼンテーションのリハーサル
スピーチの原稿を読み上げ、話し方や間の取り方を練習する相手として活用できる
カメラ・画面共有を活用したシーン
カメラ・画面共有機能が提供されたことで、以下のような活用シーンが広がっています。
- 買い物準備
冷蔵庫に貼った手書きの買い物リストを撮影すると、Geminiが項目を自動抽出し、Google Keepにチェックリスト形式で保存する。アナログのメモがそのままスマホで確認でき、買い忘れ防止に役立つ
- 旅行計画
旅行パンフレットや観光サイトを画面共有すると、AIが日程や場所を読み取り、Gemini Liveとの対話内で旅程の下書き作成や、Google Mapsと連携したプラン作成に役立つ
- DIYサポート
Google I/O 2025のProject Astraデモでは、壊れた自転車チェーンをカメラで映すと、必要な部品の検索や修理手順をリアルタイムで案内する様子が紹介された
実際に使ってみた
ベトナムなど海外旅行中のローカル食堂では、言語の壁でメニューを読めずに戸惑うことも少なくありません。
しかしGemini Liveなら、カメラでメニューを映し、日本語で質問するだけで料理内容や価格を瞬時に理解することができます。


このように、スマートフォンのカメラを起動し、日本語でGeminiと会話することで、現地の言語やメニューの内容も簡単に理解できます。フローティングピルUIにより、翻訳アプリやGoogle Mapsと切り替えながらGemini Liveとの対話を継続できるため、海外旅行中の実用性がさらに向上しています。
Gemini Liveの会話データ管理とプライバシー
Gemini Liveを安心して利用するために、会話データがどのように取り扱われ、プライバシーがどのように保護されるのかを理解することが重要です。
文字起こし・アクティビティ保存
Gemini Liveで行われた会話の保存設定について、以下の表にまとめます。
| 設定 | 保存内容 | 保存期間 | 主な用途 |
|---|---|---|---|
| Gemini Apps Activityがオンの場合 | 会話の文字起こし(テキスト)、録音音声・カメラ映像・画面共有の動画(順次展開中) | デフォルト18か月(3/18/36か月に変更可能) | サービス提供・機能改善・Google AIの品質向上 |
| Gemini Apps Activityがオフの場合 | 会話データはGemini Apps Activityに保存されないが、サービス提供とフィードバック処理のため最長72時間保持 | 最大72時間 | この間はモデル改善に利用されない(フィードバック提出時を除く) |
プライバシーへの配慮
Gemini Liveを利用する際は、以下のプライバシー配慮が重要です。
- 他者の同意
他者が参加する会話をGemini Liveで行う場合や、他者を録音・録画する可能性がある場合には、必ず事前に本人の明確な許可を得ることが必須
- 機密情報の取り扱い
パスワード、クレジットカード番号、マイナンバーなどの機密性の高い個人情報は、Gemini Liveとの会話に含めないよう注意が必要
- ユーザーのデータコントロール権
ユーザーは「Geminiアプリアクティビティ」の設定画面から、保存されたアクティビティの確認・管理・削除が可能。また、今後の会話がAIの改善に利用されないよう、アクティビティ設定をオフにすることもできる
音声AIアシスタントの理解を業務でのAI活用に広げるなら
Gemini Liveの音声対話やマルチモーダル機能を理解できたなら、音声AIの業務活用も具体的にイメージできるようになっているはずです。ハンズフリーでのAI操作や画面共有による情報分析は、現場業務のAI化に直結する技術です。
AI総合研究所では、音声AIを含むマルチモーダルAIの業務導入から運用設計まで220ページのガイドにまとめています。音声AIの可能性を業務改善に結びつけたい方は、ぜひご活用ください。
音声AIアシスタントの理解を業務でのAI活用に広げる
AI業務自動化ガイド
Gemini Liveの音声対話機能を理解したなら、次はAIアシスタントの業務活用です。AI総合研究所のAI業務自動化ガイドでは、音声AIを含むマルチモーダルAIの業務導入から運用設計まで、220ページで実践手法を解説しています。
まとめ
Gemini Liveは、音声と視覚情報を融合させた革新的なAI対話インターフェースとして、私たちとAIとのコミュニケーション方法を根本的に変える存在です。
2025年のGoogle I/Oで発表されたカメラ・画面共有機能は2025年後半から段階的にロールアウトされ、2026年3月時点ではAndroid・iOSの両方で利用可能になっています。さらに、2026年のUI刷新(フローティングピル)により、他のアプリを使いながらGemini Liveとの対話を継続できるマルチタスク対応も実現しました。
Gemini Liveの基本機能は無料で利用でき、Googleエコシステムとの連携が最大の強みです。日本語でのTasks・Keep・YouTube Music統合も利用可能になっており、業務利用から日常生活まで幅広いシーンでの活用が期待できます。
業務でのAI音声アシスタント導入を検討する企業には、まず無料プランでGemini Liveの基本対話機能を試し、チームの業務フローに合うユースケースを特定することを推奨します。Deep Researchや高度なモデルアクセスが必要な場合は、Google AI Pro(月額$19.99)へのアップグレードを検討してください。デスクトップWeb版のGemini Live対応も準備が進んでおり、今後さらに活用の幅が広がる見込みです。













