AI総合研究所

SHARE

X(twiiter)にポストFacebookに投稿はてなブックマークに登録URLをコピー

Gemini Liveとは?Googleの音声AIアシスタント機能の使い方と活用シーン

この記事のポイント

  • Gemini Liveは、GoogleのGeminiアプリで提供される音声対話機能で、双方向のリアルタイム対話を実現
  • 会話の途中でユーザーがAIの応答を遮って新たな質問を追加できる「インタラプト機能」が特徴
  • 2025年のGoogle I/Oでカメラ・画面共有機能が発表され、日常生活や仕事での活用が期待される
  • Gemini Liveは、音声と視覚情報を融合させた革新的なAI対話インターフェースで、私たちとAIとのコミュニケーション方法を根本的に変える可能性がある
坂本 将磨

監修者プロフィール

坂本 将磨

XでフォローフォローするMicrosoftMVP

Microsoft MVP・AIパートナー。LinkX Japan株式会社 代表取締役。東京工業大学大学院にて自然言語処理・金融工学を研究。NHK放送技術研究所でAI・ブロックチェーンの研究開発に従事し、国際学会・ジャーナルでの発表多数。経営情報学会 優秀賞受賞。シンガポールでWeb3企業を創業後、現在は企業向けAI導入・DX推進を支援。


Gemini Liveは、GoogleのGeminiアプリで提供される音声対話機能です。 従来のAIアシスタントとは異なり、まるで友人と話しているような双方向のリアルタイム対話を実現します。 Gemini Liveの最大の特徴は、会話の途中でユーザーがAIの応答を遮って新たな質問を追加できる点にあります。

AI総合研究所では、AI研修、企業AI導入の伴走支援を行っています。
お気軽にご相談ください

Gemini Liveとは?

Gemini Liveとは、GoogleのGeminiアプリで提供される音声対話機能です。
従来のAIアシスタントとは異なり、まるで友人と話しているような双方向のリアルタイム対話を実現します。
Gemini Liveの最大の特徴は、会話の途中でユーザーがAIの応答を遮って新たな質問を追加できる点にあります。
この 「インタラプト機能」により、より人間らしい自然な対話フローを実現しています。

gemini-live
Google I/O 2025 でのGemini Liveアップデートの紹介

サービス開始から現在 (2025年6月) までの機能

2024年8月に英語版が有料プラン加入者向けに提供開始されました。
その後、同年10月には日本語を含む40以上の言語に対応が拡大されています。
2025年5月のGoogle I/Oでは、カメラ・画面共有機能を含むGemini LiveがAndroidおよびiOSの全ユーザーに無料開放されることが発表されました。

現在では150か国以上、45以上の言語でこの音声対話AI機能を利用することが可能です。

Google I/O 2025で統合された新機能

2025年のGoogle I/Oでは、Gemini Liveに新機能が追加されることが発表されました。
カメラをかざすだけでGoogle CalendarやGoogle Keepに情報を自動追加できるようになります。

例えば、結婚式の招待状をスマートフォンのカメラで映すだけで、AIが日時や場所を自動認識し、ワンタップでGoogle Calendarに予定を追加できます。また、手書きの買い物リストを撮影すれば、項目を自動抽出してGoogle Keepにチェックリスト形式で保存することも可能です。
Gemini Liveの進化の背景には、Project Astraの先進技術の統合があります。

これらの機能は2025年後半以降、段階的にロールアウトされる予定です。従来の「質問に答える存在」から「文脈を理解し主体的に行動するパートナー」へと、Gemini Liveが大きく進化することを意味しています。

Gemini Liveの主な機能

Gemini Liveが従来の音声アシスタントを大きく超える理由は、その多彩な機能にあります。
高度なAI対話モデルによる柔軟な応答を活かし、日常生活から専門的な作業まで幅広くサポートします。

話しかけるだけで会話できる

マイクに向かって話しかけるだけで、Geminiが音声で即座に返答します。キーボードに触れる必要は一切なく、手が離せない状況でもスムーズに利用できる点が大きなメリットです。
会話は途切れることなく進行し、あたかも人と話しているかのように自由に質問や発言を重ねることが可能です。この機能は45以上の言語に対応しており、世界中の多様なユーザーが母国語でAIとの円滑な対話を行えます。
日本語での会話も自然で流暢であり、方言や話し方の癖にもある程度対応できるため、多くの日本人ユーザーにとって使いやすい設計となっています。

会話しながらアイデアを練る

Gemini Liveに話しかけながらアイデアを整理したり膨らませたりできます。
プレゼントのアイデア、イベントの企画、事業計画の立案、旅行の計画など、多岐にわたるトピックについて雑談形式でブレインストーミングを行うことが可能です。

具体的な活用例:

  • プレゼントのアイデア出し
  • イベントの企画立案
  • 事業計画の骨子作成
  • 旅行プランの検討
  • クリエイティブプロジェクトの発想支援

例えば「マーケティングの経験を活かせる新しい職種はある?」といった問いかけに対し、スキルや専門に見合う仕事のアイデアを一緒に考えることができます。
AIが壁打ち相手となることで、思考の整理や新たな発見につながる可能性があります。

調べ物にも対応

音声で話すだけで、興味のあるトピックの情報を収集できます。
従来のウェブ検索のようにキーワードを入力して結果一覧から情報を探す手間を省き、会話形式で迅速に必要な情報を得られます。

将来的には、Google Maps、Google Calendar、Google Searchといった他のGoogleサービスとの連携がさらに深まることが予定されています。

例えば、「近くの美味しいピザ屋さんは?」と尋ねればGoogle Mapsから最新の店舗情報やレビューを取得して提案したり、友人との食事の約束について会話すれば自動的にGoogle Calendarに予定を登録したりといった機能が期待されます。

カメラと画面共有でさらに便利に

Gemini Liveの利便性を大幅に高めているのが、カメラ入力と画面共有機能です。これらの機能により、ユーザーは自分が見ているものやデバイスの画面上の情報をAIとリアルタイムで共有し、より具体的で文脈に即したサポートを受けることができます。

カメラ機能の活用例:

  • 故障した家電製品のトラブルシューティング
  • 散らかった部屋の整理整頓アドバイス
  • ファッションコーディネートの提案

画面共有機能の活用例:

  • オンラインショッピングでの商品比較
  • クリエイティブ作業のフィードバック
  • スマートフォンの設定や操作支援

Google I/O 2025で発表された新機能の詳細

2025年後半以降に段階的に追加される新機能について、具体的な使用例とその背景技術を詳しく解説します。

カメラをかざすだけでカレンダーに自動追加

結婚式の招待状、会議の案内状、イベントのチラシなどをスマートフォンのカメラで映すだけで、AIが自動的に日時、場所、イベント名を認識し、Google Calendarへの追加を提案します。

gemini-live-calendar
カメラ画像からGoogle Calendarに予定を追加する様子

具体的な流れ:

  1. Gemini Liveアプリでカメラや画面共有を起動
  2. 招待状やチラシを映す
  3. Gemini が内容を解析し、予定登録の候補を表示
  4. ユーザーが確認し、ワンタップでGoogle Calendarに登録

この機能により、紙の書類から手動でスケジュールを転記する手間が大幅に削減されます。

手書きメモを自動でGoogle Keepに整理

冷蔵庫に貼られた買い物リストや手書きのToDoリストを撮影すると、Gemini が内容を自動認識してGoogle Keepにデジタルのチェックリスト形式で保存します。

gemini-live-keep
Google Keepにチェックリストとして登録する様子

具体的な流れ:

  1. 手書きの買い物リストやToDoリストをカメラで撮影
  2. Gemini が手書き文字を認識・解析
  3. 項目ごとに分類してチェックリスト形式に変換
  4. Google Keepに自動保存され、スマートフォンやPCからいつでもアクセス可能

この機能により、アナログな手書きリストの情報をシームレスにデジタル化でき、情報管理の効率が向上します。

画面共有による即時アクション提案

ウェブサイトやアプリ画面をGemini Liveで共有すると、AIが重要な情報(イベント日程、場所など)を自動検出し、関連アクション(カレンダー追加や地図検索等)を提案します。

具体的な活用例:

  • イベントの案内ページを画面共有 → AIが日程・場所を検出し、カレンダー登録や地図表示を提案
  • レストランの情報ページや予約画面を共有 → Google Mapsでのルート案内提案
  • オンライン会議招待リンクの画面を共有 → 会議のリマインダー追加などを提案

Google Lensとの連携強化

Google Lensで認識した情報から、Gemini Liveの音声対話モードにシームレスに移行できるようになり、視覚認識からAIとの自然な会話がスムーズに行えるようになりました。

使用例:

  • Google Lensで植物や建物を認識
  • 「Live」ボタンをタップしGemini Liveの音声対話モードに切り替え
  • 認識された対象(例:花の種類や建築物の歴史)について音声で質問
  • Gemini Liveがコンテキストを維持したまま詳細な説明を提供

以下に、各新機能がどのようなGeminiの仕組みで実現されているかを紹介します。

機能 具体例 AIの仕組み
カメラ→予定登録 紙の招待状を映すと文字を認識し、ワンタップでGoogle Calendarに追加 文字認識+イベント抽出
カメラ→メモ整理 手書きの買い物リストを撮影し、項目を自動抽出してGoogle Keepにチェックリスト作成 手書き認識+自動分類
画面共有→即時アクション イベントページを共有するとAIが日時を検出しカレンダー登録を案内 内容解析+アクション提案
Google Lens連携 Google Lensから直接Live対話を開始し、見えているものについて質問 視覚認識+会話

これらの機能により、Gemini Liveは単なる音声アシスタントから、ユーザーの状況を理解し主体的にサポートを提供するAIパートナーへと進化します。

使い方:Gemini Liveの始め方

Gemini Liveを利用するための要件と具体的な操作手順について詳しく説明します。

対応デバイスとアプリ

以下に、Gemini Liveの利用環境をまとめた表を示します。

項目 詳細
対応 OS Android 10 以上 / iOS 16 以上(iPhone・iPad)
必須アプリ Gemini モバイルアプリ最新版(Android / iOS 共通)
デバイス要件 Android は RAM 2GB以上必須 iOS は OS 要件のみ明示(RAM 要件なし)
提供形態 モバイルアプリ+Chrome デスクトップ版(順次ロールアウト)。Gemini Live は現状 Gemini Web 版には未対応

参照: Gemini モバイルアプリの利用要件

利用条件

以下に利用条件やプランについてまとめた表を示します。

条件 最新情報
年齢制限 Gemini Live 利用には 18 歳以上。Gemini モバイルアプリ自体は 13 歳以上から使用可(国・地域による)
アカウント 個人用 Google アカウント、または管理者が Gemini 利用を許可した Workspace / 教育機関アカウント
提供地域 45 以上の言語、150 か国超 に展開(段階的に拡大中)
料金 Gemini Live は Android・iOS・Chrome いずれも基本機能が無料。Gemini AI Pro など上位プランは別途課金 (Google AI Pro / Google AI Ultra プラン)

Gemini Liveの開始

以下に実際にGemini Liveで対話を開始する手順をまとめた表を示します。

方法 操作
タップ操作(Android / iOS 共通) 画面下部の 「Live」アイコン をタップ
ジェスチャ(Android) 左へスワイプでも Live 画面へ遷移可能
電源ボタン長押し(Android) 電源ボタンを長押し → Gemini を呼び出し → 「Live」をタップ
音声コマンド(Android) 「Hey Google, let’s talk Live」 もしくは 「Hey Google, let’s talk」 と話しかける(「OK Google」でも可)

iOS版は現状、音声キーワードで Live を直接起動する方法は案内されていません(アプリ内の Live ボタンのみ)。

実用的な活用シーン

Gemini Liveのマルチモーダルな機能を活かした、日常生活や仕事における具体的な活用例を紹介します。

  • 会議前のアドバイス確認
    重要な会議やプレゼンテーションの前に、想定される質疑応答についてアドバイスを求めたり、論点の整理を手伝ってもらったりできます。

  • プレゼンテーションのリハーサル
    スピーチの原稿を読み上げ、話し方や間の取り方を練習する相手として活用できます。

新機能の活用シーン (2025年後半以降)

Gemini Liveを活用するシーンでは次のようなことが期待されます。

  • 買い物準備:
    冷蔵庫に貼った手書きの買い物リストを撮影すると、Gemini が項目を自動抽出し、Google Keep にチェックリスト形式で保存します。アナログのメモがそのままスマホで確認でき、買い忘れ防止に役立ちます。

  • 旅行計画:
    旅行パンフレットや観光サイトを 画面共有 すると、AI が日程や場所を読み取り、
    Gemini Live との対話内で旅行プランに旅程の下書きを作成 や、Google Maps と連携したプラン作成に役立ちます。

  • DIY サポート:
    I/O 2025 の Project Astra デモでは、壊れた自転車チェーンをカメラで映すと、必要な部品の検索や修理手順をリアルタイムで案内する様子が紹介されました。

実際に使ってみた

ベトナムなど海外旅行中のローカル食堂 では、言語の壁でメニューを読めずに戸惑うことも少なくありません。
しかし Gemini Live なら、カメラでメニューを映し、日本語で質問するだけ で料理内容や価格を瞬時に理解することができます。

gemini-live-demo

gemini-live-2

このように、スマートフォンのカメラを起動し、日本語でGeminiと会話することで、現地の言語やメニューの内容も簡単に理解できます。

Gemini Liveの会話データ管理とプライバシー

Gemini Liveを安心して利用するために、会話データがどのように取り扱われ、プライバシーがどのように保護されるのかを理解することが重要です。

文字起こし・アクティビティ保存

Gemini Liveで行われた会話が保存されるのかや、その設定についてをまとめた表を示します。

設定 保存内容 保存期間 主な用途
Gemini Apps Activity が オン の場合 ・会話の文字起こし(テキスト)
録音音声・カメラ映像・画面共有の動画(順次展開中)
デフォルト 18 か月(3/18/36 か月に変更可能) サービス提供・機能改善・Google AI の品質向上 (Gemini アプリ アクティビティを管理、削除する)
Gemini Apps Activity が オフ の場合 会話データは Gemini Apps Activity に保存されないが、サービス提供とフィードバック処理のため最長 72 時間保持 最大 72 時間 この間はモデル改善に利用されない(※フィードバック提出時を除く

プライバシーへの配慮

Gemini Liveを利用する際は、以下のプライバシー配慮が重要です。

  • 他者の同意:
    他者が参加する会話をGemini Liveで行う場合や、他者を録音・録画する可能性がある場合には、必ず事前に本人の明確な許可を得ることが必須です。

  • 機密情報の取り扱い:
    パスワード、クレジットカード番号、マイナンバーなどの機密性の高い個人情報は、Gemini Liveとの会話に含めないよう注意が必要です。

  • ユーザーのデータコントロール権:
    ユーザーは「Gemini アプリ アクティビティ」の設定画面から、保存されたアクティビティの確認・管理・削除が可能です。また、今後の会話がAIの改善に利用されないよう、アクティビティ設定をオフにすることもできます。

まとめ

Gemini Liveは、音声と視覚情報を融合させた革新的なAI対話インターフェースとして、私たちとAIとのコミュニケーション方法を根本的に変える可能性を秘めています。
2025年のGoogle I/Oで発表された新機能により、従来の「質問に答える存在」から「文脈を理解し主体的に行動するパートナー」へと大きく進化することが期待されています。
Googleサービスとの連携強化や機能拡張により、Gemini Liveが日常生活や仕事において不可欠なパートナーとなる可能性があります。Gemini Liveの今後のアップデートにされます。

AI活用のノウハウ集「AI総合研究所」サービスご紹介資料

「AI総合研究所 サービス紹介資料」は、AI導入のノウハウがないというお客様にも使いやすい最先端のAI導入ノウハウを知れる資料です。

資料ダウンロード
AI総合研究所サービス紹介資料
監修者
坂本 将磨

坂本 将磨

Microsoft MVP・AIパートナー。LinkX Japan株式会社 代表取締役。東京工業大学大学院にて自然言語処理・金融工学を研究。NHK放送技術研究所でAI・ブロックチェーンの研究開発に従事し、国際学会・ジャーナルでの発表多数。経営情報学会 優秀賞受賞。シンガポールでWeb3企業を創業後、現在は企業向けAI導入・DX推進を支援。

関連記事

AI導入の最初の窓口。

お悩み・課題に合わせて活用方法をご案内いたします。
お気軽にお問合せください。

AI総合研究所 Bottom banner

ご相談
お問い合わせは
こちら!