AI総合研究所

SHARE

X(twiiter)にポストFacebookに投稿はてなブックマークに登録URLをコピー

Apple Foundation Models第3世代(AFM 3)とは?5モデル構成と新Siri AIを徹底解説

この記事のポイント

  • 第3世代AFMは5モデル構成。オンデバイス2+サーバー3で「軽さ・速さ・推論力」を使い分ける設計
  • AFM 3 Core Advancedは20Bパラメータだが、推論時は1〜4Bのみアクティブ。NAND保存×DRAM部分ロードでオンデバイスの限界を突破
  • AFM 3 Cloud Proのみ NVIDIA GPU on Google Cloud で動作。Apple独自路線とパートナー活用のハイブリッド戦略
  • Siri AIはパーソナルコンテキスト・Visual Intelligence・スタンドアロンアプリ・iCloud同期を統合した新アシスタント
  • Apple Intelligenceは日本語含む対応言語で2026年秋提供。Siri AIはまず英語で開始、他言語は順次拡大。EUと中国は別途制限、機能ごとの地域・言語差にも注意
坂本 将磨

監修者プロフィール

坂本 将磨

XでフォローフォローするMicrosoftMVP

Microsoft MVP・AIパートナー。LinkX Japan株式会社 代表取締役。東京工業大学大学院にて自然言語処理・金融工学を研究。NHK放送技術研究所でAI・ブロックチェーンの研究開発に従事し、国際学会・ジャーナルでの発表多数。経営情報学会 優秀賞受賞。シンガポールでWeb3企業を創業後、現在は企業向けAI導入・DX推進を支援。

Apple Foundation Models 第3世代(AFM 3)は、Appleが2026年6月8日のWWDC 2026で発表した、新世代のApple Intelligenceを支える5モデル構成の基盤モデル群です。
オンデバイス2モデル(AFM 3 Core・AFM 3 Core Advanced)とサーバー3モデル(AFM 3 Cloud・ADM 3 Cloud・AFM 3 Cloud Pro)で構成され、20Bパラメータの上位オンデバイスモデルがスパース活性化アーキテクチャで1〜4Bのみ動作する点が技術的なハイライトです。

本記事では、2026年6月時点の最新情報をもとに、5モデル構成、AFM 3 Core Advancedのアーキテクチャ革新、人間評価ベンチマーク、Private Cloud ComputeのGoogle Cloud × NVIDIA GPU連携、新Siri AIと関連体験、対応デバイス・言語・提供時期、そしてAppleのAI戦略が示す方向性までを体系的に解説します。

目次

AFM 3とは|Apple Foundation Models第3世代の5モデル構成

5モデルの構成と役割

Apple Intelligenceの第2世代から何が変わったか

モデル命名のルール(AFMとADMの違い)

AFM 3 Core Advancedのスパース活性化アーキテクチャ|20Bでも1〜4Bしか動かさない仕組み

Instruction-Following Pruning(IFP)の考え方

MoEとの違い|トークン単位ではなくプロンプト単位でルーティング

推論時の「elasticity」が意味するもの

AFM 3の性能評価|テキスト・画像・音声の人間評価結果

テキスト性能|AFM 3 Cloudは英語で56.0%勝率(旧モデル11.0%)

画像理解性能|AFM 3 Cloudは37.8%勝率(旧モデル9.6%)

TTS性能|MOSで現行比+0.28〜+0.42の改善

ディクテーション性能|全7次元で前世代を上回る

Private Cloud Computeの拡張|Google Cloud × NVIDIA GPU連携の仕組み

拡張の対象はAFM 3 Cloud Proのみ

プライバシー保証はどう維持しているか

「外部GPUを使うApple」は何を意味するか

Siri AIと関連体験|Visual Intelligence・Image Playground・Genmoji

Siri AIの主要強化ポイント

パーソナルコンテキストの理解|メッセージ・メール・写真の横断検索

ウェブ知識との接続|広範な世界知識を返答に反映

Visual Intelligenceの対象拡張|iPhone CameraからMac・Vision Proまで

Siriスタンドアロンアプリの追加

Image PlaygroundとGenmojiの進化

開発者向け:Foundation Models frameworkとの接続

対応デバイス・対応言語・提供時期と地域制限

対応OSと対応デバイス

対応言語と日本語サポート

提供時期と料金

地域制限|EUと中国の扱い

AFM 3が示すApple AI戦略|独自路線・Google提携・NVIDIA連携の読み解き

「Apple独自モデル」と「Google提携」が同居する構図

企業AI戦略への示唆|3つのケース別整理

Apple独自路線の意味|競合との比較

オンデバイスAIが広がる時代の備え

AI活用を業務に定着させる

まとめ

AFM 3とは|Apple Foundation Models第3世代の5モデル構成

AFM 3の5モデル構成

Apple Foundation Models第3世代(AFM 3)は、Appleが2026年6月8日のWWDC 2026で発表した、新世代のApple Intelligenceを支える基盤モデル群です。

オンデバイス2モデル+サーバー3モデルの5モデル構成で、機能ごとに役割を分担しながら一貫したユーザー体験を提供する設計になっています。

Apple Foundation Models 第3世代(AFM 3)のヒーロー画像
Apple Machine Learning Researchが公開した第3世代AFMのキービジュアル(出典:Apple Machine Learning Research

AFM 3の最大の特徴は、「オンデバイスとサーバーを5モデルでまたぐ階層設計」と、「サーバーモデルの一部をGoogle Cloud + NVIDIA GPU上で動かす」という、これまでのApple路線からの一歩踏み込んだ構成にあります。

Appleが2024年に Apple Intelligenceを導入してから2世代目となるアップデートで、Siri AIを含む新しい体験はすべてこの基盤の上に成り立っています。

AI Agent Hub1

5モデルの構成と役割

5モデルの構成と役割

以下の表で、AFM 3を構成する5モデルの位置づけを整理しました。

モデル パラメータ規模 動作環境 主な役割
AFM 3 Core 3B(dense) オンデバイス 軽量・常時動作のオンデバイス処理
AFM 3 Core Advanced 20B(うちアクティブ1〜4B) オンデバイス(上位Apple silicon限定) マルチモーダル・音声・高精度ディクテーション
AFM 3 Cloud 非公開 Private Cloud Compute(Apple silicon) サーバー側の汎用ワークホース
ADM 3 Cloud(Image) 非公開 Private Cloud Compute(Apple silicon) 画像生成・編集(Image Playground / Genmoji / Spatial Reframing)
AFM 3 Cloud Pro 非公開 Private Cloud Compute(Google Cloud上のNVIDIA GPU) エージェント・複雑推論など高難度タスク


このうちAFM 3 Core・Core Advanced・Cloud・ADM 3 Cloudの4モデルはApple siliconに最適化されていますが、最上位の AFM 3 Cloud ProだけはNVIDIA GPU向けにチューニングされています。

AppleはAFM 3 Cloud Proを「最も要求の高いユースケース、たとえばエージェント的なツール利用や複雑推論に使う」と説明しています。

Googleと共同でカスタム構築された最上位サーバーモデルとして、Apple Intelligenceの中で最も難度の高い処理を担う位置づけです。

Apple Intelligenceの第2世代から何が変わったか

Apple Intelligence 第2世代から何が変わったか

Apple Intelligence は2024年に登場し、2025年に第2世代としてFoundation Models frameworkが開発者向けに提供されました。

第3世代では以下の3点が大きく変わっています。

  • オンデバイス上位モデルの新設
    従来の3B dense一本ではなく、20Bのスパース活性化モデル「AFM 3 Core Advanced」を上位機にロード。音声・画像・長文推論をオンデバイスで処理できる範囲が広がる

  • サーバー階層の3分化
    汎用のAFM 3 Cloud、画像専用のADM 3 Cloud、最上位のAFM 3 Cloud Proに分けて、用途別に計算リソースを最適化

  • Private Cloud Computeの外部拡張
    従来はApple silicon限定だったPCCを、Google Cloud上のNVIDIA GPUまで拡張。プライバシー保証は維持したまま、サーバー側の計算能力を底上げ


つまり「オンデバイスの天井を上げる」「サーバーの計算上限をApple siliconの外まで広げる」の2軸で、Apple Intelligenceが扱える領域を引き上げたのが第3世代の本質です。

モデル命名のルール(AFMとADMの違い)

モデル命名のルール AFM と ADM の違い

5モデルのうち、画像生成モデルだけ ADM 3 Cloud という別の頭文字が使われています。

ADMはApple Diffusion Modelの略で、テキスト生成のためのAFM(Apple Foundation Model)とは別系統の拡散モデルファミリーであることを示しています。

これにより、テキスト処理はAFM系・画像生成はADM系という分業がモデル名から読み取れる設計になっています。


AFM 3 Core Advancedのスパース活性化アーキテクチャ|20Bでも1〜4Bしか動かさない仕組み

AFM 3のなかでも、技術的に最もインパクトが大きいのがオンデバイス上位モデルAFM 3 Core Advancedのアーキテクチャ革新です。

20Bパラメータという、これまでのオンデバイスモデルの常識を超えるサイズにもかかわらず、推論時のアクティブパラメータは1〜4Bに抑えられています。

AFM 3 Core Advanced のスパース活性化アーキテクチャ
AFM 3 Core Advancedのモデルアーキテクチャ図。Dense model in DRAMとFFN experts in NANDの二段構成(出典:Apple Machine Learning Research

AFM 3 Core Advancedのスパース活性化アーキテクチャ

この仕組みを支えているのが、Apple研究チームが2025年1月に arXiv で発表した Instruction-Following Pruning(IFP) という手法です。

Instruction-Following Pruning(IFP)の考え方

Instruction-Following Pruning

通常の大規模モデルは、すべての重みをDRAMに常駐させて動かします。

20Bパラメータの重みをすべてDRAMに置こうとすると、コンシューマー機の搭載メモリでは到底足りず、オンデバイス実行は不可能でした。

IFPは、ユーザーの指示文(プロンプト)から「この処理に必要な専門家ブロック(experts)」を動的に絞り込むことで、この壁を突破します。

  • 全expertsはNAND(フラッシュメモリ)に保存
  • プロンプト到着時に、軽量なdenseブロックが「どのexpertsをロードすべきか」を判定
  • 選ばれたexpertsだけをDRAMにロードして動作
  • 生成中にも定期的にexpertsを再選択して入れ替え


結果として、20BパラメータすべてをDRAMに乗せる必要がなくなり、1〜4Bのアクティブパラメータ分だけのメモリ消費で20Bモデルが動くという設計が成立します。

MoEとの違い|トークン単位ではなくプロンプト単位でルーティング

MoE との違い

スパース活性化と聞くと、Mixture-of-Experts(MoE)を思い浮かべる方も多いはずです。

MoEは「トークンごとにexpertsを切り替える」設計ですが、これをそのままオンデバイスで動かそうとすると、NANDとDRAMの間の帯域がボトルネックになります。

Appleは「トークン単位ではなくプロンプト単位でexpertsを選ぶ」というデザインで、データ移動を最小化しました。

具体的には、常時アクティブなshared experts(毎回DRAMに乗っている共通ブロック)と、ルーティングされるrouted experts(プロンプト依存でNANDからDRAMにロード)を組み合わせる構造です。

これにより、推論レイテンシは小規模denseモデルと同等を保ちつつ、モデルサイズだけを20Bまで引き上げる結果を得ています。

推論時の「elasticity」が意味するもの

推論時の elasticity が意味するもの

AppleはAFM 3 Core Advancedの設計を「推論時のelasticity(伸縮性)を持つ」と説明しています。

これは、タスクごとにアクティブパラメータの数を変えられることを指します。

  • 簡単な質問・短い応答 → 1B程度のアクティブで処理
  • 複雑な推論・長文生成 → 4B近くのアクティブで処理
  • リクエストごとに必要なexpertsを増減


1つのモデルで「小さく・速く動く」と「大きく・賢く動く」を切り替えられるため、複数モデルを使い分ける運用コストを下げられます。

つまりAFM 3 Core Advancedは、「20Bの賢さ」と「3Bの軽さ」を、同じモデルで動的に出し分ける設計だと整理できます。


AFM 3の性能評価|テキスト・画像・音声の人間評価結果

ここからは、Appleが公式のリサーチ記事で公開している人間評価の結果を、テキスト・画像理解・音声の3領域に分けて整理します。

評価は社内の人間グレーダーによるもので、Instruction Following・Truthfulness・Presentationの3軸で行われています。

AFM 3の性能評価

テキスト性能|AFM 3 Cloudは英語で56.0%勝率(旧モデル11.0%)

以下のチャートは、AFM 3 CoreとAFM 3 Cloudそれぞれを、2025年版の前世代モデルと比較した人間評価結果です。

AFM 3 Core/Cloud の人間評価結果(テキスト)
Figure 3: テキスト能力の人間評価結果。AFM 3 Core / AFM 3 Cloudと2025年版モデルの比較を4ロケールで実施(出典:Apple Machine Learning Research

評価は英語(English)と、PFIGSCJK・DNNSTV・AFIHHMPRTUという3つのロケール群でも実施されています。略号はそれぞれ次のロケールを指します。

  • PFIGSCJK: ポルトガル語・フランス語・イタリア語・ドイツ語・スペイン語・中国語・日本語・韓国語
  • DNNSTV: デンマーク語・オランダ語・ノルウェー語・スウェーデン語・トルコ語・ベトナム語
  • AFIHHMPRTU: アラビア語・フィンランド語・インドネシア語・ヘブライ語・ヒンディー語・マレー語・ポーランド語・ロシア語・タイ語・ウクライナ語


注目したいのはAFM 3 Cloudの差が大きい点です。

英語では 56.0% vs 11.0%、PFIGSCJKでは 68.3% vs 6.9% と、サーバーモデルでの世代差がはっきり数値に出ています。

オンデバイスのAFM 3 Coreも英語で 38.0% vs 23.0% と前世代を上回り、特にAFIHHMPRTU(中東・東欧言語群)では 55.5% vs 18.3% と大幅に改善しました。

サーバー側でも単側評価(single-sided evaluation)では、AFM 3 Cloudが応答満足度で約36%・指示追従で約21%の相対改善を示したとAppleは説明しています。

画像理解性能|AFM 3 Cloudは37.8%勝率(旧モデル9.6%)

画像入力に対する理解能力でも、AFM 3は前世代を上回る結果が出ています。

AFM 3 Core/Cloud の人間評価結果(画像理解)
Figure 4: 画像理解能力の人間評価結果。AFM 3 Core / AFM 3 Cloudと2025年版モデルを英語で比較(出典:Apple Machine Learning Research

オンデバイスのAFM 3 Coreは 26.6% vs 16.8%、サーバーのAFM 3 Cloudは **37.8% vs 9.6%**と、双方で勝率差が出ました。

特にAFM 3 Cloudは引き分け(Tie)52.6%を含めても、前世代に「負けた」と判定された割合は1割を切っています。

Appleは最上位のAFM 3 Cloud Proが、AFM 3 Cloudと比べてテキストでさらに約10%・画像理解で約14%、MathカテゴリではAFM 3 Cloud比で約14%の追加改善を見せていると説明しています。

TTS性能|MOSで現行比+0.28〜+0.42の改善

Apple Intelligenceの音声体験を支えるText-to-Speech(TTS)でも、AFM 3 Core Advancedが現行Apple TTSを上回る結果が出ています。

AFM 3 Core Advanced の TTS 評価結果(MOS)
Table 1: 5点満点のMOS(Mean Opinion Score)によるTTS評価。AFM 3 Core Advancedと現行Apple TTSの比較(出典:Apple Machine Learning Research

General Voiceで 4.15 vs 3.87(+0.28)、Conversational Voiceで 4.24 vs 3.82(+0.42)

Appleは「MOSスケールでは 0.1の改善でも人間が明確に差を感じる」とコメントしており、+0.28〜+0.42という差は実利用でかなり体感できるレベルです。

特にConversational Voiceの伸び幅が大きく、テキストメッセージの読み上げや道案内など、雑談寄りの音声体験が大きく改善する想定です。

ディクテーション性能|全7次元で前世代を上回る

音声入力(ディクテーション)の評価では、AFM 3 Core Advancedが現行ディクテーションシステムを上回る結果が、7次元すべてで確認されています。

AFM 3 Core Advanced のディクテーション評価結果
Figure 5: AFM 3 Core Advancedと現行ディクテーションシステムの比較(Overallほか7次元)(出典:Apple Machine Learning Research

Overall(全体品質)で 44.7% vs 17.6%、Punctuation(句読点)で 50.2% vs 12.4% と、品質・記号処理ともに前世代を引き離しています。

Tie比率が高い次元(Layout 82.1% / Style 79.2%)もありますが、各項目でAFM 3 Core Advancedが負けた割合は概ね5〜14%に収まっており、回帰の心配が少ない仕上がりです。

オンデバイスで20Bモデルが動く環境を活かして、字幕生成やボイスメモの精度向上が進む見込みです。


Private Cloud Computeの拡張|Google Cloud × NVIDIA GPU連携の仕組み

AFM 3で発表されたもうひとつの大きな変化が、Private Cloud Compute(PCC)の外部拡張です。

これまでApple siliconサーバー上のみで運用されてきたPCCが、Google Cloudのデータセンター上のNVIDIA GPUまで広がりました。

詳細は Apple Security Research の公式ブログに整理されています。

Private Cloud Computeの拡張

拡張の対象はAFM 3 Cloud Proのみ

拡張の対象は AFM 3 Cloud Pro のみ

注意したいのは、Private Cloud Compute on Google Cloudが動かすのは最上位のAFM 3 Cloud Pro 1モデルだという点です。

  • AFM 3 CloudとADM 3 Cloud → 引き続きApple siliconのPCC上で動作
  • AFM 3 Cloud Pro → Google Cloud上のNVIDIA GPUで動作


Appleは、エージェント的なツール利用や複雑推論など最も要求の高いタスク向けに、Google Cloud上のNVIDIA GPUへPCCを拡張したと説明しています。

一方でAFM 3 Cloud / ADM 3 Cloudは引き続きApple silicon上のPCCで動く構成のままで、最上位モデルの拡張先だけがGoogle Cloudという棲み分けです。

プライバシー保証はどう維持しているか

プライバシー保証はどう維持しているか

外部のデータセンターを使うと、当然「プライバシーは大丈夫なのか」という論点が出てきます。

Appleは、Apple silicon PCCで確立した保証を4つの仕組みの組み合わせでGoogle Cloudにも持ち込んだと説明しています。

  • NVIDIA Confidential Computing
    ハードウェアレベルの機密計算機能。GPU上で動くコードと処理データを、ホストOSや他のテナントから隔離する

  • Intel TDX(Trust Domain Extensions)
    CPUレベルの保護機構。VM全体を専用のTrust Domainとして隔離し、ハイパーバイザからも内部を覗けない構造を提供

  • Google Titanチップ
    Google Cloud側のセキュリティ機構を担う独自チップ。ハードウェア構成の検証や鍵管理に使う

  • Apple側のソフトウェア統制
    PCCのソフトウェアスタックはAppleが暗号的に管理。Google Cloudで動くPCCハードウェアの構成は検証可能な台帳として記録され、ユーザーは「自分のリクエストが許可された構成のサーバーで処理された」ことを暗号的に確認できる


つまりGoogle Cloudはインフラを提供し、PCCのソフトウェア統制・検証・プライバシー保証はApple側が管理する分業になっています。

「外部GPUを使うApple」は何を意味するか

Appleは伝統的に「自社シリコンですべて完結する」アプローチを取ってきました。

そのなかで、最上位AFM 3 Cloud ProをApple silicon以外で動かす判断をしたのは、フロンティアモデル領域の計算需要が自社サプライ能力を超えて立ち上がっていることの裏返しと読み解けます。

支援現場でも、コンシューマー向けAIの最先端を狙うベンダーが「自社チップ+外部GPU」のハイブリッド構成に踏み込む流れは強くなっています。

Appleの動きは、「フロンティアAIはもはや自社チップ単独では追いきれない領域に入った」というメッセージとも読み取れます。

AI研修


Siri AIと関連体験|Visual Intelligence・Image Playground・Genmoji

AFM 3のモデル群がそのまま見える形で読者に届くのが、新しい Siri AI とその関連体験です。

Apple は Siri AI を「より能力が高く、よりパーソナルなアシスタント」と紹介しており、AFM 3を前提に大幅に拡張された機能を備えています。

Apple Intelligence のアーキテクチャ図
Apple Intelligenceの構造。中心のApple Foundation Models(AFM 3)の上にSystem Orchestrator・Systemwide Experiencesが積み上がり、Siri AI / Personal Context / World Knowledge / Appsなどの体験を支える(出典:Apple Newsroom

Siri AIと関連体験

図のとおり、Siri AIは単独のアプリではなく、最下層のAFM 3を起点に、システム全体のオーケストレーションと連携する形で実装されています。

以降のH3では、AFM 3を前提に拡張された機能を「パーソナルコンテキスト」「ウェブ知識との接続」「Visual Intelligence」「スタンドアロンアプリ」「Image Playground / Genmoji」「Foundation Models framework」の順で見ていきます。

Siri AIの主要強化ポイント

Siri AI の主要強化ポイント

新しいSiri AIは、これまでのSiriと地続きでありながら、以下の4点が大きく変わっています。

  • パーソナルコンテキストの理解
    個人データを横断検索し、文脈に沿った応答を返す

  • オンスクリーン認識
    画面に映っている内容について質問に答える

  • ウェブ知識との接続
    広範な世界知識をウェブから取得し、最新情報を返答に反映する

  • 複数ステップのコンテキスト維持
    連続するプロンプトでコンテキストを保持し、対話的タスクを途切れさせない


これらは、AFM 3のオンデバイスモデルとPrivate Cloud Compute上のサーバーモデルを組み合わせる設計の上に成り立つ体験です。

Appleは「オンデバイス処理を中心に、必要に応じてPrivate Cloud Computeに問い合わせる」と説明していますが、個別タスクごとのモデル選択(どの問い合わせがどのモデルで処理されるか)は公式に詳細公開されていません。本記事のモデル名と機能の対応はあくまで「設計上の役割」レベルで読んでください。

パーソナルコンテキストの理解|メッセージ・メール・写真の横断検索

パーソナルコンテキストは、メッセージ・メール・写真・予定などのユーザー固有データをSiri AIが横断的に参照する機能です。

Siri AI のパーソナルコンテキスト連携
Messagesで「友人の新しいペットの名前候補」をSiri AIが提案する例。会話履歴・連絡先・写真など個人データを参照したうえで返答する(出典:Apple Newsroom

たとえば「先週送ったレストランの候補のうち、駅近の店だけ教えて」のような問い合わせに対して、過去メッセージから候補を抽出し、店舗情報と組み合わせて返答できます。

ポイントは、Appleが「個人データの参照は可能な限り端末内で完結させる」設計をうたっていることです。

Spotlightインデックスやアプリ間連携の仕組みはオンデバイスで動き、Private Cloud Computeに外送される情報は最小限に抑える方針が公式説明として示されています。

ウェブ知識との接続|広範な世界知識を返答に反映

Siri AIは閉じた知識ベースに留まらず、ウェブから取得した広範な世界知識を返答に組み込めるようになりました。

Siri AI のウェブ知識連携(Apple Maps)
Apple MapsとSiri AIが連携し、ニューヨーク旅行のプランを組み立てる例。地図情報とSiriの世界知識を組み合わせて行程を生成する(出典:Apple Newsroom

たとえば「土曜日にニューヨークに行くんだけど、おすすめのプランをMapsで作って」のような複合タスクで、Apple MapsとWeb知識を横断して行程を組めます。

このような複数ステップの推論や広い世界知識を伴うタスクは、Apple公式が「最も要求の高いユースケース」と位置づけるPrivate Cloud Computeを必要に応じて使う領域と考えられます。

ただし、具体的にどの問い合わせがオンデバイスで、どこからサーバーに行くかの個別割り当ては未公開で、利用者からは「軽い問い合わせはローカルで完結し、複雑な問い合わせはPCCが引き受ける」という体感として現れます。

Visual Intelligenceの対象拡張|iPhone CameraからMac・Vision Proまで

Visual Intelligence の対象拡張

Visual Intelligence は、カメラやスクリーンに映る対象をSiriが認識して、関連する操作・回答を返す機能です。

第3世代ではVisual Intelligenceの対象が iPhone Camera・iPad・Mac・Apple Vision Pro の4デバイスに広がりました。

iPhone Cameraでは「Siriモード」が組み込まれ、被写体に向けて質問できます。

iPhone Camera の Siri モード(料理の栄養情報)
iPhoneのカメラを料理に向けると、Siri AIが栄養情報や名称を返答する例。Apple Intelligenceのマルチモーダル画像理解能力が直接体験に表れる場面(出典:Apple Newsroom

Macでは、キーボードショートカットで画面内の領域や画像を選び、その内容についてSiriに質問できます。

Mac で Visual Intelligence を使う例
Macで「Olives Al Fresco」という文書を開き、Siri AIに画像から要約を生成させている例。テキスト入力やSpotlight経由で起動できる(出典:Apple Newsroom

Apple Vision Proでは、空間UIのなかでSiriを3Dオブジェクトとして呼び出し、視界内の対象をVisual Intelligenceで扱えます。

Apple Vision Pro 上の Siri AI
Apple Vision Proの視界にSiriの3Dビジュアライゼーションが表示される例。視線・ジェスチャ経由でVisual Intelligenceを起動できる(出典:Apple Newsroom

iPhone CameraからMacの作業環境、そしてVision Proの空間UIまで、同じVisual Intelligenceの体験が一貫したフォームで提供されるのが第3世代の大きな特徴です。

支える基盤としては、軽量な画像認識はオンデバイス、複雑な推論を伴う応答はPrivate Cloud Computeを必要に応じて使う領域と考えられます。ここでも個別タスクごとのモデル割り当ては未公開で、外からはモデル名単位で線引きできません。

Siriスタンドアロンアプリの追加

新しいSiri AIには専用アプリが用意されました。

会話履歴はiCloud経由で同期され、iPhoneで始めた相談をMacで続ける、といった使い方が可能になります。

これまでのSiriは「呼び出して使う一過性のアシスタント」でしたが、Siri AIは履歴を持つコンパニオンに近い性格に変わっています。

Image PlaygroundとGenmojiの進化

画像生成側では、ADM 3 Cloudが支える Image Playground とGenmojiが大きく前進しました。

ADM 3 Cloud で生成された画像例
Figure 2: ADM 3 Cloudが生成したネイティブ画像の例。被写体・照明条件の幅広さがアピールされている(出典:Apple Machine Learning Research

ADM 3 Cloudは単一の画像生成・編集・Genmoji生成をネイティブに扱うほか、Photosの Spatial Reframing(被写体を変えずに構図だけ作り直す機能)にもアダプタ経由で組み込まれます。

実際のアプリ画面では、Image Playground上で生成画像をプレビューしつつ、テキストで修正指示を加えるインタラクションが整理されています。

iPadOS 27 の Image Playground 画面
iPadOS 27のImage Playgroundで「火星の砂漠を歩く2人の宇宙飛行士」を生成した例。生成結果を見ながら追加のテキスト指示で構図を更新できる(出典:Apple Newsroom

Nano Banana 2Midjourney のような外部ツールに頼らず、iPhone・Macの標準アプリだけで「人物の構図を変える」「テキストから画像を作る」がシームレスに完結する設計です。

写真編集・コミュニケーションスタンプ・Genmojiの3つを同じモデル基盤で支えられる点が、ユーザー体験の一体感に直結します。

開発者向け:Foundation Models frameworkとの接続

開発者は、第2世代から続く Foundation Models framework を通じてAFM 3にアクセスできます。

第3世代ではframeworkが新モデルに対応し、オンデバイスのApple Foundation ModelsをSwift API経由で利用できる構成です。

具体的な公開時期やAPI仕様はWWDC 2026の各セッションで段階的に公開予定とされており、企業内アプリにオンデバイスAIを組み込むための公式ルートとして整備が続いています。


対応デバイス・対応言語・提供時期と地域制限

AFM 3が活きるのは、対応するAppleデバイス上でApple Intelligence対応OS(OS 27系)を動かせる環境です。

Apple OS 27 の対応デバイス全景
Apple Vision Pro・MacBook・iPad・iPhone・Apple WatchがiOS 27 / iPadOS 27 / macOS 27 / watchOS 27 / visionOS 27を実行している例(出典:Apple Newsroom

対応デバイス 対応言語 提供時期と地域制限

ここでは、実用情報として押さえておきたい「いつ・どこで・どのデバイスで」を整理します。

対応OSと対応デバイス

対応OSと対応デバイス

WWDC 2026 の公式発表では、Apple IntelligenceとSiri AIの対象OSは次の5つです。tvOS 27はソフトウェア改善の対象ではあるものの、Apple Intelligence / Siri AIの対象には含まれません。

  • iOS 27
  • iPadOS 27
  • macOS 27
  • watchOS 27(Siri AIは後日のベータで対応)
  • visionOS 27


対応デバイスは「Apple Intelligence全体」と「AFM 3 Core Advancedを含む上位機能」で異なります。

以下の表で、両者の境界を整理しました。

区分 対応デバイス
Apple Intelligence全体 iPhone 15 Pro / Pro Max・iPhone 16以降/A17 Pro以上のiPad mini・M1以降のiPad/M1以降のMac・MacBook Neo(A18 Pro)/M2以降のApple Vision Pro/Apple Watch Series 9以降・Ultra 2以降・SE 3(Apple Intelligence対応iPhoneとペアリングされた状態が条件)
AFM 3 Core Advanced(最上位オンデバイスモデル) iPhone Air / iPhone 17 Pro / 17 Pro Max/12GB以上のM4以降iPad/12GB以上のM3以降Mac/Apple Vision Pro M5


Apple Intelligenceの基本機能はM1以降のMacやiPhone 15 Proでも利用できますが、20Bスパース活性化の AFM 3 Core Advancedは12GB以上のメモリと最新Apple silicon世代を要件としています。

エントリーモデルではAFM 3 Core(3B dense)の機能までを利用し、上位機ほどオンデバイスAIが深く動く構図です。

対応言語と日本語サポート

対応言語と日本語サポート

AFM 3を支えるApple Intelligenceは、以下の言語に対応しています。

  • 英語
  • 日本語
  • 中国語(簡体字・繁体字)
  • 韓国語
  • ドイツ語・フランス語・イタリア語・スペイン語・ポルトガル語
  • デンマーク語・オランダ語・ノルウェー語・スウェーデン語
  • トルコ語・ベトナム語


ただし、Apple Intelligence全体の対応言語とSiri AIの対応言語は段階が異なります

Apple 公式の説明では、Siri AIは「まず英語で提供開始(English to start)」とされており、他言語対応は順次拡大予定です。Apple IntelligenceのWriting Tools・Image Playground・Genmoji等の機能は日本語を含む対応言語で2026年秋に提供されますが、Siri AIの新機能を日本語で利用できる時期は別途アナウンスとなります。

またAppleは「機能ごとに対応言語・地域差がある」と注記しており、Apple Intelligenceの全機能がすべての対応言語で同時に揃うわけではない点にも注意が必要です。

国内企業の業務利用を検討する際は、「Apple Intelligenceの汎用機能は秋から日本語で使える」「Siri AIの本格利用はまず英語環境で評価し、日本語対応のアナウンスを待つ」という二段の判断軸で運用計画を組むのが現実的です。

提供時期と料金

提供時期と料金
 
Apple Intelligence(OS新機能)とSiri AIは提供スケジュールが分かれている点に注意が必要です。

以下の表で、それぞれの段階を整理しました。

区分 スケジュール
Apple Intelligence / OS新機能(iOS 27・iPadOS 27・macOS 27・watchOS 27・visionOS 27) 開発者向けベータ:2026年6月8日/パブリックベータ:2026年7月/一般向け正式提供:2026年秋(無料アップデート)
Siri AI 開発者向けベータ:2026年6月8日/ユーザー向けベータ:2026年後半(まず英語から)/正式提供・日本語対応:未公表(英語ベータ後に順次拡大予定)


OSの新機能とSiri AIの正式提供時期は同じではない点に注意してください。Siri AI本体はベータが先行し、正式提供と日本語対応のアナウンスは別タイミングになります。

基本機能の利用はOSの無料アップデートで提供され、月額サブスクリプションは発生しません。

ただし、料金面では以下の留意点があります。

  • サーバーモデルの日次制限
    画像生成(ADM 3 Cloud)などPrivate Cloud Compute経由の機能には日次の利用回数制限が設定されています。回数を超えると翌日まで待つ必要があります

  • iCloud+ 連携による利用枠拡張
    公式発表では、利用増加分のアクセス枠は多くのiCloud+ プランで提供されるとされています。サーバー側機能を多用する個人ユーザーはiCloud+ 加入が前提になる可能性があります

  • 開発者向けPCCモデルの条件付き無償
    Foundation Models frameworkのPrivate Cloud Computeモデル呼び出しは「Small Business Program参加かつ初回ダウンロード200万未満」など条件付きで無償。それ以外は別途条件が課されます


加えて、Apple Intelligenceをフルに使いたい場合は対応デバイスへの買い替えが事実上の前提条件で、ハードウェアコストは別途発生します。

地域制限|EUと中国の扱い

EU と中国の地域制限

注意すべき制限が2点あります。

地域 状況
EU Siri AIはMac / Apple Watch / Apple Vision Proが対象。iOS / iPadOSは当初対象外
中国 Apple IntelligenceとSiri AIともに、規制要件のクリアまで提供されない


これは Siri AI の Apple Newsroom 公式リリース次世代 Apple Intelligence のリリースで明示された範囲です。

中国を販売拠点に持つ企業や、EU圏でモバイルアプリを展開している企業は、ユーザー体験が地域ごとに分断される点を運用計画に織り込む必要があります。

メルマガ登録


AFM 3が示すApple AI戦略|独自路線・Google提携・NVIDIA連携の読み解き

ここまででAFM 3のモデル構成・アーキテクチャ・対応条件を整理しました。

最後に、AFM 3の発表が企業のAI戦略に与える示唆を、ケース別に読み解きます。

AFM 3が示すApple AI戦略

「Apple独自モデル」と「Google提携」が同居する構図

Apple独自モデルとGoogle提携が同居する構図

WWDC 2026後の報道では「AppleがGeminiを組み込んだ」「Geminiに頼った」という見出しが多く出ましたが、Apple Machine Learning Research の公式記事はAFM 3を「Googleと共同でカスタム構築(custom-built in collaboration with Google)」したモデル群と説明しています。

実情は以下のような分業です。

  • モデル設計と学習: AppleがGoogleと共同でカスタム構築(AFM 3・ADM 3)。Cloud Proを除く主要モデルはApple siliconに最適化し、Cloud ProはNVIDIA GPU向けに最適化
  • インフラ: AFM 3 Cloud ProのみGoogle Cloud上のNVIDIA GPUで動作。他のサーバーモデルはApple silicon上のPrivate Cloud Compute
  • ユーザー向け実行基盤: Apple IntelligenceとPrivate Cloud ComputeはAppleがすべて提供。ユーザー体験はAppleブランドとして統合


つまり「モデル構築はGoogleと共同」「ユーザー向け実行基盤はAppleが一元管理」という二段構造です。

これは「自社で全部やるApple」「他社モデルに依存する形」の二項対立ではなく、フロンティアモデルを共同開発しつつ、ユーザー体験は自社基盤で握る現実的な路線と読めます。

企業AI戦略への示唆|3つのケース別整理

企業AI戦略への示唆 3つのケース別整理

以下の表で、業種・組織タイプ別のAFM 3への向き合い方を整理します。

対象企業 いますぐ着目すべき点 AFM 3世代に向けた判断軸
自社アプリ提供企業(iOS / Mac) Foundation Models frameworkでのAFM 3利用、オンデバイスAIでユーザー体験を差別化 Siri AIのアプリ横断アクションに自社アプリを露出できる設計か
業務システム提供企業 iPad / MacクライアントでのオンデバイスAI活用、Visual Intelligenceの業務応用 機密データをCloudに送らない要件とAFM 3 Core Advancedの能力で接点が作れるか
大企業IT部門 iOS 27 / iPadOS 27への移行計画、Apple Intelligenceの従業員利用ガイドライン EU / 中国拠点での提供制限を踏まえた地域別AI利用ポリシー


支援現場の感覚として、Apple Intelligenceは「個人の生産性ツール」として位置づけられるケースが多いものの、Foundation Models frameworkが成熟するにつれて業務アプリへの組み込みが現実的な選択肢になってきています。

特にオンデバイスAIを前提にすれば、機密データを外部に出さずに自然言語処理や画像認識を業務アプリに組み込める可能性が広がります。

Apple独自路線の意味|競合との比較

Apple独自路線の意味 競合との比較

Claude Opus 4.8Gemini 3.5GPT-5.5 など、汎用フロンティアモデルは「API経由でどこからでも呼べる」性質を持ちます。

これに対してAFM 3は Appleデバイス上でしか動かない閉じた基盤です。

この設計は「ユーザーの個人データを端末から出さない」というAppleのプライバシー方針と一貫していますが、半面、企業が「AppleのモデルをWebサービスに組み込む」ような自由度はありません。

つまりAFM 3は「Appleユーザー体験を底上げするための独占基盤」であり、汎用LLMの代替にはならない、と整理するのが現実的です。

業務AI戦略の中では、AFM 3をAppleクライアント側の体験強化に使い、サーバー側は引き続きClaudeやGemini、GPT系のAPIを組み合わせる、というハイブリッド構成が無理のない選択になります。

オンデバイスAIが広がる時代の備え

オンデバイス AI が広がる時代の備え

AFM 3 Core Advancedのスパース活性化アーキテクチャは、「クラウドにつながないAIで何ができるか」の常識を一段押し上げる発表です。

エッジAIInteraction Models の文脈で語られてきた「軽量・高速・ローカル完結」のメリットが、20Bパラメータ級のモデルにも適用できるようになり始めています。

企業としては、次の3点を意識して備えるのが現実的です。

  • オンデバイスAIを前提にしたアプリ設計
    クラウド推論前提のワークフローを、オンデバイス推論で完結できる部分とサーバー側で処理する部分に切り分ける

  • 地域別ポリシーの整備
    EU / 中国でユーザー体験が分断される現実を踏まえ、各地域でのAI機能の出し分けや代替手段を準備する

  • モデル間の使い分け基準の明文化
    Apple AFM 3・Claude・Gemini・GPTを、用途・データ機密度・コストで使い分ける社内ガイドラインを整える


支援現場でも「AIを業務に組み込む」フェーズから「複数モデルを役割で使い分ける」フェーズに移っている企業が増えています。

AFM 3の登場は、その流れに「オンデバイスAI」という選択肢を強く加える出来事として位置づけられます。


AI活用を業務に定着させる

AFM 3のような新しい基盤モデルが登場するたびに、社内では「自社で使えるか」「PoCをどう設計するか」の議論が立ち上がります。

一方で多くの企業は、Apple Intelligenceの正式提供を待つよりも先に、現行のAIモデルを業務に組み込み、定型業務の自動化や知識検索の精度向上を回す段階にあります。

AI総合研究所では、PoCから全社展開までの設計、部門別ユースケース、AI運用における統制・セキュリティのチェックポイントを220ページにまとめた「AI業務自動化ガイド」を無料で公開しています。AFM 3世代を見据えた自社のAI活用戦略を整理する第一歩として活用してください。

Apple Foundation Models世代を見据えてAI活用を業務に定着させる

AI業務自動化ガイド

PoCから全社展開までの設計を1冊で

AFM 3のような最新モデルが登場しても、業務でAI価値を引き出すには「どこに組み込むか」の設計が要です。AI業務自動化ガイド(220ページ)では、PoC段階から全社展開までの進め方、部門別ユースケース、AI運用における統制・セキュリティのチェックポイントを整理しています。


まとめ

本記事では、2026年6月8日のWWDC 2026で発表された Apple Foundation Models第3世代(AFM 3) について、5モデル構成・スパース活性化アーキテクチャ・人間評価の数値・Private Cloud Computeの拡張・Siri AIと関連体験・対応条件・企業AI戦略への示唆まで、2026年6月時点の最新情報で解説しました。要点を改めて整理します。

  • AFM 3はオンデバイス2+サーバー3の5モデル構成で、AFM 3 Core / Core Advanced / Cloud / ADM 3 Cloud(Image)/ Cloud Proにより、軽さ・速さ・推論力を役割分担している

  • AFM 3 Core Advancedは20BパラメータでありながらアクティブパラメータはInstruction-Following Pruningにより1〜4Bに抑える設計。NAND保存×DRAM部分ロードでオンデバイスの限界を突破している

  • 人間評価ではAFM 3 Cloudがテキスト英語で56.0% vs 11.0%、画像理解で37.8% vs 9.6%、Conversational VoiceのTTSはMOSで +0.42と、テキスト・画像・音声すべてで前世代を大きく上回る結果が示された

  • AFM 3 Cloud ProのみがGoogle Cloud上のNVIDIA GPUで動作し、Private Cloud ComputeはNVIDIA Confidential Computing・Intel TDX・Google Titanチップでプライバシー保証を維持。Apple独自路線とパートナー活用のハイブリッド戦略

  • Siri AIはパーソナルコンテキスト・Visual Intelligence・スタンドアロンアプリ・iCloud同期を統合。Apple Intelligenceの汎用機能は日本語含む対応言語で2026年秋提供だが、Siri AI本体はまず英語で開始し他言語は順次拡大。機能ごとの言語・地域差あり、EUはSiri AI制限、中国はApple Intelligence全体が未対応


企業のAI戦略担当者にとってAFM 3は、「AppleのモデルをWebサービスに組み込む」話ではなく、「Appleデバイス上のユーザー体験が、オンデバイスAIで一段引き上げられた前提で、自社アプリ・業務システムをどう設計し直すか」という問いを突きつける動きです。

iOS 27 / iPadOS 27 / macOS 27への移行計画と、Foundation Models frameworkを活かしたオンデバイスAIの業務応用検討を、今のうちから整えておくことが、AFM 3世代を実利として取り込む第一歩になります。

監修者
坂本 将磨

坂本 将磨

Microsoft MVP・AIパートナー。LinkX Japan株式会社 代表取締役。東京工業大学大学院にて自然言語処理・金融工学を研究。NHK放送技術研究所でAI・ブロックチェーンの研究開発に従事し、国際学会・ジャーナルでの発表多数。経営情報学会 優秀賞受賞。シンガポールでWeb3企業を創業後、現在は企業向けAI導入・DX推進を支援。

AI導入の最初の窓口

お悩み・課題に合わせて活用方法をご案内いたします
お気軽にお問合せください

AI総合研究所 Bottom banner

ご相談
お問い合わせは
こちら!