AI総合研究所

SHARE

X(twiiter)にポストFacebookに投稿はてなブックマークに登録URLをコピー

AI(人工知能)の種類は?分類の全体像を“5つの軸”で整理【2025年版】

この記事のポイント

  • AIの種類は「タスク範囲」「学習方法」「入出力」「データ」「運用形態」の5つの軸で多角的に分類される
  • 実用化されているAIはすべて特化型AI(ANI)であり、汎用AI(AGI)や人工超知能(ASI)とは区別が必要
  • 生成AIは深層学習の一部に位置づけられ、LLMや拡散モデルなどがテキスト・画像・動画生成を担う
  • 識別・予測・生成などの得意領域に対し、事実保証や責任判断などの苦手領域を理解することが重要
  • 目的から逆算して入出力と運用形態を決める3ステップにより、自社に最適なAI技術を選定できる
坂本 将磨

監修者プロフィール

坂本 将磨

XでフォローフォローするMicrosoftMVP

Microsoft MVP・AIパートナー。LinkX Japan株式会社 代表取締役。東京工業大学大学院にて自然言語処理・金融工学を研究。NHK放送技術研究所でAI・ブロックチェーンの研究開発に従事し、国際学会・ジャーナルでの発表多数。経営情報学会 優秀賞受賞。シンガポールでWeb3企業を創業後、現在は企業向けAI導入・DX推進を支援。


2025年現在、生成AIの爆発的な普及により、「AIの種類」に関する用語は複雑化し、ビジネス現場での定義の混乱を招いています。特化型AIや汎用AI、機械学習と生成AIの違いなど、前提となる知識の整理が急務となっています。
本記事では、OECDやStanfordの定義を参考に、AIを「タスク範囲」「学習方法」「入出力」など5つの軸で体系的に整理し、それぞれの仕組みや得意領域、実務での活用指針を徹底解説します。

目次

AIの種類は?分類の全体像を“5つの軸”で整理【2025年版】

AIとは?“AIの種類”を学ぶ前に押さえる定義と混同ポイント

AI(人工知能)の基本定義(「AIシステム」とは何か)

なぜ今“種類の整理”が必要になったのか(生成AIで境界が崩れた)

「AI」「機械学習」「生成AI」の混同あるある

AIの種類は“1つに分類できない”|5つの分類軸で全体像をつかむ

軸1:タスク範囲(特化型/汎用/超知能)

軸2:学習方法(教師あり/教師なし/強化学習)

軸3:入出力(識別/予測/対話/生成/最適化)

軸4:扱うデータ(テキスト/画像/音声/動画/時系列/表)

軸5:運用形態(クラウド/オンプレ/エッジ、単体モデル/基盤モデル)

定番分類|ANI/AGI/ASI と「強いAI/弱いAI」を最短で整理

特化型AI(ANI: Artificial Narrow Intelligence)

汎用AI(AGI: Artificial General Intelligence)

人工超知能(ASI: Artificial Superintelligence)

「強いAI/弱いAI」との関係(用語混同の整理)

技術で見るAI|機械学習・深層学習・生成AI(基盤モデル)の関係

機械学習(Machine Learning)

深層学習(Deep Learning)

生成AI(Generative AI)

基盤モデル(Foundation Model)とは何か

生成AIの種類|テキスト・画像・音声・動画・マルチモーダル・エージェント

テキスト生成:「LLM (Large Language Model)」

画像生成:「Diffusion Model (拡散モデル)」など

音声:「ASR (Automatic Speech Recognition)」と「<strong>TTS (Text-to-Speech)</strong>」

動画生成(テキスト/画像→動画)

マルチモーダル(テキスト+画像+音声)

AIエージェント(ツール実行)とRAG(検索拡張)

“種類”から逆算する|AIは何ができて、何が苦手か(誤解を潰す)

識別・分類が得意な領域(画像/音声/異常検知)

予測・最適化が得意な領域(需要/在庫/ルーティング)

生成が得意な領域(文章/要約/アイデア/下書き)

苦手な領域(事実保証、責任判断、最新性、機密前提)

活用例|分類→ユースケースに接続して“使い分け”を完成させる

個人利用(学習・文章・検索・日常タスク)

ビジネス利用(営業/マーケ/CS/人事/法務)

開発・データ分析(コーディング、要約、分析支援)

現場・製造・物流(検査、予知保全、最適化)

FAQ|AIの種類でよくある質問(検索クエリ回収)

ChatGPTはANIなの?AGIなの?

機械学習と生成AIはどっちが上位概念?

AGIはもう実現している?

「AIエージェント」と「生成AI」は同じ?

まとめ|AIの種類を“選ぶ道具”にする(3ステップ)

ステップ1:目的(何を良くしたいか)を言語化

ステップ2:入出力(識別/予測/生成/最適化)を決める

ステップ3:データ種類と運用形態(クラウド/エッジ)を決める

AIの種類は?分類の全体像を“5つの軸”で整理【2025年版】

「AIの種類」と聞くと、特化型AI / 汎用AI(AGI) / 生成AIなど、いろいろな言葉が混ざって出てきます。実は、AIは「1つの基準」でキレイに分類できるものではなく、目的・技術・入出力・データ・運用といった複数の軸が折り重なっています。

本記事では、OECDやIBM、Stanfordのレポートなどの定義・整理をベースにしながら、AIの「種類」とその仕組みを、5つの分類軸に分けて解説します。導入方法や価格、規制の詳細には踏み込まず、「そもそもAIにはどんな種類があり、何が得意で何が苦手か」を理解することに集中します。


AIとは?“AIの種類”を学ぶ前に押さえる定義と混同ポイント

まずは、「AIとは何か」という定義を押さえないと、「AIの種類」を整理してもすぐに混乱してしまいます。AI=生成AIでもなく、AI=ChatGPTでもありません。ここでは、国際機関の定義をベースに、AI / 機械学習 / 生成AIの境界を一度きれいに言語化しておきます。

AI(人工知能)の基本定義(「AIシステム」とは何か)

国際機関であるOECDは、2023年に**AIシステム(AI system)**の定義をアップデートしています。要約すると、AIシステムとは次のようなものです。

機械ベースのシステムで、明示的または暗黙的な目的に向けて、与えられた入力から**推論(inference)**を行い、予測・コンテンツ・推奨・意思決定などの出力を生成し、物理・仮想環境に影響を与えるもの。自律性や適応性の度合いはシステムによって異なる。

この定義から分かるポイントは、次の3つです。

  1. 「推論」を行う機械システムであること
    ルールベースの「もし〜なら〜」だけではなく、入力からパターンを見つけて出力を決める仕組みが含まれます。

  2. 出力の形はさまざまであること
    文章や画像、数値の予測、レコメンド、意思決定の提案など、特定の形式に限定されません。

  3. 環境に影響を与えること
    Webのレコメンドから工場の制御まで、現実世界や仮想空間で何らかの行動に結びつきます。

このように、AIとは「人間のように振る舞うソフトウェア」だけを指しているわけではなく、推論を通じて判断・予測などを行う幅広いシステムの総称だと理解しておくと、その後の分類が楽になります。

なぜ今“種類の整理”が必要になったのか(生成AIで境界が崩れた)

2023〜2025年にかけて、生成AI(Generative AI)や大規模言語モデル(LLM)が一気に普及しました。Stanfordの「AI Index 2025」によると、世界の企業におけるAI利用率は、2023年の約55%から2024年には約78%まで伸びています。生成AIだけでも、2024年に約339億ドルの民間投資を集め、全AI投資の2割以上を占めています。

こうした急速な普及により、「AI=ChatGPTのような対話型サービス」「AI=文章や画像を“生成”するもの」というイメージが強くなりました。しかし実際には、需要予測や異常検知、顔認証、広告配信の最適化など、生成を伴わないAIシステムが広く使われています。

その結果、

  • 「AI」と「生成AI」
  • 「AI」と「機械学習」
  • 「AI」と「ロボット・自動化」

といった言葉が一緒くたに語られ、議論の前提がバラバラになりやすい状況が生まれています。だからこそ、2025年の今あらためて、AIの種類を軸ごとに整理し直すことが重要になっています。

「AI」「機械学習」「生成AI」の混同あるある

この混乱は、実務の場でもよく見られます。典型的な「あるある」を先に整理しておきます。

まず、よくある誤解のパターンを、代表例とあわせて見てみましょう。

  • AI=生成AIだと思っている
    • 例:「うちの会社はAIを使っていない」→ 実は需要予測やレコメンドに機械学習を使っている。

  • AI=ChatGPTだと思っている
    • 例:「AI禁止」と言いつつ、クラウドのレコメンドや自動運転機能は使っている。

  • 機械学習と生成AIを上下関係で捉えている
    • 例:「生成AIは機械学習の上位概念ですよね?」→ 実際には、「どう学習するか」と「何を生成するか」が別軸。

このような混同を避けるコツは、**「いま自分はどの軸の話をしているか」**を意識することです。本記事では、以降でその「軸」を5つに整理し、混乱しがちな用語を少しずつほどいていきます。


AIの種類は“1つに分類できない”|5つの分類軸で全体像をつかむ

ここからは、「AIの種類」を5つの分類軸で俯瞰していきます。1つのAIシステムは、たとえば「特化型AI × 教師あり学習 × 予測タスク × 時系列データ × クラウド運用」といった形で、複数の軸にまたがって位置づけられます。

まずは、5軸の全体像を表で整理しておきます。

AIを理解する際に便利な「5つの分類軸」と、代表的なカテゴリ・例・読者メリットは次のとおりです。

分類軸 カテゴリ例 代表例 読者メリット(何が分かるか)
タスク範囲 特化型AI(ANI) / 汎用AI(AGI) / 人工超知能(ASI) 画像認識モデル、ChatGPT(現状は高機能な特化型AIに分類) 「どこまでできるAIなのか(専門特化か汎用か)」を判断できる
学習方法 教師あり学習 / 教師なし学習 / 強化学習 需要予測モデル、クラスタリング、ゲームAI 「どうやって賢くなっているか」を理解し、データ準備を考えやすくなる
入出力 識別 / 予測 / 対話 / 生成 / 最適化 スコアリング、チャットボット、生成AIライティング、ルート最適化 「どんな入出力に向いているか」を把握し、用途とのマッチングに使える
扱うデータ テキスト / 画像 / 音声 / 動画 / 時系列 / 表形式 LLM、画像分類モデル、音声認識、需要予測 「自分が持っているデータで何ができるか」をイメージしやすくなる
運用形態 クラウド / オンプレ / エッジ、単体モデル / 基盤モデル クラウドAPI型LLM、オンプレの予測モデル、スマホのオンデバイスAI 「セキュリティ・レイテンシ・コスト」を含めた運用イメージを持てる

軸1:タスク範囲(特化型/汎用/超知能)

1つ目の軸は、**「どこまでの範囲を扱えるAIか」**です。代表的な分類は次の3つです。

  • 特化型AI(ANI: Artificial Narrow Intelligence)
    1つのタスクに特化したAI。画像認識、音声認識、レコメンド、文章生成など、現実に稼働しているほぼすべてのAIはANIに属します。

  • 汎用AI(AGI: Artificial General Intelligence)
    人間と同程度の汎用的な知能をもち、さまざまなタスクに柔軟に適応できるとされるAI。現時点ではまだ理論・研究段階です。

  • 人工超知能(ASI: Artificial Superintelligence)
    人間の知能をあらゆる面で大きく超えるとされる仮想的なAI。SFでよく登場しますが、実用段階には至っていません。

2025年時点で、ChatGPTやその他の高度な生成AIも含めて、実用段階にあるのはすべてANIと考えられています。

軸2:学習方法(教師あり/教師なし/強化学習)

2つ目の軸は、AIがどのように「学習」しているかです。

ここでは、代表的な3つの学習パラダイムを整理します。

  • 教師あり学習(Supervised Learning)
    入力データと正解ラベルのセットから、入力→出力の対応関係を学習します。需要予測、スコアリング、分類・回帰など、多くの業務AIがこの枠に入ります。

  • 教師なし学習(Unsupervised Learning)
    正解ラベルなしのデータから、クラスタリングや次元削減などを通じて構造を見つける方法です。顧客セグメンテーションや異常検知の前処理などに使われます。

  • 強化学習(Reinforcement Learning)
    環境への行動と、その結果得られる報酬から、方策(policy)を改善していく学習方法です。ゲームAI、自動運転の制御、ロボット制御などで活用されています。


生成AIも内部的には**教師あり学習+自己教師あり学習+強化学習(RLHFなど)**といった手法が組み合わさっていますが、「学習方法」と「入出力タイプ」は別の軸だと意識すると整理しやすくなります。

軸3:入出力(識別/予測/対話/生成/最適化)

3つ目の軸は、AIがどんな入力を受け取り、どんな出力を返すかという観点です。この軸は「業務フロー」と結びつきやすいため、現場での議論で特に重要になります。

代表的なパターンは次のとおりです。

  • 識別 / 分類:画像に写った物体、メールのカテゴリ、異常の有無などを判定
  • 予測:売上・需要・故障確率・離反率など、将来や確率を推定
  • 対話:問い合わせに応答するチャットボット、音声対話システム
  • 生成:文章・画像・音声・コードなど、新しいコンテンツを生成
  • 最適化:ルート・在庫・シフトなど、制約条件の中で最適な組み合わせを提案


同じ「AIの種類」でも、入出力が違えば向いているユースケースも変わるため、「いま議論しているのはどの入出力か」を意識することが重要です。

軸4:扱うデータ(テキスト/画像/音声/動画/時系列/表)

4つ目の軸は、AIが主に扱うデータの種類です。

  • テキスト:メール、チャット、マニュアル、契約書、FAQ
  • 画像:写真、図面、スキャン画像、工場の検査画像
  • 音声:通話録音、会議録音、音声コマンド
  • 動画:監視カメラ映像、作業手順動画、教育コンテンツ
  • 時系列:センサーログ、アクセスログ、売上推移
  • 表形式(タブularデータ):顧客情報、取引履歴、在庫データ

自分の組織が「どの種類のデータをどの程度持っているか」を棚卸しすると、現実的に使えるAIの候補が見えてきます。

軸5:運用形態(クラウド/オンプレ/エッジ、単体モデル/基盤モデル)

最後の軸は、AIシステムの運用の仕方です。

代表的な選択肢は次のように整理できます。

  • クラウド型:LLM APIやクラウドの機械学習サービスを利用。初期導入が容易でスケールしやすい一方、データの持ち出し制約との調整が必要です。
  • オンプレミス型:自社データセンターや閉域環境でモデルを運用。セキュリティやレイテンシを制御しやすい代わりに、インフラや運用の負荷が上がります。
  • エッジ / オンデバイス:スマホや組み込み機器、工場設備などにAIを組み込む形です。リアルタイム性が求められる現場や、ネットワークが不安定な環境で活用されます。
  • 単体モデル vs 基盤モデル(Foundation Model):特定タスク専用に学習した小さなモデルか、多用途に使える基盤モデルをベースにファインチューニングやプロンプト設計を行うか、という違いです。

同じ「AIの種類」でも、どの運用形態を選ぶかでコスト構造もリスクも変わるため、分類軸として意識しておくと設計がスムーズになります。


定番分類|ANI/AGI/ASI と「強いAI/弱いAI」を最短で整理

ここからは、検索クエリとしてもよく見かけるANI / AGI / ASIと、「強いAI / 弱いAI」という用語を短く整理します。この章のゴールは、「用語の立ち位置」を正しく理解し、誤解を避けることです。

特化型AI(ANI: Artificial Narrow Intelligence)

**ANI(特化型AI)**は、1つのタスクまたは限られた領域に特化したAIです。IBMなどの整理でも、現在実用化されているAIシステムはすべてNarrow AIに分類されています。

代表例は次のとおりです。

  • 画像認識(不良品検査、顔認証など)
  • 音声認識(音声入力、通話文字起こし)
  • 需要予測やスコアリング
  • 文章生成・要約・翻訳を行う生成AI(LLMなど)

一見「何でも応答してくれる」ように見えるLLMも、テキスト入出力という領域に特化した強力なANIとして捉えた方が、安全な期待値設定ができます。

汎用AI(AGI: Artificial General Intelligence)

**AGI(汎用AI)**は、人間と同等レベルで、幅広いタスクに柔軟に対応できるとされるAIです。特定のタスクに限らず、学習・推論・問題解決を横断的に行えることが想定されています。

重要なのは、2025年時点で**「AGIが実現した」と合意されている事例は存在しない**という点です。多くの研究者・企業がAGIに向けた研究を進めていますが、あくまで方向性や目標として位置づけられています。

人工超知能(ASI: Artificial Superintelligence)

**ASI(人工超知能)**は、知覚・理解・創造性・判断などあらゆる面で人間の知能を大きく上回るとされる仮想的なAIです。

この概念も研究や議論の対象ではありますが、現時点では完全に理論・想像の領域にあります。映画やSF作品で描かれるAI像は、多くがASIを前提にしたものだと考えると分かりやすいでしょう。

「強いAI/弱いAI」との関係(用語混同の整理)

最後に、**「強いAI(Strong AI)」「弱いAI(Weak AI)」**という言葉との関係を整理します。

  • 一般的には、「強いAI」≒ AGI / ASI、「弱いAI」≒ ANIとして使われることが多いです。
  • ただし学術的な議論では、「意識や理解を本当に持っているか」といった哲学的な文脈で使われることもあり、文脈によって意味合いが揺れやすい用語です。

そのため実務では、「強いAI / 弱いAI」という言葉だけで議論するのではなく、

  • タスク範囲の分類(ANI / AGI / ASI)
  • 技術的な分類(機械学習 / 深層学習 / 生成AI など)

を意識的に分けて使う方が、誤解を減らせます。


技術で見るAI|機械学習・深層学習・生成AI(基盤モデル)の関係

ここからは、AIを技術スタックの観点から整理します。AIの種類を、「学習の仕組み」や「モデル構造」で分類する軸です。ここを一度押さえておくと、ベンダー説明や研究論文の読みやすさが一気に変わります。

AI技術スタック図(学習→モデル→推論→アプリ)

機械学習(Machine Learning)

**機械学習(ML)**は、データからパターンを学習し、予測や分類を行う技術の総称です。代表的なアルゴリズムとして、線形回帰、決定木、ランダムフォレスト、勾配ブースティングなどがあります。

機械学習の特徴は、次のように整理できます。

  • 入力と出力の対応関係をデータから学習する(ルールを人がすべて書かない)
  • 比較的少量の特徴量でも動くモデルが多く、タブularデータとの相性が良い
  • モデル構造が比較的シンプルで、説明可能性が高いものも多い

多くの企業の業務AI(スコアリング、予測モデル、異常検知など)は、今でも機械学習ベースで構築されています。

深層学習(Deep Learning)

**深層学習(ディープラーニング)**は、多層のニューラルネットワークを用いた機械学習の一分野です。画像認識・音声認識・自然言語処理・生成モデルなど、近年のAIブレイクスルーの多くは深層学習によって支えられています。

特徴としては、

  • 層を深く重ねることで、データから抽象的な特徴量を自動で学習できる
  • 画像・音声・テキストなど、高次元で構造の複雑なデータに強い
  • 一方で、学習には大量のデータと計算資源が必要になりやすい

といった点が挙げられます。

生成AI(Generative AI)

生成AI(Generative AI)は、学習した分布から新しいデータを生成するモデル群を指します。テキスト生成・画像生成・音声生成・動画生成などが代表例です。

代表的なモデルには、

  • LLM(Large Language Model):文章・コード・要約などを生成
  • Diffusion Model(拡散モデル):画像や動画を生成
  • 音声生成モデル:音声合成(TTS)、声の変換 など

があり、内部的には深層学習を用いることが一般的です。つまり、生成AIは「深層学習を用いた機械学習」の一部と考えると整理しやすくなります。

基盤モデル(Foundation Model)とは何か

近年よく使われるようになったのが、**基盤モデル(Foundation Model)**という概念です。これは、非常に大規模なデータセットで事前学習され、多様な下流タスクに転移可能な汎用モデルを指します。

基盤モデルの特徴は次のとおりです。

  • 1つのモデルをもとに、プロンプト設計や追加学習で多くのユースケースに再利用できる
  • 翻訳・要約・質問応答・コーディングなど、複数タスクをひとつのモデルでカバーする
  • その分、計算資源・ガバナンス・リスク管理が重要になる

「生成AIサービスの裏側には、基盤モデルとそれを囲むツール群がある」と理解しておくと、ベンダー比較や社内導入の検討がスムーズになります。


生成AIの種類|テキスト・画像・音声・動画・マルチモーダル・エージェント

ここでは、2025年時点で実務上よく使われる生成AIの種類を、用途別に整理します。「どの種類の生成AIが、どの入出力に向いているのか」を把握することで、「どのツールを選ぶべきか」の前提ができます。

まずは、代表的なカテゴリを表で俯瞰します。

生成AIの代表カテゴリと特徴をまとめると、次のようになります。

生成カテゴリ 入力 出力 得意領域 注意点
テキスト生成(LLM) テキスト / 構造化プロンプト テキスト / コード ライティング、要約、翻訳、チャット、コーディング補助 事実誤り(ハルシネーション)、最新情報・固有名詞の扱い
画像生成(Diffusionなど) テキスト / 画像 画像 クリエイティブ制作、コンセプトアート、UI案 著作権・肖像権、生成画像の倫理・ブランド統制
音声(ASR/TTS) 音声 or テキスト テキスト or 音声 通話文字起こし、ナレーション、音声UI 固有名詞の誤認識、声真似の悪用リスク
動画生成 テキスト / 画像 / クリップ 動画 プロモーション、教育コンテンツの下書き ディープフェイク、長尺動画の品質・安定性
マルチモーダル テキスト+画像+音声など 複数形式 画像付きドキュメント理解、UI操作、マルチメディア分析 入出力が増えるほど挙動の把握が難しくなる
AIエージェント+RAG テキスト+ツール + 検索 アクション+テキスト 業務フロー自動化、システム操作、ナレッジ検索 権限管理、誤操作時の影響、ログ・監査の設計

生成AIファミリーツリー

テキスト生成:「LLM (Large Language Model)

**LLM(大規模言語モデル)**は、テキストを入力として、テキストやコードを出力する生成AIです。文章作成、要約、翻訳、質問応答、コーディングなど、もっとも幅広く活用されているカテゴリです。

LLMが得意なのは、次のようなタスクです。

  • 文書のドラフト作成(メール、レポート、記事の下書きなど)
  • 既存文書の要約・言い換え
  • ドキュメントに基づく質問応答
  • プログラムコードの生成・補完・リファクタリング

一方で、事実の保証や責任ある意思決定は得意ではありません。RAG(検索拡張生成)や人間のレビューと組み合わせて使う前提が重要になります。

画像生成:「Diffusion Model (拡散モデル)」など

画像生成では、**Diffusion Model(拡散モデル)**が主流になっています。テキストプロンプトから画像を生成したり、既存の画像を編集したりすることができます。

画像生成の活用場面としては、次のようなケースが考えられます。

  • 広告・LPのラフ画像や構図案の作成
  • UIデザインやプロトタイプのイメージ生成
  • プレゼン資料や社内資料のイラスト作成

ただし、商用利用では著作権・肖像権・ブランドガイドラインへの配慮が不可欠です。

音声:「ASR (Automatic Speech Recognition)」と「TTS (Text-to-Speech)

音声まわりの生成AIには、大きく分けて2つの系統があります。

  • ASR(自動音声認識):音声→テキスト。通話文字起こし、会議メモ作成、音声コマンドの認識などで利用されます。
  • TTS(音声合成):テキスト→音声。ナレーション、読み上げ、音声アシスタントなどに使われます。

両者を組み合わせることで、「音声で指示して、音声で返事が返ってくる対話システム」を構築できます。一方で、声真似やディープフェイク音声などのリスクも指摘されており、本人同意や利用目的の明示が重要です。

動画生成(テキスト/画像→動画)

動画生成AIは、テキストや画像を入力として、短い動画クリップを生成する技術です。2025年時点では次のような使い方が中心です。

  • プロモーション動画やトレーラーのラフ案
  • eラーニングや研修用のショート動画
  • 既存素材の短尺まとめ

このように、動画生成AIは**「完成品を丸ごと作る」よりも、構成・演出案のたたき台として使う場面が多い**のが現状です。長尺の動画や複雑なストーリーを安定して生成するには、まだ工夫が必要な段階だと考えられます。

マルチモーダル(テキスト+画像+音声)

マルチモーダルAIは、テキスト・画像・音声など複数のモダリティを同時に扱えるモデルです。たとえば、

  • 画像付きマニュアルを理解して、質問に答える
  • 画面キャプチャを読み取って、操作手順を案内する
  • 画像+テキスト+音声をまとめて要約する

といったことが可能になります。
「現場の写真+作業ログ+テキストメモ」をまとめて扱えるため、リアルな業務シーンとの相性が良いのが特徴です。

AIエージェント(ツール実行)とRAG(検索拡張)

最後に、近年注目されているのがAIエージェントと**RAG(Retrieval-Augmented Generation)**です。

  • AIエージェント:LLMなどのモデルが、外部のツールやAPIを呼び出しながらタスクを遂行する仕組み。チケット発行、ファイル操作、システム設定の変更など、実際のアクションを伴うケースが増えています。
  • RAG:社内ドキュメントやWeb検索結果を取得し、その内容を踏まえて生成するアーキテクチャ。**「モデルは覚えていないが、外部の情報源を見ながら答える」**イメージです。

これらは単体の「生成AIの種類」というより、生成AIを業務フローに組み込むためのアーキテクチャとして位置づけると分かりやすくなります。


“種類”から逆算する|AIは何ができて、何が苦手か(誤解を潰す)

ここまで見てきた「種類」を踏まえ、AIの得意・不得意を整理します。目的に対して「どこまでAIに任せられるか」を冷静に判断することが、過度な期待と過度な恐怖の両方を減らす近道です。

識別・分類が得意な領域(画像/音声/異常検知)

AI(特に機械学習・深層学習)がもっとも早くから成果を出してきたのが、識別・分類タスクです。

たとえば、次のような用途が挙げられます。

  • 製造業における画像検査(良品/不良品の判定)
  • 金融・ECでの不正検知・異常検知
  • 医療画像の補助診断
  • 通話録音の自動文字起こしと感情推定

これらは、大量のラベル付きデータが用意できる場合に特に効果を発揮します。一方で、「なぜその判定に至ったのか」を説明する仕組み(説明可能性)の設計が重要になります。

予測・最適化が得意な領域(需要/在庫/ルーティング)

次に、数値やイベントの予測・最適化も、多くの業界で成果が出ている領域です。

代表的な活用例を挙げると次のとおりです。

  • 小売・物流:需要予測、在庫最適化、配送ルート最適化
  • 製造:設備故障の予知保全、エネルギー使用量の最適化
  • 金融:信用スコアリング、リスク評価

ここでは、**「予測値をそのまま意思決定に使うか」「人間の判断の材料として使うか」**を決めておくことが重要です。NISTのAIリスク管理フレームワークでも、AIの出力をどのように人間の意思決定プロセスに組み込むかが、重要な検討ポイントとされています。

生成が得意な領域(文章/要約/アイデア/下書き)

生成AIが得意なのは、「ゼロから完璧な成果物を作る」ことよりも、「人間の作業の叩き台や加速装置になる」ことです。

具体的には、次のような場面で効果が出やすくなります。

  • メール・提案書・記事などの初稿作成や要点整理
  • 会議メモやレポートの要約・再構成
  • マインドマップ的なアイデア出し
  • コードの雛形生成やテストコード提案

一方で、「そのままコピペして外部に出す」使い方は、事実誤りや情報漏えいのリスクが高くなります。レビュー前提・補助前提で設計すると、現実的な価値を得やすくなります。

苦手な領域(事実保証、責任判断、最新性、機密前提)

AIの種類にかかわらず、2025年時点で苦手なまま残っている領域もはっきりしています。

代表的なものを挙げると次のとおりです。

  • 事実保証・真正性の担保
    生成AIは、もっともらしいが誤った情報を出すことがあります(ハルシネーション)。出典確認やRAG、ワークフロー設計が必須です。
  • 責任判断・倫理判断
    雇用・医療・法務など、人の人生に大きな影響を与える決定をAIだけに任せるのは、倫理・法規制の面からも慎重であるべきとされています。
  • 最新性の厳密な担保
    モデルの学習タイミングやデータ更新頻度により、リアルタイムの最新情報を常に反映することは難しい場合があります。
  • 機密前提の判断
    社内事情や暗黙知を前提とした判断は、モデルが前提を知らないため誤った結論に至ることがあります。

NIST AI RMFでも、こうしたリスクを**「設計段階からどう軽減するか」**が重要とされています。AIの種類を理解したうえで、「どこからどこまでAIに任せ、どこから人の責任にするか」をあらかじめ決めておくことが大切です。


活用例|分類→ユースケースに接続して“使い分け”を完成させる

ここまでの分類を、「実際のユースケース」と結びつけて整理します。ゴールは、読者が**「自分の目的には、どの種類のAIが効きそうか」**を判断できるようになることです。

まずは、目的別に「向いているAIの種類」をざっくりマッピングした表を示します。

目的 向くAIの種類 必要データ 期待できる効果の例
個人の学習・文章作成 LLMベースの生成AI、RAG テキスト(メモ・資料・記事) 情報収集・要約の効率化、下書き作成の時間短縮
営業・マーケ・CS テキスト生成AI、予測モデル、レコメンドAI 顧客データ、行動ログ、FAQ 提案書・メール作成の効率化、リードスコアリング、FAQ自動応答
人事・法務 生成AI+RAG、テキスト分類AI 規程、契約書、ナレッジベース 文書レビューの効率化、問い合わせ対応の標準化
開発・データ分析 コーディング支援AI、LLM、従来型ML ソースコード、ログ、表形式データ 実装・テスト・分析の生産性向上、PoCの高速化
製造・物流・現場 画像認識AI、時系列予測、最適化AI、エッジAI センサーデータ、画像、動画、在庫データ 不良検知、予知保全、ルート最適化、作業支援

個人利用(学習・文章・検索・日常タスク)

個人利用では、LLM+RAGを中心に、「情報整理と文章作成の補助」として活用するのが現実的です。

  • 学習:論文やレポートの要約、わからない概念の説明
  • 文章:メール・ブログ・資料の下書き作成とブラッシュアップ
  • 検索:検索結果をまとめた要約と、「自分向けの説明」への変換
  • 日常タスク:ToDo整理、アイデア出し、簡単な表計算の補助

このレベルでは、クラウドサービスをそのまま使う形が多く、データの機密性や保存期間に注意すれば、導入のハードルは比較的低めです。

ビジネス利用(営業/マーケ/CS/人事/法務)

ビジネス利用では、「どの分類軸を重視するか」が部門ごとに変わります。

  • 営業・マーケ:
    • 入出力軸で見ると、「テキスト生成+予測」の組み合わせが中心。
    • 提案書のドラフト生成、リードスコアリング、キャンペーンのABテストなど。
  • CS(カスタマーサポート):
    • 生成AI+RAG+対話がキー。
    • FAQやマニュアルをもとにしたチャットボット、エージェント支援ツールなど。
  • 人事・法務:
    • テキスト分類+生成+RAGを組み合わせ、契約書レビューや規程説明の補助に使うケースが増えています。

このレイヤーでは、AIの種類だけでなく、ログ管理・権限管理・ガバナンスが重要な設計要素になります。

開発・データ分析(コーディング、要約、分析支援)

開発・分析領域では、

  • コーディング支援AI(LLMベース)
  • 従来型の機械学習モデル(予測・クラスタリングなど)
  • 生成AIを使った自然言語インターフェース付きBI

などが広く使われています。

ここでは、「タスク範囲(特化型か)」「学習方法(教師ありか)」よりも、ツールチェーンとの統合性(IDE統合、CI/CD、データ基盤との連携)が成功の鍵になりやすいです。

現場・製造・物流(検査、予知保全、最適化)

現場系のユースケースでは、

  • 画像認識(検査・安全監視)
  • 時系列予測(故障予測、需要予測)
  • 最適化(ルート・シフト・在庫)

といった従来型の機械学習・深層学習+最適化が引き続き重要です。
生成AIは、現場マニュアルの要約や作業指示の生成など、「人へのコミュニケーション部分」で補助的に活用され始めています。


FAQ|AIの種類でよくある質問(検索クエリ回収)

最後に、AIの種類に関してよく検索される・聞かれる質問をまとめておきます。ここを押さえておくと、社内説明やステークホルダーとの会話がスムーズになります。

ChatGPTはANIなの?AGIなの?

2025年時点では、ChatGPTを含む主要な対話型AIは、**高機能な特化型AI(ANI)**として位置づけるのが一般的です。

多様なタスクに見えるものの、

  • 入力は主にテキスト(+場合によって画像・音声)
  • 出力も主にテキスト(+場合によって画像など)

という限定された入出力に特化しており、**人間と同等の汎用知能(AGI)を備えていると評価されているわけではありません。

「ほとんど何でも相談できる」感覚はありますが、能力の範囲という観点では、依然としてANIの枠内にあります。

機械学習と生成AIはどっちが上位概念?

厳密に言うと、

  • 機械学習(ML)は、データからパターンを学習する技術の総称
  • 生成AIは、「新しいデータを生成することに特化したAI」の機能・用途のカテゴリ

です。

ほとんどの生成AIは、内部で深層学習(ディープラーニング)という機械学習の一種を使っているため、**「生成AI ⊂ 深層学習 ⊂ 機械学習 ⊂ AI」**という包含関係で捉えると整理しやすくなります。

AGIはもう実現している?

現時点(2025年12月)で、「AGIが実現した」と国際的に合意されている事例はありません。

一部の企業や研究者が「AGIに近づきつつある」と表現することはありますが、評価基準や定義も議論の途上にあり、コンセンサスは形成されていません。

実務では、「AGIが来るかどうか」よりも、今存在しているANIや生成AIで、どの業務をどこまで改善できるかにフォーカスした方が、意思決定に役立ちます。

「AIエージェント」と「生成AI」は同じ?

AIエージェント生成AIは、重なりはあるものの同じ概念ではありません。

  • 生成AI:テキスト・画像・音声などを生成するモデルやサービス
  • AIエージェント:生成AI(多くはLLM)をコアにしつつ、ツール実行・外部API・ワークフローと組み合わせて、タスクを自律的に遂行する仕組み

と整理すると分かりやすいです。
つまり、**「エージェントの頭脳として生成AIを使う」**イメージで捉えると、両者の関係がスッキリします。


まとめ|AIの種類を“選ぶ道具”にする(3ステップ)

ここまで、AIの種類を5つの分類軸と代表的なカテゴリに分けて整理してきました。最後に、「自分の用途で、どの分類軸を見るべきか」を決めるための3ステップをまとめます。

ステップ1:目的(何を良くしたいか)を言語化

最初に、「AIを使って何を改善したいのか」をできるだけ具体的に言葉にします。

  • コストを下げたいのか、売上を上げたいのか
  • 従業員の時間を空けたいのか、品質を安定させたいのか
  • 顧客体験を良くしたいのか、リスクを下げたいのか

目的がはっきりすると、どのタスク範囲・どの入出力にフォーカスすべきかが見えてきます。

ステップ2:入出力(識別/予測/生成/最適化)を決める

次に、目的を**「どんな入力から、どんな出力を得たいか」**に落とし込みます。

  • 画像や動画を見て「良品/不良」を判定したい → 識別・分類系のAI
  • 過去データから将来の数値を推定したい → 予測系のAI
  • 文書やメールの下書きを素早く作りたい → 生成系のAI(LLM)
  • 制約条件の中で最適な組み合わせを探したい → 最適化系のAI

入出力が決まると、生成AIが良いのか、従来型MLが良いのか、エージェントが必要なのかといった選択が現実的になります。

ステップ3:データ種類と運用形態(クラウド/エッジ)を決める

最後に、自社のデータと運用制約を確認します。

  • 手元にあるデータは、テキスト/画像/音声/時系列/表のどれか
  • 機密性や法規制の観点から、クラウドが使えるか、オンプレが必要か
  • レイテンシやオフライン要件から、エッジAIが必要か

ここまで整理したうえで、初めて「どのベンダーの、どの製品を試すか」を検討すると、PoC疲れを避けつつ、AIの種類を“選ぶ道具”として活用しやすくなります。

最後に、本記事の要点を簡単にまとめます。

  • AIには、「タスク範囲」「学習方法」「入出力」「データ」「運用形態」の5つの分類軸がある。
  • ANI / AGI / ASI は能力範囲の分類であり、機械学習・深層学習・生成AIといった技術的分類とは別軸である。
  • 生成AIは、深層学習を用いた機械学習の一部として位置づけられ、LLM・画像生成・音声・動画・マルチモーダル・エージェントなどに分かれる。
  • 得意なのは識別・予測・生成などであり、事実保証・責任判断・最新性・機密前提の判断は依然として苦手な領域として残っている。
  • 実務では、「目的→入出力→データ/運用」という3ステップでAIの種類を選ぶと、過度な期待や漠然とした不安を避けつつ、現実的な活用判断がしやすくなる。
監修者
坂本 将磨

坂本 将磨

Microsoft MVP・AIパートナー。LinkX Japan株式会社 代表取締役。東京工業大学大学院にて自然言語処理・金融工学を研究。NHK放送技術研究所でAI・ブロックチェーンの研究開発に従事し、国際学会・ジャーナルでの発表多数。経営情報学会 優秀賞受賞。シンガポールでWeb3企業を創業後、現在は企業向けAI導入・DX推進を支援。

AI導入の最初の窓口。

お悩み・課題に合わせて活用方法をご案内いたします。
お気軽にお問合せください。

AI総合研究所 Bottom banner

ご相談
お問い合わせは
こちら!