AI総合研究所

SHARE

X(twiiter)にポストFacebookに投稿はてなブックマークに登録URLをコピー

Claude Sonnet 4.5とは?主な特徴や料金、使い方を徹底解説!

この記事のポイント

  • Claude Sonnet 4.5は、Anthropicが発表した、コーディングとAIエージェント能力に特化した最新AIモデル
  • SWE-bench(コーディング)とOSWorld(PC操作)でSOTAを達成し、複雑なタスクの自律実行能力が向上
  • API料金は旧モデルから据え置き($3/MToken~)で、Web、iOS、Androidでは無料で利用可能
  • 独自のAIエージェントを構築するための「Claude Agent SDK」が正式リリース
  • コンテキスト編集やメモリツールといった新API機能で、長時間の複雑なタスク実行が可能に
坂本 将磨

監修者プロフィール

坂本 将磨

XでフォローフォローするMicrosoftMVP

Microsoft MVP・AIパートナー。LinkX Japan株式会社 代表取締役。東京工業大学大学院にて自然言語処理・金融工学を研究。NHK放送技術研究所でAI・ブロックチェーンの研究開発に従事し、国際学会・ジャーナルでの発表多数。経営情報学会 優秀賞受賞。シンガポールでWeb3企業を創業後、現在は企業向けAI導入・DX推進を支援。


「AIにもっと複雑な開発タスクを任せたい」「自律的にPCを操作してくれるAIエージェントを作りたい」——そんな開発者の期待に応える、Anthropic社の最新AIモデル「Claude Sonnet 4.5」が2025年9月30日に発表されました。
これは単なる性能向上ではなく、AIが現実世界の複雑なタスクを解決する能力を新たな次元へと引き上げる、重要な進化です。しかし、具体的に何が新しくなり、開発者にどんな可能性をもたらすのか、気になりますよね。
本記事では、この「Claude Sonnet 4.5」について、その全貌を徹底的に解説します。
SOTA(最高水準)を達成したコーディング能力、PC操作能力、料金体系、そして独自のAIエージェントを構築するための「Claude Agent SDK」まで、詳しくご紹介します。

最新モデル「Claude Sonnet 4.5」については以下の記事で解説しています。 ▶︎Claude Sonnet 4.5とは?主な特徴や料金、使い方を徹底解説!

Claude Sonnet 4.5とは?

Claude Sonnet 4.5は、Anthropicが2025年9月30日に発表した、最新の次世代AIモデルです。このモデルは、特にコーディング、AIエージェントの構築、コンピュータの利用といった分野で高い性能を発揮するよう設計されています。

Anthropicは本モデルを「世界最高のコーディングモデル」「複雑なエージェント構築に最強のモデル」と位置づけており、旧モデルと比較して、現実世界の複雑なタスクを自律的に解決する能力が大幅に向上しています。


Claude Sonnet 4.5の主要な性能と進化点

Claude Sonnet 4.5は、複数の主要なベンチマークにおいて、従来モデルの性能を上回る結果を示しています。ここでは、特に進化が著しい4つの側面について解説します。

コーディング:現実のソフトウェア開発タスクにおける性能向上

Sonnet 4.5は、ソフトウェア開発における実践的な能力が大きく向上しました。

その性能は「SWE-bench Verified」というベンチマークで示されています。これは、実際のGitHubリポジトリから収集されたバグ修正や機能追加といった課題を、AIがどの程度自力で解決できるかを測定するものです。このテストにおいて、Sonnet 4.5は77.2%のスコアを記録し、State-of-the-Art(最高水準)を達成しました。

SWE-bench Verifiedにおける各モデルの性能比較
SWE-bench Verifiedにおける各モデルの性能比較。(参考:Anthropic)

また、Anthropicの報告によると、30時間以上継続して複雑なマルチステップのタスクに集中できることが確認されています。この持続性により、大規模なコードのリファクタリングや新機能開発など、長時間を要する開発タスクへの適用が期待されます。

コンピュータ利用:PC上のタスク実行能力の向上

AIがPC上の一般的なタスクをどの程度実行できるかを測定する「OSWorld」ベンチマークにおいて、Sonnet 4.5は**61.4%**のスコアを記録しました。これは、Sonnet 4が記録した42.2%から大幅に向上した数値です。

この能力向上により、以下のような一連の操作をAIが自律的に実行できる可能性が示されました。

  • ブラウザを介したウェブサイトのナビゲーション
  • スプレッドシートへのデータ入力や集計
  • ドキュメントやスライドなどのファイルの新規作成


これにより、調査、データ入力、レポート作成といった定型的なデスクワークの自動化が、より高い精度で実現可能になります。

専門分野における推論能力

Sonnet 4.5は、汎用的なタスクに加え、高度な専門知識が求められる領域でも性能が向上しています。

金融、法律、医療、科学技術(STEM)といった分野の専門家による評価では、旧モデルであるOpus 4.1と比較して、「領域固有の知識と、それに基づいた推論能力が著しく向上した」と報告されています。

これは、モデルが専門的な文脈を理解し、より的確な分析や判断を行えるようになったことを示唆しています。

安全性とアラインメントの強化

Anthropicは、Sonnet 4.5が「過去最もアラインメント(人間の意図との整合性)が取れたフロンティアモデル」であると説明しており、安全性の向上を重視しています。

自動行動監査による問題行動スコア
自動行動監査による問題行動スコア。スコアが低いほど、モデルの挙動が安全で意図通りであることを示す。(参考:Anthropic)

このような安全性の基盤を強化することで、より自律的なタスクを安心して任せられるモデルを目指しています。


Claude Sonnet 4.5の料金・利用方法

Claude Sonnet 4.5は、一般ユーザーから開発者まで、それぞれの用途に応じて利用可能です。

一般ユーザー向けの提供形態

Web、iOS、およびAndroidで提供されているClaude.aiを通じて、誰でも無料でClaude Sonnet 4.5を利用できます。

また、有料プランに加入することで、コード実行やファイル作成(スプレッドシート、スライド、ドキュメント)といった、より高度な機能が利用可能になります。

【関連記事】
▶︎Claudeの料金プラン徹底比較!無料・有料版の違いと選び方【2025年最新】

開発者向けのAPI料金

開発者向けのAPI料金は、性能が大幅に向上した一方で、旧モデルであるClaude Sonnet 4から据え置きとなっています。

モデル名 (API) 入力 (100万トークンあたり) 出力 (100万トークンあたり)
claude-sonnet-4-5 $3 $15

利用可能なプラットフォーム

Sonnet 4.5は、Anthropicが提供するClaude Developer Platformに加え、主要なクラウドプラットフォーム上のAIサービスでも利用できます。

  • Claude Developer Platform
  • Amazon Bedrock
  • Google Cloud Vertex AI

Claude Code・Claude APIのアップデート情報

Sonnet 4.5のリリースに伴い、関連する製品や機能も大幅にアップデートされました。

Claude Codeの機能強化

AIコーディングアシスタント「Claude Code」に、Sonnet 4.5の能力を最大限に活用するための新機能が導入されました。

  • ターミナルUIの刷新:
    プロンプト履歴の検索機能(Ctrl+r)が追加され、ステータス表示が改善されるなど、ターミナル上での利便性が向上しました。

ターミナルUIの刷新
ターミナルUIの刷新 (参考:Anthropic)

  • VS Code拡張機能 (Beta):
    IDE内でClaudeによるコードの変更をリアルタイムに差分表示できるネイティブ拡張機能がベータ版としてリリースされました。

https://youtu.be/IpFG_K-1xog?si=-EgNh-3l97Lqj6LU


  • チェックポイント機能:
    コードの変更前に作業状態が自動的に保存され、「/rewind」コマンドでいつでも以前のバージョンに復元できる機能です。これにより、大規模な変更や実験的な実装を安全に行うことができます。

【期間限定】研究プレビュー「Imagine with Claude」

Sonnet 4.5のリリースを記念し、リアルタイムでソフトウェアをその場で生成する実験的なプレビュー機能「Imagine with Claude」が、Maxサブスクライバー向けに5日間限定で公開されます。

https://youtu.be/dGiqrsv530Y?si=lpbEBcOAMXTeJedQ


【開発者向け】Claude Agent SDK:自律型エージェントの構築

今回の発表の大きな柱として、開発者が独自のAIエージェントを構築するための**「Claude Agent SDK」**が正式にリリースされました。

これは、AnthropicがClaude Codeを開発するために使用してきた基盤技術を一般に公開するものです。

https://youtu.be/OZ-aLrJ0oVg?si=stdjL-cviBwM66K-

SDKの設計思想と基本ループ

SDKの設計思想は、「AIに、人間が使うのと同じコンピュータ環境へのアクセスを与える」という点にあります。ターミナルを通じたファイル操作やコマンド実行能力をAIに提供することで、コーディングに留まらない汎用的なエージェントの構築を可能にします。

SDKを用いたエージェント開発では、以下の3ステップからなるフィードバックループが基本となります。

エージェントの基本フィードバックループ
エージェントの基本フィードバックループ (参考:Anthropic)

  1. コンテキスト収集 (Gather Context): 必要な情報を集める。
  2. アクション実行 (Take Action): ツールやコードを使って具体的な作業を行う。
  3. 作業の検証 (Verify Work): 実行結果が正しいか評価し、必要なら修正する。

エージェント構築のための主要機能

この「収集→実行→検証」というフィードバックループを実現するため、Claude Agent SDKは、ループの各フェーズに対応した多岐にわたる機能を提供します。

これらは、エージェントに高度な自律性を与えるための構成要素となります。

コンテキスト収集 (Gather Context)

優れたエージェントは、初期プロンプトだけでなく、タスク遂行に必要な情報を自ら動的に取得・管理できなければなりません。SDKは、そのための強力なメカニズムを提供します。

  • Agentic Search
    「grep」や「tail」のようなbashコマンドを使い、ファイルシステムから動的に情報を検索します。エージェントが自身の作業ディレクトリを一種の外部メモリとして活用するアプローチです。
    Agentic Searchで利用されるファイルシステムの例
    Agentic Searchで利用されるファイルシステムの例 (参考:Anthropic)

  • Subagent
    特定のタスクに特化した複数のサブエージェントを並列実行し、大規模な情報収集や複雑なタスクの分担を効率化します。

  • Compaction
    エージェントが長時間稼働する際に、コンテキストウィンドウが上限に近づくと、過去の対話履歴を自動的に要約し、重要な情報を失うことなく対話を継続させます。


これらの機能を組み合わせることで、エージェントは静的なプロンプトに縛られることなく、タスクの進行に応じて動的にコンテキストを構築・維持する能力を獲得します。

アクション実行 (Take Action)

必要なコンテキストを確保した後、エージェントは環境と相互作用し、具体的なタスクを実行するための多彩なツールを必要とします。SDKは、単純なコマンド実行から複雑なコード生成、外部サービス連携まで、幅広い実行能力をエージェントに与えます。

  • Custom Tools
    開発者がエージェントの主要なアクションとして、独自のツールを定義・提供できます。

  • Bash & Scripts
    汎用的なコンピュータ操作や、柔軟な処理を可能にします。例えば、複数のコマンドをパイプで繋ぎ、ドキュメント内を検索するような複雑な処理も実行できます。
    Bashコマンドを利用してPDFファイルから情報を抽出する例
    Bashコマンドを利用してPDFファイルから情報を抽出する例 (参考:Anthropic)

  • Code Generation
    コードを介して、信頼性の高い出力を生成します。例えば、Officeファイルの生成や、特定のイベントに対応する処理ルールをコードとして記述させることが可能です。
    受信メールの処理ルールをコードとして生成する例
    受信メールの処理ルールをコードとして生成する例 (参考:Anthropic)

  • MCPs (Model Context Protocol)
    Slack、GitHub、Google Driveといった外部サービスとの認証済み連携を標準で提供し、エージェントが外部ツールをシームレスに利用できるようにします。


このように、SDKはエージェントに多様な実行手段を提供します。これにより、単純な情報応答に留まらず、実際にファイルシステムを操作したり、外部サービスと連携したりといった、具体的で実用的なタスクの自動化が可能になります。

作業の検証 (Verify Work)

信頼性の高いエージェントを構築するためには、自己修正と品質保証のメカニズムが不可欠です。SDKは、エージェントが自らの作業を評価し、エラーを特定して、より良い解決策へと反復改善するための機能を提供します。

  • ルールベース
    コードのLinting(静的解析)など、あらかじめ定義された明確なルールに基づいて出力の正しさを検証します。

  • Visual Feedback
    UIのスクリーンショットなどをモデル自身に提示し、レイアウトやデザインが要求仕様と一致しているかを視覚的に評価させます。
    生成されたHTMLメールのレイアウトを視覚的に評価する例
    生成されたHTMLメールのレイアウトを視覚的に評価する例 (参考:Anthropic)

  • LLM-as-a-judge
    別のLLMに「審査員」の役割を与え、生成物の品質やトーンといった、より曖昧な基準に基づいて出力を多角的に評価させます。


これらの検証メカニズムは、エージェントが「実行しっぱなし」になることを防ぎ、自律的な自己修正ループを形成するための鍵となります。信頼性が要求される本番環境での運用において、このような品質保証の仕組みは不可欠です。


【開発者向け】長期タスクを可能にするコンテキスト管理の新機能

AIエージェントが長時間稼働する際の技術的な課題であった「コンテキストウィンドウの限界」に対応するため、Claude Developer Platformに2つの新しいAPI機能が導入されました。

https://youtu.be/BER3EhUIyz0?si=R37KOkGlU3egHnmC

解決策1:コンテキスト編集 (Context Editing)

エージェントがタスクを実行する過程で生成された、古くなったツール呼び出しやその結果を、コンテキストウィンドウから自動的に削除する機能です。
モデルが常に最新の関連情報に集中でき、エージェントの実行可能時間が実質的に延長されます。

Context Editingによるコンテキストウィンドウの最適化
Context Editingによるコンテキストウィンドウの最適化 (参考: Anthropic)

上の図が示すように、「Context Editing」が有効化されると、古い情報(Tool Use 1, Tool Result 1など)が自動的に削除され、新しい情報を処理するための空き容量(Available Context)が確保されます。

解決策2:メモリツール (Memory Tool)

重要な情報をコンテキストウィンドウの外にあるファイルベースのシステムに永続的に保存・参照させる機能です。
コンテキスト編集によって短期的な情報が整理される一方で、メモリツールは戦略や過去の学習内容といった長期的な知識を保持する役割を担います。

これにより、エージェントはセッションを越えて知識を蓄積したり、プロジェクトの状態を維持したりすることが可能になります。データは開発者側のインフラで管理されるため、データの所在と永続性を完全にコントロールできます。

ChatGPT活用でお困りの方へ

AI総合研究所

AI総合研究所が導入から活用までサポート

ChatGPTの使い方から、業務に最適なAIツールの選定まで、専門家が無料でご相談承ります。


まとめ

2025年9月30日に発表されたClaude Sonnet 4.5は、AIの能力を新たな段階へ進めるモデルです。

  • コーディングとコンピュータ利用においてState-of-the-Artを達成し、より実践的で複雑なタスクの自律実行が可能になりました。
  • **「Claude Agent SDK」**の提供により、開発者は独自の高機能なAIエージェントを効率的に構築するための強力な基盤を手に入れました。
  • **「コンテキスト編集」と「メモリツール」**という新機能により、これまで技術的な制約であった長時間の複雑なタスクを実行するエージェントの実現性が高まりました。

これらの進化は、AIが単なる情報提供ツールから、具体的な業務を遂行する実行役へとその役割を移していくことを示唆しています。特にソフトウェア開発や専門的なデスクワークの領域において、生産性を向上させるための新たな選択肢を提供するものとなるでしょう。

監修者
坂本 将磨

坂本 将磨

Microsoft MVP・AIパートナー。LinkX Japan株式会社 代表取締役。東京工業大学大学院にて自然言語処理・金融工学を研究。NHK放送技術研究所でAI・ブロックチェーンの研究開発に従事し、国際学会・ジャーナルでの発表多数。経営情報学会 優秀賞受賞。シンガポールでWeb3企業を創業後、現在は企業向けAI導入・DX推進を支援。

関連記事

AI導入の最初の窓口

お悩み・課題に合わせて活用方法をご案内いたします
お気軽にお問合せください

AI総合研究所 Bottom banner

ご相談
お問い合わせは
こちら!