この記事のポイント
DeepSeek-V3.1は、1モデルで「思考モード」と「非思考モード」を切り替えられるハイブリッドLLM
思考モードは数学やコーディングで、非思考モードはエージェントタスクで高い性能を発揮
API料金は2025年9月5日から新体系に移行し、シンプルで高いコストパフォーマンスを実現
Webチャット、API、ローカル環境で利用可能で、チャットテンプレートでモードを制御
競合のClaude 4.1 Opusに匹敵する性能を分野によっては示しつつ、圧倒的な価格優位性が強み

Microsoft MVP・AIパートナー。LinkX Japan株式会社 代表取締役。東京工業大学大学院にて自然言語処理・金融工学を研究。NHK放送技術研究所でAI・ブロックチェーンの研究開発に従事し、国際学会・ジャーナルでの発表多数。経営情報学会 優秀賞受賞。シンガポールでWeb3企業を創業後、現在は企業向けAI導入・DX推進を支援。
「タスクに応じてAIモデルを使い分けるのが面倒」「高性能な推論モデルはコストが高い…」そんな悩みを抱える開発者やAIユーザーに朗報です。DeepSeek社から、1つのモデルで高速応答と深い思考を両立する革新的なLLM「DeepSeek-V3.1」が登場しました。
このモデルは、エージェント時代の到来を見据え、汎用性と専門性を高いレベルで融合させています。しかし、その具体的な仕組みや性能、そして他の最先端モデルとの立ち位置の違いは、まだ十分に知られていないかもしれません。
本記事では、この「DeepSeek-V3.1」について、その全貌を徹底的に解説します。
思考/非思考モードを切り替えるハイブリッド推論の仕組み、料金体系、使い方、そしてClaude 4.1 Opusなど競合モデルとの性能比較まで、詳しくご紹介します。
最新モデル「DeepSeek V3.2」については、こちらの記事で詳しく解説しています。 ▶︎DeepSeek-V3.2とは?使い方や料金、ベンチマーク性能を徹底解説!
DeepSeek-V3.1とは?
DeepSeek-V3.1は、DeepSeekシリーズの最新モデルであり、**エージェント時代の到来を見据えて開発された、非常に強力な大規模言語モデル(LLM)**です。
このモデルの最大の特徴は、「思考(Thinking)モード」と「非思考(Non-thinking)モード」という2つの異なる動作モードをサポートするハイブリッドモデルである点です。これにより、ユーザーは単一のモデルを使いながら、タスクの性質に応じて最適な推論方法を選択できます。
具体的には、以下のような改善が施されています。
- ハイブリッド推論: 1つのモデルで、チャットテンプレートを変更することにより、複雑な問題解決に適した「思考モード」と、迅速な応答が可能な「非思考モード」を切り替えられます。
- より高速な思考: 思考モードである「DeepSeek-V3.1-Think」は、前モデルのDeepSeek-R1-0528と同等の品質の回答を、より短い時間で生成できます。
- エージェントスキルの向上: トレーニング後の最適化により、ツールの使用や複数ステップにわたるエージェントタスクの実行能力が大幅に強化されました。
このモデルは、元のDeepSeek-V3をベースに、長文コンテキストの学習フェーズを大幅に拡張して構築されており、より高度で複雑なタスクに対応可能です。
DeepSeek-V3.1のパフォーマンス
DeepSeek-V3.1は、思考モードと非思考モードの両方で、多数のベンチマークにおいて前モデルを上回る優れた性能を達成しています。
各種ベンチマーク結果
特に、数学、コーディング、エージェントタスクの分野でその性能が際立っています。以下の表は、DeepSeek-V3.1と旧モデル(DeepSeek V3, DeepSeek R1)の性能を比較したものです。
| カテゴリ | ベンチマーク(メトリック) | DeepSeek V3.1-NonThinking | DeepSeek V3 0324 | DeepSeek V3.1-Thinking | DeepSeek R1 0528 |
|---|---|---|---|---|---|
| 全般 | MMLU-Redux (EM) | 91.8 | 90.5 | 93.7 | 93.4 |
| GPQA-Diamond (Pass@1) | 74.9 | 68.4 | 80.1 | 81.0 | |
| コード | LiveCodeBench (2408-2505) (Pass@1) | 56.4 | 43.0 | 74.8 | 73.3 |
| コードエージェント | SWE Verified (Agent mode) | 66.0 | 45.4 | - | 44.6 |
| Terminal-bench (Terminus 1 framework) | 31.3 | 13.3 | - | 5.7 | |
| 数学 | AIME 2024 (Pass@1) | 66.3 | 59.4 | 93.1 | 91.4 |
表からもわかるように、特に「コードエージェント」カテゴリのSWE Verifiedでは、非思考モードが旧モデルのスコアを大幅に上回っています。また、思考モードは「数学」や「コード」のベンチマークでDeepSeek-R1を超える高いスコアを記録しており、全体的な性能向上が見て取れます。
DeepSeek-V3.1の料金
DeepSeek-V3.1のリリースに伴い、APIの料金体系が変更されます。新しい価格は2025年9月5日 16:00 (UTC) から適用されます。

新料金体系 (2025年9月5日 16:00 UTC以降)
新しい料金体系では、これまでモードごとに異なっていた価格が統一され、シンプルになります。また、これまで提供されていたオフピーク時の割引は終了します。
| 項目 | 料金 |
|---|---|
| 入力トークン(100万あたり / キャッシュヒット) | $0.07 |
| 入力トークン(100万あたり / キャッシュミス) | $0.56 |
| 出力トークン(100万あたり) | $1.68 |
現行料金体系 (新料金適用前まで)
参考として、新料金適用前までの価格を以下に示します。
| 価格種別 | モデル | deepseek-chat | deepseek-reasoner |
|---|---|---|---|
| 標準価格 | 入力トークン(キャッシュヒット) | $0.07 | $0.14 |
| (UTC 00:30-16:30) | 入力トークン(キャッシュミス) | $0.27 | $0.55 |
| 出力トークン | $1.10 | $2.19 | |
| 割引価格 | 入力トークン(キャッシュヒット) | $0.035 | $0.035 |
| (UTC 16:30-00:30) | 入力トークン(キャッシュミス) | $0.135 | $0.135 |
| 出力トークン | $0.550 | $0.550 |
モデル詳細
APIで利用可能なモデルの仕様も更新されています。特にコンテキスト長は両モードとも128Kに拡張されました。
| 項目 | deepseek-chat (非思考モード) | deepseek-reasoner (思考モード) |
|---|---|---|
| モデルバージョン | DeepSeek-V3.1 | DeepSeek-V3.1 |
| コンテキスト長 | 128K | 128K |
| 最大出力 | デフォルト: 4K / 最大: 8K | デフォルト: 32K / 最大: 64K |
| 主な機能 | Json Output, Function Calling など | Json Output, Chat Prefix Completion など |
DeepSeek-V3.1の使い方
DeepSeek-V3.1は、Webチャット、API、ローカル環境で利用できます。
1. Webチャット (chat.deepseek.com)
DeepSeekの公式ウェブサイトでは、アカウントにログイン後、「DeepThink」ボタンを切り替えることで、思考モードと非思考モードを簡単に使い分けることができます。
2. API (platform.deepseek.com)
APIを利用する場合、エンドポイントによってモードが固定されます。
- deepseek-chat : 非思考モードで動作します。
- deepseek-reasoner : 思考モードで動作します。
また、Anthropic API形式のサポートや、より厳密な関数呼び出し機能(ベータ版)も追加されています。
3. チャットテンプレート(開発者向け)
APIやローカルでモデルを直接利用する際は、特定のチャットテンプレートを使用することでモードを制御します。
- 非思考モード: ...<|Assistant|></think> のように、応答生成の直前に </think> トークンを配置します。
- 思考モード: ...<|Assistant|><think> のように、応答生成の直前に <think> トークンを配置します。
このテンプレートにより、1つのモデルが2つの異なる振る舞いをするよう制御されています。
4. ローカルでの実行
DeepSeek-V3.1のモデルはHugging Faceで公開されており、ローカル環境で実行することも可能です。
- V3.1 Baseモデル: huggingface.co/deepseek-ai/DeepSeek-V3.1-Base
- V3.1 モデル: huggingface.co/deepseek-ai/DeepSeek-V3.1
モデル構造はDeepSeek-V3と同じであるため、詳細な実行方法はDeepSeek-V3の公式リポジトリを参照してください。
競合モデルとの比較:DeepSeek-V3.1の強みと立ち位置
DeepSeek-V3.1は、他の最先端AIモデルと比較してどのような特徴を持つのでしょうか。ここでは、前モデルであるDeepSeek-R1と、業界最高峰のモデルの一つであるClaude 4.1 Opusとの比較を通じて、その立ち位置を明確にします。
DeepSeek-R1との比較
DeepSeek-V3.1は、推論に特化していたDeepSeek-R1の直接的な後継かつ上位互換と位置づけられます。
| 比較項目 | DeepSeek V3.1 | DeepSeek R1 |
|---|---|---|
| モデルコンセプト | ハイブリッドモデル(思考+非思考) | 推論特化モデル |
| 推論性能 | 向上(思考効率UP) | (旧世代の基準) |
| エージェント能力 | 追加(ツール利用が可能) | なし |
| 汎用性 | 高い(非思考モード) | 低い(推論に特化) |
| 位置づけ | 正統進化・上位互換 | 旧世代モデル |
この比較から明らかなように、DeepSeek-V3.1は単なる性能向上版ではありません。R1の強みであった推論能力をさらに効率化しつつ、非思考モードとエージェント機能を追加することで、汎用性と実践的な応用力を手に入れたコンセプトの進化形です。
あらゆる面でR1を上回っており、完全な上位互換モデルと言えます。
Claude 4.1 Opusとの比較
Claude 4.1 Opusは、特にコーディングとAIエージェント機能で業界最高水準を誇るモデルです。DeepSeek-V3.1との比較では、それぞれの強みとターゲットユーザーの違いが浮き彫りになります。
| 比較項目 | DeepSeek V3.1 | Claude 4.1 Opus |
|---|---|---|
| コーディング性能 (SWE-bench) | 66.0% | 74.5% |
| 数学的推論 (AIME 2024) | 93.1% | N/A (他ベンチマークで高スコア) |
| API料金 (100万トークン) | 入力:$0.56, 出力:$1.68 | 入力:$15, 出力:$75 |
| コストパフォーマンス | 非常に高い | (性能相応のプレミアム価格) |
| 主なターゲット | コスパを重視する開発者・企業 | 最高性能を求めるエンタープライズ |
この比較は、両モデルの明確な立ち位置の違いを示しています。現時点で最高のコーディングエージェント性能を求めるのであればClaude 4.1 Opusが優位ですが、DeepSeek-V3.1は数学的推論で非常に高い性能を示します。
そして最大の差別化要因は、圧倒的なコストパフォーマンスです。トップクラスの性能を極めて安価なAPI料金で利用できるため、コストを抑えつつ高度なAI開発を行いたい場合に、DeepSeek-V3.1は非常に強力な選択肢となります。
DeepSeek利用時の注意点
DeepSeekのサービスを利用する際には、利用規約を十分に確認し、理解しておくことが重要です。特に商用利用を検討している場合は、以下の点に注意してください。
- 準拠法および管轄裁判所: DeepSeekの利用規約は中国の法律に準拠し、紛争が生じた場合は中国の裁判所が管轄となります。これは、日本の法律や裁判所の管轄が適用されないことを意味します。
- ユーザーデータの保管場所: 入力されたデータは中国国内のサーバーに保管され、中国の法律に基づいて取り扱われる可能性があります。日本の個人情報保護法が適用されない場合があるため、機密情報や個人情報の入力には慎重な判断が求められます。
- 責任制限と保証の否認: DeepSeekは、サービスの利用によって生じたいかなる損害についても責任を負わないとし、サービスの完全性や正確性に関する保証も行いません。
利用を検討している方は、必ず最新の公式ドキュメントで利用規約とプライバシーポリシーを確認し、内容を理解した上で自己責任で利用するようにしてください。
まとめ
本記事では、DeepSeekの最新モデル「DeepSeek-V3.1」について解説しました。
DeepSeek-V3.1は、1つのモデルで「思考モード」と「非思考モード」を使い分けられる革新的なハイブリッドモデルです。前モデルと比較して思考効率が向上し、特にツール利用や複数ステップの推論といったエージェントスキルが大幅に強化されました。
APIの料金体系も2025年9月5日からシンプルで分かりやすい新価格に移行します。
DeepSeek-V3.1は、より自律的で高度なAIエージェントの開発を可能にする、非常に強力な選択肢となるでしょう。今後のAI開発におけるその活用が期待されます。










