2026-05-08

SubQ 1M-Previewとは？仕組み・性能・料金を徹底解説

この記事のポイント

1Mトークン以上の社内ドキュメントやコードベースをそのまま読ませたい用途なら、SubQ 1M-Previewはまず試す価値のある選択肢
ただし2026年5月時点では非公開ベータ＋技術論文未公開のため、ミッションクリティカルな案件にいきなり載せ替えるのは時期尚早
ベンチマーク勝敗は短文・推論タスクではなく「128K超の長文と低コスト」の領域で出ている。Opus・GPT-5.5・Gemini 3.1 Proとは住み分け前提で評価すべき
SubQ Codeはコードベース全体を1コンテキストに読み込める設計で、RAGや分割エージェントを組まずに済む点が最大の差別化
料金は公開されておらず「Opus・GPTの約1/5」とのみアナウンス。本格採用を判断するには、第三者検証と公式pricingの開示を待つのが妥当

監修者プロフィール

坂本将磨

フォローする

Microsoft MVP・AIパートナー。LinkX Japan株式会社代表取締役。東京工業大学大学院にて自然言語処理・金融工学を研究。NHK放送技術研究所でAI・ブロックチェーンの研究開発に従事し、国際学会・ジャーナルでの発表多数。経営情報学会優秀賞受賞。シンガポールでWeb3企業を創業後、現在は企業向けAI導入・DX推進を支援。

マイアミ拠点のAIスタートアップSubquadraticは、2026年5月5日に「SubQ 1M-Preview」を発表しました。フロンティアスケールで初めて、計算量がコンテキスト長に対して線形にしか増えない「完全サブクワドラティック」アーキテクチャを採用したと主張する大規模言語モデルです。

独自アーキテクチャ「SSA（Subquadratic Sparse Attention）」によって、研究モデルでは最大1,200万トークンまでの動作を確認し、RULER 128KではClaude Opus 4.6を上回る95.0%を記録しました。Subquadratic自身は「Transformerの二次計算量こそAI応用の最大の経済制約であり、それが外れた今、これまで成立しなかったワークロードが商用規模で動き始める」と位置づけています。

本記事では、フロンティアスケールでサブクワドラティックが解けてこなかった理由から、SSAの仕組み・ベンチマーク・解放されるユースケース・推論経済学への影響・3つのプロダクト構成・主要フロンティアモデルとの比較・現時点の制約と料金までを、公式発表と一次・二次ソースをもとに整理します。

アプローチ	利点	制限
固定パターン疎注意（Sliding Window等）	計算量を削減できる	位置ベースで固定。重要情報がパターン外にあると拾えない
状態空間モデル（Mamba・RWKV等）	線形スケーリング	固定サイズの状態に圧縮するため、長文中の事実検索精度が落ちやすい
ハイブリッド（密＋線形）	性能と効率の折衷	密注意層が支配的になり、長文で計算コストが下がりにくい
DeepSeek系の疎注意	インデックス併用で密注意より軽い	全体としてはO(n²)スケーリングが残る

コンテキスト長	注意FLOP削減	スピードアップ（B200想定）
128Kトークン	約8倍	約7.2倍
256Kトークン	—	約13.2倍
512Kトークン	—	約23.0倍
1Mトークン	約62.5倍	約52.2倍
12Mトークン	約1,000倍	—

モデル	SWE-Bench Verified スコア
Claude Opus 4.7	87.6%
SubQ 1M-Preview	81.8%
Claude Opus 4.6	80.8%
Gemini 3.1 Pro	80.6%
Deepseek 4.0 Pro	80.0%

モデル	MRCR v2 スコア
Claude Opus 4.6	78.3%
GPT-5.5	74.0%
SubQ 1M-Preview（本番）	65.9%
SubQ 研究モデル	83.0%
Gemini 3.1 Pro	26.3%

項目	SubQ 1M-Preview	Claude Opus 4.6	Claude Opus 4.7	GPT-5.5	Gemini 3.1 Pro
最大コンテキスト	1M（研究12M）	1M	1M	1M	約1M
アーキテクチャ	SSA（完全サブクワドラティック）	Transformer	Transformer	Transformer	Transformer
RULER 128K	95.0%	94.8%	—	—	—
SWE-Bench Verified	81.8%	80.8%	87.6%	—	80.6%
MRCR v2	65.9%	78.3%	—	74.0%	26.3%
提供形態	非公開ベータ	GA	GA	GA	Preview

項目	SubQ Code	Claude Code	Codex CLI
ベースモデル	SubQ 1M-Preview	Claude Opus 4.7／Opus 4.6／Sonnet 4.6など	GPT-5.5系
コードベース投入方式	全体を1コンテキストに	RAG＋必要時コンテキスト拡張	RAG＋必要時コンテキスト拡張
強み	巨大リポジトリの一括把握	エコシステムの厚さ・実績	OpenAI製品との統合
弱み	ベータ・実績不足	12M級リポジトリでは分割が必要	12M級リポジトリでは分割が必要

モデル	入力（per 1M tokens）	出力（per 1M tokens）	出典
Claude Opus 4.6	約$5	約$25	Anthropic Pricing
GPT-5.5	公式参照	公式参照	OpenAI Pricing
Gemini 3.1 Pro	標準約$2〜$4 / Batch・Flex 約$1〜$2	標準約$12〜$18 / Batch・Flex 約$6〜$9	Gemini API Pricing

SubQ 1M-Previewとは？仕組み・性能・料金を徹底解説

SubQ 1M-Previewとは？

発表の概要

Subquadratic（運営企業）の概要

長文LLMがフロンティアスケールで解けてこなかった理由

二次計算量という根本制約

既存アプローチの壁

Subquadraticのアプローチ

SubQが採用したSSA（Subquadratic Sparse Attention）の仕組み

SSAの3つの特性

SSAの効率指標

SSAの優位性が崩れる条件

SubQ 1M-Previewのベンチマーク性能

RULER 128K：「frontier-level accuracy」を強調する領域

SWE-Bench Verified：ハーネス依存を自社で認める透明性

MRCR v2：研究と本番の17ポイント差を公式が開示

Subquadraticの自己評価のトーン

ベンチマークを読む際の注意点

SubQが解放するユースケース

全コードベースを単一コンテキストに

大規模ドキュメント・契約書の単一パス分析

RAGの代替・補完としての役割

長期記憶・継続対話の再設計

SubQが変える推論経済学

「コストが主要な制約になった」という診断

「対症療法」としてのRAG・マルチエージェント

POC止まりの構想が本番化する

コスト主張の現状の限界

SubQが提供する3つのプロダクト

SubQ API

SubQ Code

SubQ Search

SubQと主要フロンティアモデルの比較

スペック・性能比較

コーディングエージェント比較

競合の他モデル比較記事

SubQ導入で注意すべき制約・懸念点

第三者による独立検証が限定的

研究モデルと本番モデルの17ポイント乖離

エージェントハーネス依存と単発実行

公開導入事例ゼロ

機密データ取扱いと学習除外規約の不透明さ

料金・利用条件の不透明さ

ベータ申請の必要性

よくある導入の失敗パターン

SubQの料金体系

公開情報の整理

競合フロンティアモデルの料金参考

料金面の意思決定基準

SubQをどう試すべきか

ケース1：長文ワークロードを既に扱っている開発チーム

ケース2：フロンティアモデルの動向をウォッチしているCTO・技術リーダー

ケース3：ミッションクリティカル業務での即時採用を検討している組織

導入判断で詰まりやすい論点

フロンティアモデルの世代交代を業務影響なく進めるなら

フロンティアモデル世代交代に備える

モデル切り替え前提のAI基盤を整える

まとめ

Claude Codeとは？主な特徴や使い方、料金体系・拡張機能まで徹底解説

GPT-5.5とは？使い方や料金、GPT-5.4との違いを解説！

DeepSeek V4とは？特徴や使い方、料金体系を徹底解説

Gemini 3とは？使い方や料金、利用上限について解説【無料】

大規模言語モデル(LLM)とは？その仕組みやAIとの違い、活用例を解説