6月 OpenRouter ランキング深掘り
中国モデルがトラフィックを「掌握」、下半期は誰に賭ける?
Cursor や OpenClaw で昨年の MMLU 順位をそのまま「デフォルトモデル」にしているなら、すでに実市場から遅れている可能性があります。OpenRouter 6月データでは、中国モデルが頭部ベンダーの約 46% を占め、米国三大ラボ合計は1年前の 70% から 30% まで落ち込みました。本記事では OpenRouter 実トラフィック、Artificial Analysis、SWE-bench Pro に基づき、会社・モデル双榜、用量≠品質の層別、シーン別速查表、Q3 発表予測、五步の多モデルルーティング検証リストまでを整理します。
📋 目次
01 · OpenRouter 6月榜单の全解析
OpenRouter は、グローバル数百万開発者の実呼び出し量を集約する、現時点で最も参考になる利用データ源のひとつです。ベンダーの宣伝ではなく、コードが投じる票だけを見ます。6月榜单は「誰が多いか」以上に、本番環境でどのモデルが信頼されているかを映し出します。
データ出典:OpenRouter リアルタイム流量、Artificial Analysis Intelligence Index、SWE-bench Pro(2026年6月時点)。今月の業界ニュースには、輸出規制で Claude Fable 5 が謎の下架、OpenAI と Anthropic の IPO 報道、OpenRouter 全プラットフォーム Token 口径で中国モデルシェアが 60% を突破した動きなどが含まれます。
会社別ランキング(週間 Token 量)
| 順位 | 会社 | 所在地 | 週間 Token | シェア |
|---|---|---|---|---|
| 1 | DeepSeek | 🇨🇳 中国 | 5.13T | 17.6% |
| 2 | Anthropic | 🇺🇸 米国 | 4.34T | 14.8% |
| 3 | 🇺🇸 米国 | 3.66T | 12.5% | |
| 4 | OpenAI | 🇺🇸 米国 | 2.46T | 8.4% |
| 5 | 小米 (Xiaomi) | 🇨🇳 中国 | 2.42T | 8.3% |
| 6 | MiniMax | 🇨🇳 中国 | 2.37T | 8.1% |
| 7 | 腾讯 (Tencent) | 🇨🇳 中国 | 2.36T | 8.1% |
| 8 | 阿里 Qwen | 🇨🇳 中国 | 1.26T | 4.3% |
中国モデル合計:約 46%(上位10社内で中国と明記されたベンダーのみ集計)。
モデル別ランキング(日次 Token Top 10)
| 順位 | モデル | ベンダー | 日次 Token |
|---|---|---|---|
| 1 | DeepSeek V4 Flash | DeepSeek | 619B |
| 2 | Hy3 Preview | 腾讯 | 451B |
| 3 | MiniMax M3 | MiniMax | 447B |
| 4 | MiMo-V2.5 | 小米 | 327B |
| 5 | DeepSeek V4 Pro | DeepSeek | 300B |
| 6 | Claude Opus 4.7 | Anthropic | 263B |
| 7 | Claude Opus 4.8 | Anthropic | ~200B |
| 8 | Claude Sonnet 4.6 | Anthropic | 178B |
| 9 | Gemini 3 Flash Preview | 156B | |
| 10 | Kimi K2.6 | Moonshot AI | ~150B |
引用可能な数字:① DeepSeek V4 Flash は日次 619B Token で首位;② Top 10 のうち中国チームが 5 席;③ Anthropic の Claude 三層は依然として高付加価値トラフィックを押さえています。
02 · 選定の三大痛点
1. ランキングを品質榜と同一視する。 OpenRouter が計るのは支払意思と呼び出し頻度であり、SWE-bench スコアではありません。DeepSeek V4 Flash が頂点に立つのは主にコスパのためで、最難 Agent タスクで Claude Opus 4.8 を上回る意味ではありません。
2. 請求の経済学を軽視する。 サンディエゴの開発者の言葉が象徴的です。「Claude でコードを書くと1時間あたりだいたい 10ドル。DeepSeek なら 50セント 以下。」ルーティング戦略がなければ、予算を焼き切るか、肝心なタスクで誤って節約してしまいます。
3. 単一モデル固定が技術負債になる。 Q3 2026 はモデル発表が最も密集する四半期のひとつ(GPT-6、Opus 5、Gemini 4、DeepSeek V5 など)です。単一プロバイダにハードコードしたチームは、90日以内に統合層の書き直しを迫られる可能性があります。6月初旬の OpenRouter トレンド記事で強調した Agent 選定ロジックと同じ流れです。
03 · 最大の物語:1年で米国モデルが 70% から 30% へ
Bloomberg が引用した OpenRouter と Exponential View のデータは、構図をはっきり示しています。
- 2025年6月:米国モデル(Google + OpenAI + Anthropic 合計)が OpenRouter Token の約 70%
- 2026年6月:同指標が 30% まで低下
失われた 40 ポイントは、中国モデルが吸収しました。
これは「中国開発者が国産を支持した」話ではありません。OpenRouter ユーザーは米欧インドを含むグローバル層が中心で、DeepSeek・小米・MiniMax を選ぶ理由は安い・速い・十分使えるからです。品質の物語ではなく、経済学の物語です。
04 · 層別理解:「用量第一」≠「品質第一」
品質の天井:Claude Opus 4.8 が総合第一
Artificial Analysis Intelligence Index(2026年5月末時点)によると:
| モデル | 総合品質指数 | SWE-bench Pro | 備考 |
|---|---|---|---|
| Claude Opus 4.8 | 61.4(#1) | 69.2% | 長コンテキストと Agent で先行 |
| GPT-5.5 | 59–60 | 63.1% | エコシステムとツール呼び出しが速い |
| Gemini 3.1 Pro | 57 | — | 最難推論タスク向け |
| Qwen 3.7 Max | 57 | — | 中国閉源フラッグシップ |
| Claude Sonnet 4.6 | — | 80.8%(Verified) | ライティングと指示追従 |
あるエンジニアが 20 タスクを実測した結果、Claude Opus 4.8 が 16 勝、GPT-5.5 が 5 勝、Gemini 3.1 Pro が 4 勝でした。特に長コンテキストでは Opus が圧倒的です。
Claude Fable 5 についても触れておきます。全榜单で満点品質評価(100/100)を取ったものの、2026年6月中旬に政府の輸出規制で全世界下架され、現状は未定です。米国最前線モデルが純能力では依然リードしている証左でもあります。詳細は Fable 5 禁止と代替案をご覧ください。
用量チャンピオン:中国モデルはコスパで日常を支配
中国モデルが高い用量シェアを得る論理は三つです。
- 価格:MiniMax M3 の API は入力 $0.60/M token のみ。Claude Opus 4.8($5.00/M)の約 1/8
- 十分さ:日常のコーディング補助・補完・翻訳・要約では、トップモデルの 80–90% に到達
- オープンウェイト:DeepSeek V4、MiniMax M3 などは自社デプロイ可能で、データプライバシー懸念を下げる
ダラスの開発者のスタック例:「複雑タスクは月 $500 の Claude + ChatGPT、日常のコーディングと音声認識の90%は月 $200 の MiniMax + Kimi + MiMo。」——複雑度でルートし、コストで最適化する playbook です。
05 · シーン別最適選択速查表(2026年6月版)
| シーン | 推奨モデル | 理由 |
|---|---|---|
| 複雑コード / Agent | Claude Opus 4.8 | 総合第一、長コンテキスト最強 |
| 日常コーディング補助 | DeepSeek V4 Flash / MiMo-V2.5 | コスパ極大、高速 |
| 超高コスパ API | MiniMax M3 | $0.60/M、オープンウェイト、自デプロイ可 |
| 長コンテキスト処理 | Kimi K2.6(1M context) | 超長ウィンドウ、妥当な価格 |
| Google エコシステム統合 | Gemini 3.5 Flash | Google Workspace ネイティブ |
| リアルタイム Web 検索 | Grok 4.3 | X/Twitter リアルタイム取得 |
| 自社ローカルデプロイ | GLM 5.2 / Kimi K2.6 | トップクラスのオープンウェイト |
| 画像生成 | ChatGPT Images 2.0 | テキスト描画が最強 |
| 日常対話の最適解 | GPT-5.5 | GPT-5.3 比で幻覚52.5%減、エコシステム完備 |
06 · 下半期予測:迫る「モデル大爆発シーズン」
Q3 2026 は AI 史上、モデル発表が最も密集する四半期になる可能性が高いです。現時点で信頼度の高い予測は次のとおりです。
| モデル | ベンダー | 予想時期 | 注目点 |
|---|---|---|---|
| GPT-6 | OpenAI | 2026年8–9月 | より長いコンテキスト(噂では1.5M token)、Agent 強化 |
| Claude Opus 5 | Anthropic | 2026年9月前後 | Opus 4.8 の後継、長期 Agent 全面刷新 |
| Gemini 4 | 2026年 Q3 | マルチモーダル強化、動画理解・音声入力 | |
| DeepSeek V5 | DeepSeek | 2026年 Q3 | オープンウェイト、参数量1T超、閉源最前線に対抗 |
| GLM 5.2 | 智谱 Z.ai | リリース済み | 現トップ級オープンウェイト、コーディング強い |
| Grok 4.3+ | xAI | 2026年 Q3 | 1M コンテキスト、リアルタイム Web 強化 |
うち3モデルは 8月中旬から9月下旬の6週間に集中リリースされる見込みです——ベンチマーク首位の入れ替わりは、いかなるメディアサイクルより速くなります。
07 · マクロトレンド予測(五つ)
1. 競争軸は「誰が最強か」から「このシーンに誰が最適か」へ——五大ラボが90日で密集発表するなら、閉源最前線で最難 5%、中国オープンウェイトで残り 95% の日常量、が合理的です。
2. 中国モデルシェアは上昇継続、ただし企業コンプライアンスが上限——個人開発者の採用に歯止めは見えません。一方、企業調達はデータセキュリティと米議会の規制に縛られます。OpenRouter 個人トラフィックで中国モデルが 70%+ に達しても、Fortune 500 調達は 30% 未満に留まる可能性があります。
3. 本当の戦場は Agent——2026年は「Agent が実験から本番へ」という定義の年です。Anthropic『2026年 AI Agent 状態報告』では、Claude API 呼び出しの約 44% が数学・コンピュータタスク由来とされます。下半期、Agent の安定性が勝敗を分けます。
4. OpenAI と Anthropic の同時 IPO——両社とも2026年6月に IPO 意向が報じられ、AI セクターの評価を再定価します。上場圧力は価格透明化を促す一方、中国モデルとの価格戦争を加速させるかもしれません。
5. ローカル実行が消費者ハードで SWE-bench 80% を突破——2027 年内に、32GB 級 GPU 上のローカルモデルが SWE-bench 80% のコーディング閾値を超えると予想されます。「ほぼ Claude Opus 級」のローカルアシスタントは幻想ではなくなります。ds4 ローカル DeepSeek 実測も参照してください。
08 · 結語:利益層が圧縮されている
本質は、AI モデル層の利益が急速に圧縮されていることです。2025年初頭の DeepSeek は、十分に効率的なアーキテクチャなら最前線モデルに最前線算力は不要だと示しました。小米・腾讯・MiniMax・Moonshot が同結論を複製し、モデルの「基礎価格」を地板まで押し下げています。
米ベンダーの対応は分岐しています。OpenAI はエコシステム(プラグイン、企業統合、DALL-E、Codex Mobile)に賭ける。Anthropic は品質高地を死守(Claude Opus の Agent 能力は突出)。Google は速度とマルチモーダル(Gemini Flash 系は閉源コスパの選択肢)。「品質は悪くないが高い」中間帯は急速に消えつつあります。
一般の開発者と技術意思決定者にとって今いちばん価値があるのは、「最強モデルを当てる」ことではなく、「いつでも切り替えられるアーキテクチャを組む」ことです——今日の首位は、三か月後には別人かもしれません。
09 · 五步多モデルルーティング検証(HowTo)
- クリーンな macOS をレンタル:Mac mini M4 から、SSH 接続。主力 Apple ID と隔離したローカルユーザー。
- OpenRouter + 複雑度ルーティング設定:サンドボックス
.envに Key。最難タスクはanthropic/claude-opus-4.8、日常はdeepseek/deepseek-v4-flashまたはminimax/minimax-m3。 - 20タスク対照ベンチマーク:ドルコスト、遅延、長コンテキスト、ツール呼び出し成功率を記録——Opus 16勝 / GPT 5勝の方法論を再現。
- Cursor または OpenClaw Gateway 接続:model ID 切り替えで業務コードを変えずに確認。1M コンテキストがゲートウェイタイムアウトを起こさないか検査。
- CSV エクスポートとインスタンス返却:テスト Key 失効、退租前ディスク消去。ルールを文書化してチーム再利用。
# 複雑度ルーティング例(OpenRouter)export OPENROUTER_API_KEY="sk-or-..."# 日常:DeepSeek V4 Flash (~$0.10/M in)# 攻坚:Claude Opus 4.8 ($5.00/M in)
主力 MacBook で OpenRouter の model ID を直接いじることも可能ですが、複数 Key・複数 CLI・OpenClaw Gateway・Xcode 署名環境を同一台に重ねると、誤操作で本番クォータを焼いたり Keychain を汚したりしやすくなります。多モデル Agent スタックを検収しつつ Apple エコシステムのツールチェーンを安定させたいなら、独立したレンタル macOS で対照実験してから展開する方が、衝動買いの最上位機より軽く、主力環境の汚染より安全です。料金は M シリーズ算力料金、手順は 日次レンタル Mac FAQをご覧ください。