6月 OpenRouter 排行榜深度分析
陸系模型主導流量,下半年押注誰?
若你在 Cursor 或 OpenClaw 裡仍按去年的 MMLU 榜單選「預設模型」,很可能已落後真實市場——OpenRouter 6 月資料顯示,陸系廠商已占約 46% 頭部公司份額,美國三大實驗室合計從一年前的 70% 跌至 30%。本文以台灣與港新團隊常見的 API 路由路徑為背景,依 OpenRouter 即時流量、Artificial Analysis 與 SWE-bench Pro,整理公司與模型雙榜、用量≠品質分層、情境選型速查表、Q3 發布預測與五步多模型路由驗證清單(含對照表與可執行步驟)。
📋 本文目錄
01 · OpenRouter 6月榜單全解析
OpenRouter 是目前最具參考價值的 AI 模型使用資料來源之一——它聚合全球數百萬開發者的真實呼叫量,不靠廠商自吹,只看程式碼投票。6 月榜單反映的是全球開發者真正在生產環境中信任哪個模型,遠不止「誰用的人多」。
資料來源:OpenRouter 即時流量統計、Artificial Analysis Intelligence Index、SWE-bench Pro(截至 2026 年 6 月)。本月 AI 圈大事包括:Claude Fable 5 因出口管制神秘下架、OpenAI 與 Anthropic 雙雙傳出 IPO 消息、陸系模型在 OpenRouter 的份額突破 60%(全平台 Token 口徑)。
按公司排名(週 Token 量)
| 排名 | 公司 | 來源地 | 週 Token 量 | 市占率 |
|---|---|---|---|---|
| 1 | DeepSeek | 🇨🇳 中國 | 5.13T | 17.6% |
| 2 | Anthropic | 🇺🇸 美國 | 4.34T | 14.8% |
| 3 | 🇺🇸 美國 | 3.66T | 12.5% | |
| 4 | OpenAI | 🇺🇸 美國 | 2.46T | 8.4% |
| 5 | 小米 (Xiaomi) | 🇨🇳 中國 | 2.42T | 8.3% |
| 6 | MiniMax | 🇨🇳 中國 | 2.37T | 8.1% |
| 7 | 騰訊 (Tencent) | 🇨🇳 中國 | 2.36T | 8.1% |
| 8 | 阿里 Qwen | 🇨🇳 中國 | 1.26T | 4.3% |
陸系模型合計占比:約 46%(僅統計前 10 名內已標注來源的陸系廠商)。
按模型排名(日均 Token 量 Top 10)
| 排名 | 模型 | 廠商 | 日均 Token |
|---|---|---|---|
| 1 | DeepSeek V4 Flash | DeepSeek | 619B |
| 2 | Hy3 Preview | 騰訊 | 451B |
| 3 | MiniMax M3 | MiniMax | 447B |
| 4 | MiMo-V2.5 | 小米 | 327B |
| 5 | DeepSeek V4 Pro | DeepSeek | 300B |
| 6 | Claude Opus 4.7 | Anthropic | 263B |
| 7 | Claude Opus 4.8 | Anthropic | ~200B |
| 8 | Claude Sonnet 4.6 | Anthropic | 178B |
| 9 | Gemini 3 Flash Preview | 156B | |
| 10 | Kimi K2.6 | Moonshot AI | ~150B |
可引用資料:① DeepSeek V4 Flash 日均 619B Token,為榜首;② 前 10 模型中陸系團隊占 5 席;③ Anthropic 三檔 Claude 仍合計占據大量高價值流量。
02 · 三大選型痛點拆解
1. 把排行榜當品質榜。 OpenRouter 統計的是付費意願與呼叫頻率,不是 SWE-bench 分數。DeepSeek V4 Flash 登頂主因是性價比,不代表它在最難 Agent 任務上超越 Claude Opus 4.8。
2. 忽視帳單經濟學。 一位聖地牙哥開發者的原話很能說明問題:「用 Claude 寫程式,每小時大概花 10 美元。用 DeepSeek,不到 50 美分。」若團隊無路由策略,要麼燒穿預算,要麼在關鍵任務上省錯地方。
3. 單模型鎖定帶來技術債。 Q3 2026 將是模型發布最密集季度之一(GPT-6、Opus 5、Gemini 4、DeepSeek V5 等)。硬編碼單一 provider 的團隊,將在 90 天內被迫重寫整合層——與 6 月初 OpenRouter 趨勢文 強調的 Agent 選型邏輯一脈相承。
03 · 最大故事:一年之內美國模型從 70% 暴跌到 30%
Bloomberg 引用的 OpenRouter 與 Exponential View 資料把這件事說得很清楚:
- 2025 年 6 月:美國模型(Google + OpenAI + Anthropic 合計)占 OpenRouter 約 70% 的 Token 份額
- 2026 年 6 月:這個數字跌到了 30%
中間那 40 個百分點去哪了?全都被陸系模型吃掉了。
這不是「陸系開發者支持國產」的結果——OpenRouter 使用者主體是全球開發者,大量來自美國、歐洲、印度。他們選擇 DeepSeek、小米、MiniMax,是因為這些模型便宜、夠快、夠用。這不是品質的故事,這是經濟學的故事。
04 · 分層理解:「用量第一」≠「品質第一」
品質天花板:Claude Opus 4.8 仍是綜合能力第一
根據 Artificial Analysis Intelligence Index(截至 2026 年 5 月底):
| 模型 | 綜合品質指數 | SWE-bench Pro | 備註 |
|---|---|---|---|
| Claude Opus 4.8 | 61.4(#1) | 69.2% | 長上下文與 Agent 領先 |
| GPT-5.5 | 59–60 | 63.1% | 生態與工具呼叫快 |
| Gemini 3.1 Pro | 57 | — | 最難推理任務 |
| Qwen 3.7 Max | 57 | — | 陸系閉源旗艦 |
| Claude Sonnet 4.6 | — | 80.8%(Verified) | 寫作與指令遵循 |
一位工程師在實測 20 個任務後的結論:Claude Opus 4.8 贏了 16 個,GPT-5.5 贏了 5 個,Gemini 3.1 Pro 贏了 4 個。特別是長上下文任務,Opus 幾乎是碾壓級別。
另需說明 Claude Fable 5:它在所有榜單上拿下滿分品質評級(100/100),但因政府出口管制於 2026 年 6 月中旬全球下架,目前狀態未定。它的存在說明:美國頂尖模型在純能力層面仍然領先。詳見站內 Fable 5 封禁與替代方案。
用量冠軍:陸系模型靠性價比統治日常任務
陸系模型拿到高用量份額,核心邏輯三條:
- 價格:MiniMax M3 的 API 定價僅 $0.60/M 輸入 token,約為 Claude Opus 4.8($5.00/M)的 1/8
- 夠用:日常程式輔助、程式碼補全、翻譯、摘要等任務,陸系模型能達到頂級模型 80–90% 的效果
- 開放權重:DeepSeek V4、MiniMax M3 等提供開放權重,企業可在自有伺服器自部署,消除資料隱私顧慮
達拉斯開發者描述其技術棧:「複雜任務每月 $500 Claude + ChatGPT,日常 90% 編碼與語音辨識每月 $200 MiniMax + Kimi + MiMo。」 playbook:按複雜度路由,按成本優化。
05 · 各情境最優選擇速查表(2026 年 6 月版)
| 情境 | 推薦模型 | 理由 |
|---|---|---|
| 複雜程式碼 / Agent | Claude Opus 4.8 | 綜合能力第一,長上下文無敵 |
| 日常程式輔助 | DeepSeek V4 Flash / MiMo-V2.5 | 性價比極高,速度快 |
| 超高性價比 API | MiniMax M3 | $0.60/M,開放權重,可自部署 |
| 長上下文處理 | Kimi K2.6(1M context) | 超長視窗,價格合理 |
| Google 生態整合 | Gemini 3.5 Flash | Google Workspace 原生支援 |
| 即時 Web 搜尋 | Grok 4.3 | X/Twitter 即時內容取得 |
| 自建本地部署 | GLM 5.2 / Kimi K2.6 | 頂級開放權重模型 |
| 圖像生成 | ChatGPT Images 2.0 | 文字渲染最強 |
| 最佳日常對話 | GPT-5.5 | 較 GPT-5.3 幻覺減少 52.5%,生態完整 |
06 · 下半年預測:即將到來的「模型大爆發季」
Q3 2026 很可能是 AI 史上模型發布最密集的季度。以下是目前最高置信度的預測:
| 模型 | 廠商 | 預計時間 | 核心看點 |
|---|---|---|---|
| GPT-6 | OpenAI | 2026 年 8–9 月 | 更長上下文(傳聞 1.5M token),更強 Agent 能力 |
| Claude Opus 5 | Anthropic | 2026 年 9 月前後 | 接棒 Opus 4.8,長程 Agent 全面升級 |
| Gemini 4 | 2026 年 Q3 | 多模態升級,影片理解、音訊輸入強化 | |
| DeepSeek V5 | DeepSeek | 2026 年 Q3 | 開放權重,預計參數量破 1T,對標閉源前沿 |
| GLM 5.2 | 智譜 Z.ai | 已發布 | 當前頂級開放權重之一,程式能力極強 |
| Grok 4.3+ | xAI | 2026 年 Q3 | 1M 上下文,增強即時 Web |
其中三款很可能在 8 月中旬至 9 月下旬的六週窗口內密集落地——基準榜冠軍換手速度將快於任何媒體週期。
07 · 宏觀趨勢預判(五條)
1. 競爭軸從「誰最強」轉向「誰最適合這個情境」——五大實驗室將在 90 天窗口內密集發布,理智策略是:閉源前沿處理最難 5% 任務,陸系開放權重處理剩餘 95% 日常量。
2. 陸系模型份額將繼續上升,但企業合規是上限——個人開發者 adoption 無停止跡象;企業採購受資料安全與美國國會監管約束。陸系模型或在 OpenRouter 個人流量達 70%+,Fortune 500 採購仍可能低於 30%。
3. Agent 才是真正的戰場——2026 年被定義為「Agent 從實驗轉向生產」元年。Anthropic《2026 年 AI Agent 狀態報告》顯示,近 44% 的 Claude API 呼叫來自數學和電腦任務。下半年,誰的 Agent 更穩定,誰才是真正的贏家。
4. OpenAI 和 Anthropic 雙雙 IPO 的影響——兩家公司均於 2026 年 6 月傳出 IPO 意向,將重新定價 AI 賽道估值;上市壓力可能讓定價更透明,也可能加速與陸系模型的價格戰。
5. 本地執行將在消費級硬體上突破 80% SWE-bench——預計在 2027 年內,配備 32GB 記憶體的消費級 GPU 上執行的本地模型將突破 SWE-bench 80% 程式能力門檻。本地跑「接近 Claude Opus 級別」的程式助手將不再是幻想。可對照 ds4 本地 DeepSeek 實測。
08 · 結語:利潤層正在被壓縮
這個故事的本質,是 AI 模型層的利潤正在被快速壓縮。DeepSeek 在 2025 年初的出現證明:在足夠高效的架構下,頂尖模型不需要頂尖算力。小米、騰訊、MiniMax、Moonshot 迅速複製這一結論,把模型「基礎定價」打到地板價。
美國廠商應對策略分化:OpenAI 押注生態(外掛、企業整合、DALL-E、Codex Mobile);Anthropic 死守品質高地(Claude Opus 的 Agent 能力鶴立雞群);Google 押注速度和多模態(Gemini Flash 系列是閉源性價比選項之一)。中間「品質不差但價格貴」的位置正在快速消失。
對於一般開發者與技術決策者來說,現在最值錢的能力,不是「選對最強模型」,而是「建構一個能隨時切換模型的架構」——今天的第一名,三個月後可能就不是了。
09 · 五步多模型路由驗證(HowTo)
- 租用乾淨 macOS:Mac mini M4 起,SSH 接入;與主力 Apple ID 隔離的本地使用者帳號。
- 設定 OpenRouter + 複雜度路由:沙箱
.env寫入金鑰;最難任務指向anthropic/claude-opus-4.8,日常指向deepseek/deepseek-v4-flash或minimax/minimax-m3。 - 跑 20 任務對照基準:記錄美元成本、延遲、長上下文與工具呼叫成功率——復現 Opus 贏 16 / GPT 贏 5 的測試方法論。
- 接入 Cursor 或 OpenClaw Gateway:確認切換 model ID 無需改業務程式碼;檢查 1M 上下文是否觸發閘道逾時,並確認租用節點公網頻寬足以承載長連線。
- 匯出 CSV 並釋放實例:撤銷測試金鑰,退租前擦除磁碟;將路由規則文件化供團隊複用。
# 複雜度路由範例(OpenRouter)export OPENROUTER_API_KEY="sk-or-..."# 日常:DeepSeek V4 Flash (~$0.10/M in)# 攻堅:Claude Opus 4.8 ($5.00/M in)
雖然你可以在主力 MacBook 上直接改 OpenRouter 模型 ID,但多金鑰、多 CLI、OpenClaw Gateway 與 Xcode 簽章環境疊在同一台機器,一次誤操作就可能燒穿生產配額或污染 Keychain。若你既要驗收多模型 Agent 技術棧,又要保持 Apple 生態工具鏈穩定,在獨立租用 macOS 上完成對照實驗再推廣,通常比衝動買斷頂配硬體更輕、比污染主力環境更安全——套餐見 M 系列算力定價,流程見 按天租用 Mac FAQ。