產業觀察 2026-07-01

6月 OpenRouter 排行榜深度分析
陸系模型主導流量,下半年押注誰?

若你在 Cursor 或 OpenClaw 裡仍按去年的 MMLU 榜單選「預設模型」,很可能已落後真實市場——OpenRouter 6 月資料顯示,陸系廠商已占約 46% 頭部公司份額,美國三大實驗室合計從一年前的 70% 跌至 30%。本文以台灣與港新團隊常見的 API 路由路徑為背景,依 OpenRouter 即時流量、Artificial Analysis 與 SWE-bench Pro,整理公司與模型雙榜、用量≠品質分層、情境選型速查表、Q3 發布預測與五步多模型路由驗證清單(含對照表與可執行步驟)。

2026年6月 OpenRouter AI 大模型排行榜與陸系模型份額分析

01 · OpenRouter 6月榜單全解析

OpenRouter 是目前最具參考價值的 AI 模型使用資料來源之一——它聚合全球數百萬開發者的真實呼叫量,不靠廠商自吹,只看程式碼投票。6 月榜單反映的是全球開發者真正在生產環境中信任哪個模型,遠不止「誰用的人多」。

資料來源:OpenRouter 即時流量統計、Artificial Analysis Intelligence Index、SWE-bench Pro(截至 2026 年 6 月)。本月 AI 圈大事包括:Claude Fable 5 因出口管制神秘下架、OpenAI 與 Anthropic 雙雙傳出 IPO 消息、陸系模型在 OpenRouter 的份額突破 60%(全平台 Token 口徑)。

按公司排名(週 Token 量)

排名公司來源地週 Token 量市占率
1DeepSeek🇨🇳 中國5.13T17.6%
2Anthropic🇺🇸 美國4.34T14.8%
3Google🇺🇸 美國3.66T12.5%
4OpenAI🇺🇸 美國2.46T8.4%
5小米 (Xiaomi)🇨🇳 中國2.42T8.3%
6MiniMax🇨🇳 中國2.37T8.1%
7騰訊 (Tencent)🇨🇳 中國2.36T8.1%
8阿里 Qwen🇨🇳 中國1.26T4.3%

陸系模型合計占比:約 46%(僅統計前 10 名內已標注來源的陸系廠商)。

按模型排名(日均 Token 量 Top 10)

排名模型廠商日均 Token
1DeepSeek V4 FlashDeepSeek619B
2Hy3 Preview騰訊451B
3MiniMax M3MiniMax447B
4MiMo-V2.5小米327B
5DeepSeek V4 ProDeepSeek300B
6Claude Opus 4.7Anthropic263B
7Claude Opus 4.8Anthropic~200B
8Claude Sonnet 4.6Anthropic178B
9Gemini 3 Flash PreviewGoogle156B
10Kimi K2.6Moonshot AI~150B

可引用資料:① DeepSeek V4 Flash 日均 619B Token,為榜首;② 前 10 模型中陸系團隊占 5 席;③ Anthropic 三檔 Claude 仍合計占據大量高價值流量。

02 · 三大選型痛點拆解

1. 把排行榜當品質榜。 OpenRouter 統計的是付費意願與呼叫頻率,不是 SWE-bench 分數。DeepSeek V4 Flash 登頂主因是性價比,不代表它在最難 Agent 任務上超越 Claude Opus 4.8。

2. 忽視帳單經濟學。 一位聖地牙哥開發者的原話很能說明問題:「用 Claude 寫程式,每小時大概花 10 美元。用 DeepSeek,不到 50 美分。」若團隊無路由策略,要麼燒穿預算,要麼在關鍵任務上省錯地方。

3. 單模型鎖定帶來技術債。 Q3 2026 將是模型發布最密集季度之一(GPT-6、Opus 5、Gemini 4、DeepSeek V5 等)。硬編碼單一 provider 的團隊,將在 90 天內被迫重寫整合層——與 6 月初 OpenRouter 趨勢文 強調的 Agent 選型邏輯一脈相承。

03 · 最大故事:一年之內美國模型從 70% 暴跌到 30%

Bloomberg 引用的 OpenRouter 與 Exponential View 資料把這件事說得很清楚:

  • 2025 年 6 月:美國模型(Google + OpenAI + Anthropic 合計)占 OpenRouter 約 70% 的 Token 份額
  • 2026 年 6 月:這個數字跌到了 30%

中間那 40 個百分點去哪了?全都被陸系模型吃掉了。

這不是「陸系開發者支持國產」的結果——OpenRouter 使用者主體是全球開發者,大量來自美國、歐洲、印度。他們選擇 DeepSeek、小米、MiniMax,是因為這些模型便宜、夠快、夠用。這不是品質的故事,這是經濟學的故事

04 · 分層理解:「用量第一」≠「品質第一」

品質天花板:Claude Opus 4.8 仍是綜合能力第一

根據 Artificial Analysis Intelligence Index(截至 2026 年 5 月底):

模型綜合品質指數SWE-bench Pro備註
Claude Opus 4.861.4(#1)69.2%長上下文與 Agent 領先
GPT-5.559–6063.1%生態與工具呼叫快
Gemini 3.1 Pro57最難推理任務
Qwen 3.7 Max57陸系閉源旗艦
Claude Sonnet 4.680.8%(Verified)寫作與指令遵循

一位工程師在實測 20 個任務後的結論:Claude Opus 4.8 贏了 16 個,GPT-5.5 贏了 5 個,Gemini 3.1 Pro 贏了 4 個。特別是長上下文任務,Opus 幾乎是碾壓級別。

另需說明 Claude Fable 5:它在所有榜單上拿下滿分品質評級(100/100),但因政府出口管制於 2026 年 6 月中旬全球下架,目前狀態未定。它的存在說明:美國頂尖模型在純能力層面仍然領先。詳見站內 Fable 5 封禁與替代方案

用量冠軍:陸系模型靠性價比統治日常任務

陸系模型拿到高用量份額,核心邏輯三條:

  1. 價格:MiniMax M3 的 API 定價僅 $0.60/M 輸入 token,約為 Claude Opus 4.8($5.00/M)的 1/8
  2. 夠用:日常程式輔助、程式碼補全、翻譯、摘要等任務,陸系模型能達到頂級模型 80–90% 的效果
  3. 開放權重:DeepSeek V4、MiniMax M3 等提供開放權重,企業可在自有伺服器自部署,消除資料隱私顧慮

達拉斯開發者描述其技術棧:「複雜任務每月 $500 Claude + ChatGPT,日常 90% 編碼與語音辨識每月 $200 MiniMax + Kimi + MiMo。」 playbook:按複雜度路由,按成本優化。

05 · 各情境最優選擇速查表(2026 年 6 月版)

情境推薦模型理由
複雜程式碼 / AgentClaude Opus 4.8綜合能力第一,長上下文無敵
日常程式輔助DeepSeek V4 Flash / MiMo-V2.5性價比極高,速度快
超高性價比 APIMiniMax M3$0.60/M,開放權重,可自部署
長上下文處理Kimi K2.6(1M context)超長視窗,價格合理
Google 生態整合Gemini 3.5 FlashGoogle Workspace 原生支援
即時 Web 搜尋Grok 4.3X/Twitter 即時內容取得
自建本地部署GLM 5.2 / Kimi K2.6頂級開放權重模型
圖像生成ChatGPT Images 2.0文字渲染最強
最佳日常對話GPT-5.5較 GPT-5.3 幻覺減少 52.5%,生態完整

06 · 下半年預測:即將到來的「模型大爆發季」

Q3 2026 很可能是 AI 史上模型發布最密集的季度。以下是目前最高置信度的預測:

模型廠商預計時間核心看點
GPT-6OpenAI2026 年 8–9 月更長上下文(傳聞 1.5M token),更強 Agent 能力
Claude Opus 5Anthropic2026 年 9 月前後接棒 Opus 4.8,長程 Agent 全面升級
Gemini 4Google2026 年 Q3多模態升級,影片理解、音訊輸入強化
DeepSeek V5DeepSeek2026 年 Q3開放權重,預計參數量破 1T,對標閉源前沿
GLM 5.2智譜 Z.ai已發布當前頂級開放權重之一,程式能力極強
Grok 4.3+xAI2026 年 Q31M 上下文,增強即時 Web

其中三款很可能在 8 月中旬至 9 月下旬的六週窗口內密集落地——基準榜冠軍換手速度將快於任何媒體週期。

07 · 宏觀趨勢預判(五條)

1. 競爭軸從「誰最強」轉向「誰最適合這個情境」——五大實驗室將在 90 天窗口內密集發布,理智策略是:閉源前沿處理最難 5% 任務,陸系開放權重處理剩餘 95% 日常量。

2. 陸系模型份額將繼續上升,但企業合規是上限——個人開發者 adoption 無停止跡象;企業採購受資料安全與美國國會監管約束。陸系模型或在 OpenRouter 個人流量達 70%+,Fortune 500 採購仍可能低於 30%

3. Agent 才是真正的戰場——2026 年被定義為「Agent 從實驗轉向生產」元年。Anthropic《2026 年 AI Agent 狀態報告》顯示,近 44% 的 Claude API 呼叫來自數學和電腦任務。下半年,誰的 Agent 更穩定,誰才是真正的贏家。

4. OpenAI 和 Anthropic 雙雙 IPO 的影響——兩家公司均於 2026 年 6 月傳出 IPO 意向,將重新定價 AI 賽道估值;上市壓力可能讓定價更透明,也可能加速與陸系模型的價格戰。

5. 本地執行將在消費級硬體上突破 80% SWE-bench——預計在 2027 年內,配備 32GB 記憶體的消費級 GPU 上執行的本地模型將突破 SWE-bench 80% 程式能力門檻。本地跑「接近 Claude Opus 級別」的程式助手將不再是幻想。可對照 ds4 本地 DeepSeek 實測

08 · 結語:利潤層正在被壓縮

這個故事的本質,是 AI 模型層的利潤正在被快速壓縮。DeepSeek 在 2025 年初的出現證明:在足夠高效的架構下,頂尖模型不需要頂尖算力。小米、騰訊、MiniMax、Moonshot 迅速複製這一結論,把模型「基礎定價」打到地板價。

美國廠商應對策略分化:OpenAI 押注生態(外掛、企業整合、DALL-E、Codex Mobile);Anthropic 死守品質高地(Claude Opus 的 Agent 能力鶴立雞群);Google 押注速度和多模態(Gemini Flash 系列是閉源性價比選項之一)。中間「品質不差但價格貴」的位置正在快速消失。

對於一般開發者與技術決策者來說,現在最值錢的能力,不是「選對最強模型」,而是「建構一個能隨時切換模型的架構」——今天的第一名,三個月後可能就不是了。

09 · 五步多模型路由驗證(HowTo)

  1. 租用乾淨 macOS:Mac mini M4 起,SSH 接入;與主力 Apple ID 隔離的本地使用者帳號。
  2. 設定 OpenRouter + 複雜度路由:沙箱 .env 寫入金鑰;最難任務指向 anthropic/claude-opus-4.8,日常指向 deepseek/deepseek-v4-flashminimax/minimax-m3
  3. 跑 20 任務對照基準:記錄美元成本、延遲、長上下文與工具呼叫成功率——復現 Opus 贏 16 / GPT 贏 5 的測試方法論。
  4. 接入 Cursor 或 OpenClaw Gateway:確認切換 model ID 無需改業務程式碼;檢查 1M 上下文是否觸發閘道逾時,並確認租用節點公網頻寬足以承載長連線。
  5. 匯出 CSV 並釋放實例:撤銷測試金鑰,退租前擦除磁碟;將路由規則文件化供團隊複用。
# 複雜度路由範例(OpenRouter)
export OPENROUTER_API_KEY="sk-or-..."
# 日常:DeepSeek V4 Flash (~$0.10/M in)
# 攻堅:Claude Opus 4.8 ($5.00/M in)

雖然你可以在主力 MacBook 上直接改 OpenRouter 模型 ID,但多金鑰、多 CLI、OpenClaw Gateway 與 Xcode 簽章環境疊在同一台機器,一次誤操作就可能燒穿生產配額或污染 Keychain。若你既要驗收多模型 Agent 技術棧,又要保持 Apple 生態工具鏈穩定,在獨立租用 macOS 上完成對照實驗再推廣,通常比衝動買斷頂配硬體更輕、比污染主力環境更安全——套餐見 M 系列算力定價,流程見 按天租用 Mac FAQ