📋 本文目錄

01 · OpenRouter 6月榜單全解析

OpenRouter 是目前最具參考價值的 AI 模型使用資料來源之一——它聚合全球數百萬開發者的真實呼叫量，不靠廠商自吹，只看程式碼投票。6 月榜單反映的是全球開發者真正在生產環境中信任哪個模型，遠不止「誰用的人多」。

資料來源：OpenRouter 即時流量統計、Artificial Analysis Intelligence Index、SWE-bench Pro（截至 2026 年 6 月）。本月 AI 圈大事包括：Claude Fable 5 因出口管制神秘下架、OpenAI 與 Anthropic 雙雙傳出 IPO 消息、陸系模型在 OpenRouter 的份額突破 60%（全平台 Token 口徑）。

按公司排名（週 Token 量）

排名	公司	來源地	週 Token 量	市占率
1	DeepSeek	🇨🇳 中國	5.13T	17.6%
2	Anthropic	🇺🇸 美國	4.34T	14.8%
3	Google	🇺🇸 美國	3.66T	12.5%
4	OpenAI	🇺🇸 美國	2.46T	8.4%
5	小米 (Xiaomi)	🇨🇳 中國	2.42T	8.3%
6	MiniMax	🇨🇳 中國	2.37T	8.1%
7	騰訊 (Tencent)	🇨🇳 中國	2.36T	8.1%
8	阿里 Qwen	🇨🇳 中國	1.26T	4.3%

陸系模型合計占比：約 46%（僅統計前 10 名內已標注來源的陸系廠商）。

按模型排名（日均 Token 量 Top 10）

排名	模型	廠商	日均 Token
1	DeepSeek V4 Flash	DeepSeek	619B
2	Hy3 Preview	騰訊	451B
3	MiniMax M3	MiniMax	447B
4	MiMo-V2.5	小米	327B
5	DeepSeek V4 Pro	DeepSeek	300B
6	Claude Opus 4.7	Anthropic	263B
7	Claude Opus 4.8	Anthropic	~200B
8	Claude Sonnet 4.6	Anthropic	178B
9	Gemini 3 Flash Preview	Google	156B
10	Kimi K2.6	Moonshot AI	~150B

可引用資料：① DeepSeek V4 Flash 日均 619B Token，為榜首；② 前 10 模型中陸系團隊占 5 席；③ Anthropic 三檔 Claude 仍合計占據大量高價值流量。

02 · 三大選型痛點拆解

1. 把排行榜當品質榜。 OpenRouter 統計的是付費意願與呼叫頻率，不是 SWE-bench 分數。DeepSeek V4 Flash 登頂主因是性價比，不代表它在最難 Agent 任務上超越 Claude Opus 4.8。

2. 忽視帳單經濟學。 一位聖地牙哥開發者的原話很能說明問題：「用 Claude 寫程式，每小時大概花 10 美元。用 DeepSeek，不到 50 美分。」若團隊無路由策略，要麼燒穿預算，要麼在關鍵任務上省錯地方。

3. 單模型鎖定帶來技術債。 Q3 2026 將是模型發布最密集季度之一（GPT-6、Opus 5、Gemini 4、DeepSeek V5 等）。硬編碼單一 provider 的團隊，將在 90 天內被迫重寫整合層——與 6 月初 OpenRouter 趨勢文強調的 Agent 選型邏輯一脈相承。

03 · 最大故事：一年之內美國模型從 70% 暴跌到 30%

Bloomberg 引用的 OpenRouter 與 Exponential View 資料把這件事說得很清楚：

2025 年 6 月：美國模型（Google + OpenAI + Anthropic 合計）占 OpenRouter 約 70% 的 Token 份額
2026 年 6 月：這個數字跌到了 30%

中間那 40 個百分點去哪了？全都被陸系模型吃掉了。

這不是「陸系開發者支持國產」的結果——OpenRouter 使用者主體是全球開發者，大量來自美國、歐洲、印度。他們選擇 DeepSeek、小米、MiniMax，是因為這些模型便宜、夠快、夠用。這不是品質的故事，這是經濟學的故事。

04 · 分層理解：「用量第一」≠「品質第一」

品質天花板：Claude Opus 4.8 仍是綜合能力第一

根據 Artificial Analysis Intelligence Index（截至 2026 年 5 月底）：

模型	綜合品質指數	SWE-bench Pro	備註
Claude Opus 4.8	61.4（#1）	69.2%	長上下文與 Agent 領先
GPT-5.5	59–60	63.1%	生態與工具呼叫快
Gemini 3.1 Pro	57	—	最難推理任務
Qwen 3.7 Max	57	—	陸系閉源旗艦
Claude Sonnet 4.6	—	80.8%（Verified）	寫作與指令遵循

一位工程師在實測 20 個任務後的結論：Claude Opus 4.8 贏了 16 個，GPT-5.5 贏了 5 個，Gemini 3.1 Pro 贏了 4 個。特別是長上下文任務，Opus 幾乎是碾壓級別。

另需說明 Claude Fable 5：它在所有榜單上拿下滿分品質評級（100/100），但因政府出口管制於 2026 年 6 月中旬全球下架，目前狀態未定。它的存在說明：美國頂尖模型在純能力層面仍然領先。詳見站內 Fable 5 封禁與替代方案。

用量冠軍：陸系模型靠性價比統治日常任務

陸系模型拿到高用量份額，核心邏輯三條：

價格：MiniMax M3 的 API 定價僅 $0.60/M 輸入 token，約為 Claude Opus 4.8（$5.00/M）的 1/8
夠用：日常程式輔助、程式碼補全、翻譯、摘要等任務，陸系模型能達到頂級模型 80–90% 的效果
開放權重：DeepSeek V4、MiniMax M3 等提供開放權重，企業可在自有伺服器自部署，消除資料隱私顧慮

達拉斯開發者描述其技術棧：「複雜任務每月 $500 Claude + ChatGPT，日常 90% 編碼與語音辨識每月 $200 MiniMax + Kimi + MiMo。」 playbook：按複雜度路由，按成本優化。

05 · 各情境最優選擇速查表（2026 年 6 月版）

情境	推薦模型	理由
複雜程式碼 / Agent	Claude Opus 4.8	綜合能力第一，長上下文無敵
日常程式輔助	DeepSeek V4 Flash / MiMo-V2.5	性價比極高，速度快
超高性價比 API	MiniMax M3	$0.60/M，開放權重，可自部署
長上下文處理	Kimi K2.6（1M context）	超長視窗，價格合理
Google 生態整合	Gemini 3.5 Flash	Google Workspace 原生支援
即時 Web 搜尋	Grok 4.3	X/Twitter 即時內容取得
自建本地部署	GLM 5.2 / Kimi K2.6	頂級開放權重模型
圖像生成	ChatGPT Images 2.0	文字渲染最強
最佳日常對話	GPT-5.5	較 GPT-5.3 幻覺減少 52.5%，生態完整

06 · 下半年預測：即將到來的「模型大爆發季」

Q3 2026 很可能是 AI 史上模型發布最密集的季度。以下是目前最高置信度的預測：

模型	廠商	預計時間	核心看點
GPT-6	OpenAI	2026 年 8–9 月	更長上下文（傳聞 1.5M token），更強 Agent 能力
Claude Opus 5	Anthropic	2026 年 9 月前後	接棒 Opus 4.8，長程 Agent 全面升級
Gemini 4	Google	2026 年 Q3	多模態升級，影片理解、音訊輸入強化
DeepSeek V5	DeepSeek	2026 年 Q3	開放權重，預計參數量破 1T，對標閉源前沿
GLM 5.2	智譜 Z.ai	已發布	當前頂級開放權重之一，程式能力極強
Grok 4.3+	xAI	2026 年 Q3	1M 上下文，增強即時 Web

其中三款很可能在 8 月中旬至 9 月下旬的六週窗口內密集落地——基準榜冠軍換手速度將快於任何媒體週期。

07 · 宏觀趨勢預判（五條）

1. 競爭軸從「誰最強」轉向「誰最適合這個情境」——五大實驗室將在 90 天窗口內密集發布，理智策略是：閉源前沿處理最難 5% 任務，陸系開放權重處理剩餘 95% 日常量。

2. 陸系模型份額將繼續上升，但企業合規是上限——個人開發者 adoption 無停止跡象；企業採購受資料安全與美國國會監管約束。陸系模型或在 OpenRouter 個人流量達 70%+，Fortune 500 採購仍可能低於 30%。

3. Agent 才是真正的戰場——2026 年被定義為「Agent 從實驗轉向生產」元年。Anthropic《2026 年 AI Agent 狀態報告》顯示，近 44% 的 Claude API 呼叫來自數學和電腦任務。下半年，誰的 Agent 更穩定，誰才是真正的贏家。

4. OpenAI 和 Anthropic 雙雙 IPO 的影響——兩家公司均於 2026 年 6 月傳出 IPO 意向，將重新定價 AI 賽道估值；上市壓力可能讓定價更透明，也可能加速與陸系模型的價格戰。

5. 本地執行將在消費級硬體上突破 80% SWE-bench——預計在 2027 年內，配備 32GB 記憶體的消費級 GPU 上執行的本地模型將突破 SWE-bench 80% 程式能力門檻。本地跑「接近 Claude Opus 級別」的程式助手將不再是幻想。可對照 ds4 本地 DeepSeek 實測。

08 · 結語：利潤層正在被壓縮

這個故事的本質，是 AI 模型層的利潤正在被快速壓縮。DeepSeek 在 2025 年初的出現證明：在足夠高效的架構下，頂尖模型不需要頂尖算力。小米、騰訊、MiniMax、Moonshot 迅速複製這一結論，把模型「基礎定價」打到地板價。

美國廠商應對策略分化：OpenAI 押注生態（外掛、企業整合、DALL-E、Codex Mobile）；Anthropic 死守品質高地（Claude Opus 的 Agent 能力鶴立雞群）；Google 押注速度和多模態（Gemini Flash 系列是閉源性價比選項之一）。中間「品質不差但價格貴」的位置正在快速消失。

對於一般開發者與技術決策者來說，現在最值錢的能力，不是「選對最強模型」，而是「建構一個能隨時切換模型的架構」——今天的第一名，三個月後可能就不是了。

09 · 五步多模型路由驗證（HowTo）

租用乾淨 macOS：Mac mini M4 起，SSH 接入；與主力 Apple ID 隔離的本地使用者帳號。
設定 OpenRouter + 複雜度路由：沙箱 .env 寫入金鑰；最難任務指向 anthropic/claude-opus-4.8，日常指向 deepseek/deepseek-v4-flash 或 minimax/minimax-m3。
跑 20 任務對照基準：記錄美元成本、延遲、長上下文與工具呼叫成功率——復現 Opus 贏 16 / GPT 贏 5 的測試方法論。
接入 Cursor 或 OpenClaw Gateway：確認切換 model ID 無需改業務程式碼；檢查 1M 上下文是否觸發閘道逾時，並確認租用節點公網頻寬足以承載長連線。
匯出 CSV 並釋放實例：撤銷測試金鑰，退租前擦除磁碟；將路由規則文件化供團隊複用。

                        # 複雜度路由範例（OpenRouter）

                        export OPENROUTER_API_KEY="sk-or-..."

                        # 日常：DeepSeek V4 Flash (~$0.10/M in)

                        # 攻堅：Claude Opus 4.8 ($5.00/M in)

雖然你可以在主力 MacBook 上直接改 OpenRouter 模型 ID，但多金鑰、多 CLI、OpenClaw Gateway 與 Xcode 簽章環境疊在同一台機器，一次誤操作就可能燒穿生產配額或污染 Keychain。若你既要驗收多模型 Agent 技術棧，又要保持 Apple 生態工具鏈穩定，在獨立租用 macOS 上完成對照實驗再推廣，通常比衝動買斷頂配硬體更輕、比污染主力環境更安全——套餐見 M 系列算力定價，流程見按天租用 Mac FAQ。