OpenRouter 週 Token 排行
帳單數據不會說謊
若你仍用 MMLU 榜單替團隊挑「預設模型」,卻從未對照 OpenRouter 每週滾動的 Token 吞吐量,等於拿實驗室分數對抗真實帳單。本文面向多模型路由的開發者與技術主管,依 2026 年 5–6 月週榜解讀 28.9 兆 Token 週規模、中美格局與 Anthropic「溢價悖論」,並提供 Token 佔比對美元收入的決策矩陣、基準測試反轉現象,以及五步週度路由驗證清單。
📋 本文目錄
01 · 為何帳單數據比基準測試更可信
基準測試排行榜回答「在固定題庫上誰分數高」;OpenRouter 週排行回答「過去 7 天全球開發者實際燒掉多少 Token」。前者可被針對性最佳化,後者是用真錢(或免費額度)投出來的行為數據——花出去的錢不會說謊。
OpenRouter 作為中立 API 聚合層,接入 300+ 模型、覆蓋 60+ 供應商,平台月流量約 100 兆 Token 量級、使用者逾 800 萬。當某模型在週榜上連續攀升,代表生產流量正在遷移,而不只是新聞稿裡的「SOTA」。這與站內 OpenRouter 流行趨勢 互補:那篇談六大趨勢與 Agent 選型矩陣,本篇聚焦週度帳單口徑與溢價悖論。
02 · 資料來源與統計方法
公開入口:openrouter.ai/rankings。核心口徑為按週(7 天滾動)Token 吞吐量,統計輸入與輸出 Token 總量,可按模型與廠商維度下鑽。本文錨定資料包括:
- 歷史週(錨點):2026 年 5 月 18 日–5 月 24 日,全球週呼叫約 28.9 兆 Token,環比 +7.4%(連續五週上漲)。
- 最新週(2026 年 6 月初):Tool Calling 集合顯示 DeepSeek V4 Flash 約 3.14T、騰訊 Hy3 Preview 約 2.75T、Xiaomi MiMo-V2.5 約 2.3T——榜單輪動極快,閱讀時請以官網即時資料為準。
讀榜時請同時看兩欄:Token 佔比(流量主導權)與美元收入佔比(定價 × 用量加權)。只看 Token 會低估 Claude;只看收入會高估「市場仍由美國閉源壟斷」——真相在兩者之間。
03 · 三大認知痛點拆解
1. 把發表會當選型依據。 廠商展示的是最佳案例;週榜統計的是 cron、批次處理、Agent 迴圈裡失敗重試也計費的真實呼叫。DeepSeek V4 Flash 週榜登頂,背後是 Agent 工作流對「低單價 + 1M 上下文 + 工具環穩定」的集體投票,而非單次聊天體驗。
2. 忽視「Token 量 ≠ 美元收入」。 Anthropic Token 佔比約 12%(一年前約 25%),美元收入佔比仍約 46%。團隊若只追流量冠軍,可能錯過企業合規場景仍願為 Claude Opus 付溢價的現實;若只追收入榜,又會誤判「性價比開源已接管一切」。
3. 在主力機輪換模型污染環境。 每週改 OpenRouter 預設路由、在主力 Mac 上裝三套 CLI,Keychain 與全域設定極易殘留。更穩妥的做法:在可丟棄的租用 macOS 節點對照週帳單與延遲,再推廣到團隊——邏輯同 Agent Skill 隔離試跑。
04 · 全球週總量:28.9 兆 Token 與中美格局
| 指標 | 資料(5/18–5/24 週) | 環比 |
|---|---|---|
| 全球週呼叫量 | 28.9 兆 Token | +7.4% |
| 中國模型週呼叫 | 9.223 兆 Token | +19.89% |
| 美國模型週呼叫 | 4.93 兆 Token | +16.27% |
| 中國 vs 美國排名 | 中國模型連續四週週 Token 量超美國 | |
數量級感知:約一年前 OpenRouter 週處理量約 2.4 兆,至 2026 年 5 月約 28.9 兆,一年量級成長約 12 倍——AI 呼叫已從「試用」進入規模化爆發。對台港團隊而言,這代表頻寬與伺服器端延遲將成為路由決策的一等公民,而不只是模型分數。
| 時間節點 | 中國模型流量佔比(示意) |
|---|---|
| 2025 年初 | < 2% |
| 2026 年 2 月 | 首次週 Token 量超美國 |
| 2026 年 5 月 | 約 45%+,連續四週領先 |
05 · 當週模型 Top 10(多週對照)
週榜輪動極快。下表合併 5 月下旬錨點與 6 月初 Tool Calling 集合公開資料,便於理解「誰在被呼叫」而非「誰發表會最強」。
| 排名 | 模型 | 廠商 | 週 Token(量級) | 特點 |
|---|---|---|---|---|
| 1 | DeepSeek V4 Flash | DeepSeek 🇨🇳 | 3.43T → ~3.14T | Agent 首選、極低單價、1M 上下文 |
| 2 | 騰訊 Hy3 Preview | Tencent 🇨🇳 | 3.07T → ~2.75T | 開源 MoE 黑馬 |
| 3 | Owl Alpha | Stealth | ~1.15T → ~1.92T | 百萬上下文、Agent 特化 |
| 4–5 | V4 Pro / V3.2 | DeepSeek 🇨🇳 | 矩陣占位 | DeepSeek 三模型同進前列 |
| 6 | Claude Sonnet 4.6 | Anthropic 🇺🇸 | ~1.35T → ~1.77T | 企業程式主力 |
| 7 | Xiaomi MiMo-V2.5 | Xiaomi 🇨🇳 | — → ~2.3T | 6 月新晉高頻流量 |
| 8 | MiniMax M3 | MiniMax 🇨🇳 | — → ~1.68T | 長上下文性價比 |
| 9 | Step 3.7 Flash | StepFun 🇨🇳 | — → ~654B | 批次處理低價 |
| 10 | Gemini 3 Flash Preview | Google 🇺🇸 | ~1.06T → ~1.02T | 多模態學術/醫療 |
DeepSeek 矩陣:5 月下旬 DeepSeek 系列週呼叫合計約 5.74 兆 Token(環比 +25.9%),連續兩週在廠商維度超越 Anthropic 與 Google——這是「帳單層」的王者,不是評測簡報裡的王者。
06 · 廠商格局:Token 量 vs 美元的「雙重真相」
| 廠商/梯隊 | Token 佔比(示意) | 美元收入佔比(示意) | 解讀 |
|---|---|---|---|
| Anthropic | ~12% | ~46% | 流量讓渡,溢價仍在 |
| ~13% | ~7% | Flash 走量、收入溫和 | |
| OpenAI | ~10% | ~24% | GPT-5.x 高價檔 |
| 中國開源集群 | 45%+ | 個位數 % | 極低價吞噬 Token |
市場正在分層而非「選出唯一贏家」:
- 高價值·低流量:Claude Opus — 企業複雜推理,單價 $5/$25 per M。
- 性價比·中流量:Gemini Flash — 多模態與學術場景。
- 極低價·高流量:DeepSeek/Xiaomi/MiniMax/StepFun — Agent、程式、批次處理。
Claude Opus 4.6 月收入約 2500 萬美元量級(第三方估算),Token 量卻僅為 DeepSeek 頭部模型的零頭——這正是「溢價悖論」:企業仍付高價,但流量主導權已遷移。
07 · 反直覺發現:基準分數與市佔近乎反比
OpenRouter 與 a16z 聯合發布的《2025 AI 使用報告》(覆蓋約 100 兆 Token 匿名中繼資料)指出:模型基準測試分數與其實際市佔幾乎呈反比。原因並不神秘:
- 開發者選型時,推理成本 > 極限能力;
- Agent 工作流更依賴 API 穩定性、工具呼叫成功率與延遲,而非單次推理深度;
- 程式類任務占 OpenRouter 流量從 2025 年初約 11% 升至逾 50%,成為最大單一用途——這類任務天然偏愛「夠好且夠便宜」的模型。
結論:帳單上的數字,比任何評測榜單都誠實。 若你的路由策略仍由 LMSYS 排名驅動,建議改為「每週對照 openrouter.ai/rankings + 自家 Stripe/OpenRouter 帳單」雙軌決策。
08 · 為何週榜已成 AI 商業化晴雨表
投資人用其評估落地進度(OpenRouter 估值曾達約 26× PS 量級報導);開發者用它做「不押寶單一廠商」的路由基準;研究機構用它追蹤地緣與技術路線變遷。Token 呼叫量已從技術指標升級為商業戰場體溫計——每週更新、免費公開,這是上一代雲端運算成本曲線在 LLM 時代的等價物。對需要記憶體充足本機備援的 macOS 團隊,週榜還能指示「哪個開源族值得在 Apple Silicon 上鏡像」。
09 · 場景路由決策表(按帳單邏輯)
| 場景 | 優先模型 | 帳單邏輯 |
|---|---|---|
| Agent/批次 cron | DeepSeek V4 Flash | 週榜 #1,單價極低 |
| 企業複雜推理/合規 | Claude Opus/Sonnet 4.6 | 美元佔比高,工具環成熟 |
| 多模態文件 | Gemini 3 Flash | 全模態 + 中等單價 |
| 試探新品(Hy3、Owl) | Hy3 Preview/Owl Alpha | 週環比增速是先行指標 |
| 本地不出域 | ds4 + V4 Flash 權重 | 見 ds4 本地指南 |
建議每週一固定 15 分鐘:重新整理週榜截圖、匯出 OpenRouter Usage CSV、對照上表調整預設 model ID——比每季追發表會高效一個數量級。
10 · 五步週度路由驗證(HowTo)
- 租用隔離 macOS:Mac mini M4 起,SSH 接入;本機使用者與 Apple ID 隔離,勿在節點登入生產帳號。
- 快照當週榜:記錄 rankings 頁 Top 10 與自家上週 Token/美元。
- 固定 A/B 任務:對 V4 Flash、Sonnet 4.6、Hy3 跑同一 12k Token 編碼 + 工具呼叫任務,記錄延遲與成功率。
- 寫入 openclaw.json/Cursor 路由:主模型 + 回退模型 + 預算封頂。
- 匯出 CSV 並釋放:儲存證據、撤銷測試金鑰、退租擦碟。
# 拉取自家用量(範例,以 OpenRouter 文件為準)curl -H "Authorization: Bearer $OPENROUTER_API_KEY" \ https://openrouter.ai/api/v1/auth/key# 對照週榜 model IDopen https://openrouter.ai/rankings
雖然你可以在筆電上直接改 API 路由,但主力機混裝 Xcode 簽章、生產金鑰與實驗性 OpenClaw,一次誤設就可能把 Opus 單價燒進批次任務。若你需要可稽核的「週榜—帳單—延遲」三聯證據,又與 Apple 工具鏈同週期協作,在獨立 macOS 租用節點完成驗證再推廣,通常比衝動買斷頂配 Studio 更輕、比污染主力環境更安全。套餐見 M 系列算力定價,上手見 按日租用 Mac FAQ。