數據解讀 2026-06-06

OpenRouter 週 Token 排行
帳單數據不會說謊

若你仍用 MMLU 榜單替團隊挑「預設模型」,卻從未對照 OpenRouter 每週滾動的 Token 吞吐量,等於拿實驗室分數對抗真實帳單。本文面向多模型路由的開發者與技術主管,依 2026 年 5–6 月週榜解讀 28.9 兆 Token 週規模、中美格局與 Anthropic「溢價悖論」,並提供 Token 佔比對美元收入的決策矩陣、基準測試反轉現象,以及五步週度路由驗證清單。

OpenRouter 週 Token 呼叫量排行與帳單數據解讀示意圖

01 · 為何帳單數據比基準測試更可信

基準測試排行榜回答「在固定題庫上誰分數高」;OpenRouter 週排行回答「過去 7 天全球開發者實際燒掉多少 Token」。前者可被針對性最佳化,後者是用真錢(或免費額度)投出來的行為數據——花出去的錢不會說謊。

OpenRouter 作為中立 API 聚合層,接入 300+ 模型、覆蓋 60+ 供應商,平台月流量約 100 兆 Token 量級、使用者逾 800 萬。當某模型在週榜上連續攀升,代表生產流量正在遷移,而不只是新聞稿裡的「SOTA」。這與站內 OpenRouter 流行趨勢 互補:那篇談六大趨勢與 Agent 選型矩陣,本篇聚焦週度帳單口徑溢價悖論

02 · 資料來源與統計方法

公開入口:openrouter.ai/rankings。核心口徑為按週(7 天滾動)Token 吞吐量,統計輸入與輸出 Token 總量,可按模型與廠商維度下鑽。本文錨定資料包括:

  • 歷史週(錨點):2026 年 5 月 18 日–5 月 24 日,全球週呼叫約 28.9 兆 Token,環比 +7.4%(連續五週上漲)。
  • 最新週(2026 年 6 月初):Tool Calling 集合顯示 DeepSeek V4 Flash 約 3.14T、騰訊 Hy3 Preview 約 2.75T、Xiaomi MiMo-V2.5 約 2.3T——榜單輪動極快,閱讀時請以官網即時資料為準。

讀榜時請同時看兩欄:Token 佔比(流量主導權)與美元收入佔比(定價 × 用量加權)。只看 Token 會低估 Claude;只看收入會高估「市場仍由美國閉源壟斷」——真相在兩者之間。

03 · 三大認知痛點拆解

1. 把發表會當選型依據。 廠商展示的是最佳案例;週榜統計的是 cron、批次處理、Agent 迴圈裡失敗重試也計費的真實呼叫。DeepSeek V4 Flash 週榜登頂,背後是 Agent 工作流對「低單價 + 1M 上下文 + 工具環穩定」的集體投票,而非單次聊天體驗。

2. 忽視「Token 量 ≠ 美元收入」。 Anthropic Token 佔比約 12%(一年前約 25%),美元收入佔比仍約 46%。團隊若只追流量冠軍,可能錯過企業合規場景仍願為 Claude Opus 付溢價的現實;若只追收入榜,又會誤判「性價比開源已接管一切」。

3. 在主力機輪換模型污染環境。 每週改 OpenRouter 預設路由、在主力 Mac 上裝三套 CLI,Keychain 與全域設定極易殘留。更穩妥的做法:在可丟棄的租用 macOS 節點對照週帳單與延遲,再推廣到團隊——邏輯同 Agent Skill 隔離試跑

04 · 全球週總量:28.9 兆 Token 與中美格局

指標資料(5/18–5/24 週)環比
全球週呼叫量28.9 兆 Token+7.4%
中國模型週呼叫9.223 兆 Token+19.89%
美國模型週呼叫4.93 兆 Token+16.27%
中國 vs 美國排名中國模型連續四週週 Token 量超美國

數量級感知:約一年前 OpenRouter 週處理量約 2.4 兆,至 2026 年 5 月約 28.9 兆,一年量級成長約 12 倍——AI 呼叫已從「試用」進入規模化爆發。對台港團隊而言,這代表頻寬與伺服器端延遲將成為路由決策的一等公民,而不只是模型分數。

時間節點中國模型流量佔比(示意)
2025 年初< 2%
2026 年 2 月首次週 Token 量超美國
2026 年 5 月約 45%+,連續四週領先

05 · 當週模型 Top 10(多週對照)

週榜輪動極快。下表合併 5 月下旬錨點與 6 月初 Tool Calling 集合公開資料,便於理解「誰在被呼叫」而非「誰發表會最強」。

排名模型廠商週 Token(量級)特點
1DeepSeek V4 FlashDeepSeek 🇨🇳3.43T → ~3.14TAgent 首選、極低單價、1M 上下文
2騰訊 Hy3 PreviewTencent 🇨🇳3.07T → ~2.75T開源 MoE 黑馬
3Owl AlphaStealth~1.15T → ~1.92T百萬上下文、Agent 特化
4–5V4 Pro / V3.2DeepSeek 🇨🇳矩陣占位DeepSeek 三模型同進前列
6Claude Sonnet 4.6Anthropic 🇺🇸~1.35T → ~1.77T企業程式主力
7Xiaomi MiMo-V2.5Xiaomi 🇨🇳— → ~2.3T6 月新晉高頻流量
8MiniMax M3MiniMax 🇨🇳— → ~1.68T長上下文性價比
9Step 3.7 FlashStepFun 🇨🇳— → ~654B批次處理低價
10Gemini 3 Flash PreviewGoogle 🇺🇸~1.06T → ~1.02T多模態學術/醫療

DeepSeek 矩陣:5 月下旬 DeepSeek 系列週呼叫合計約 5.74 兆 Token(環比 +25.9%),連續兩週在廠商維度超越 Anthropic 與 Google——這是「帳單層」的王者,不是評測簡報裡的王者。

06 · 廠商格局:Token 量 vs 美元的「雙重真相」

廠商/梯隊Token 佔比(示意)美元收入佔比(示意)解讀
Anthropic~12%~46%流量讓渡,溢價仍在
Google~13%~7%Flash 走量、收入溫和
OpenAI~10%~24%GPT-5.x 高價檔
中國開源集群45%+個位數 %極低價吞噬 Token

市場正在分層而非「選出唯一贏家」:

  • 高價值·低流量:Claude Opus — 企業複雜推理,單價 $5/$25 per M。
  • 性價比·中流量:Gemini Flash — 多模態與學術場景。
  • 極低價·高流量:DeepSeek/Xiaomi/MiniMax/StepFun — Agent、程式、批次處理。

Claude Opus 4.6 月收入約 2500 萬美元量級(第三方估算),Token 量卻僅為 DeepSeek 頭部模型的零頭——這正是「溢價悖論」:企業仍付高價,但流量主導權已遷移。

07 · 反直覺發現:基準分數與市佔近乎反比

OpenRouter 與 a16z 聯合發布的《2025 AI 使用報告》(覆蓋約 100 兆 Token 匿名中繼資料)指出:模型基準測試分數與其實際市佔幾乎呈反比。原因並不神秘:

  • 開發者選型時,推理成本 > 極限能力
  • Agent 工作流更依賴 API 穩定性、工具呼叫成功率與延遲,而非單次推理深度;
  • 程式類任務占 OpenRouter 流量從 2025 年初約 11% 升至逾 50%,成為最大單一用途——這類任務天然偏愛「夠好且夠便宜」的模型。

結論:帳單上的數字,比任何評測榜單都誠實。 若你的路由策略仍由 LMSYS 排名驅動,建議改為「每週對照 openrouter.ai/rankings + 自家 Stripe/OpenRouter 帳單」雙軌決策。

08 · 為何週榜已成 AI 商業化晴雨表

投資人用其評估落地進度(OpenRouter 估值曾達約 26× PS 量級報導);開發者用它做「不押寶單一廠商」的路由基準;研究機構用它追蹤地緣與技術路線變遷。Token 呼叫量已從技術指標升級為商業戰場體溫計——每週更新、免費公開,這是上一代雲端運算成本曲線在 LLM 時代的等價物。對需要記憶體充足本機備援的 macOS 團隊,週榜還能指示「哪個開源族值得在 Apple Silicon 上鏡像」。

09 · 場景路由決策表(按帳單邏輯)

場景優先模型帳單邏輯
Agent/批次 cronDeepSeek V4 Flash週榜 #1,單價極低
企業複雜推理/合規Claude Opus/Sonnet 4.6美元佔比高,工具環成熟
多模態文件Gemini 3 Flash全模態 + 中等單價
試探新品(Hy3、Owl)Hy3 Preview/Owl Alpha週環比增速是先行指標
本地不出域ds4 + V4 Flash 權重ds4 本地指南

建議每週一固定 15 分鐘:重新整理週榜截圖、匯出 OpenRouter Usage CSV、對照上表調整預設 model ID——比每季追發表會高效一個數量級。

10 · 五步週度路由驗證(HowTo)

  1. 租用隔離 macOS:Mac mini M4 起,SSH 接入;本機使用者與 Apple ID 隔離,勿在節點登入生產帳號。
  2. 快照當週榜:記錄 rankings 頁 Top 10 與自家上週 Token/美元。
  3. 固定 A/B 任務:對 V4 Flash、Sonnet 4.6、Hy3 跑同一 12k Token 編碼 + 工具呼叫任務,記錄延遲與成功率。
  4. 寫入 openclaw.json/Cursor 路由:主模型 + 回退模型 + 預算封頂。
  5. 匯出 CSV 並釋放:儲存證據、撤銷測試金鑰、退租擦碟。
# 拉取自家用量(範例,以 OpenRouter 文件為準)
curl -H "Authorization: Bearer $OPENROUTER_API_KEY" \
https://openrouter.ai/api/v1/auth/key
# 對照週榜 model ID
open https://openrouter.ai/rankings

雖然你可以在筆電上直接改 API 路由,但主力機混裝 Xcode 簽章、生產金鑰與實驗性 OpenClaw,一次誤設就可能把 Opus 單價燒進批次任務。若你需要可稽核的「週榜—帳單—延遲」三聯證據,又與 Apple 工具鏈同週期協作,在獨立 macOS 租用節點完成驗證再推廣,通常比衝動買斷頂配 Studio 更輕、比污染主力環境更安全。套餐見 M 系列算力定價,上手見 按日租用 Mac FAQ