📋 本文目錄

01 · 為何帳單數據比基準測試更可信

基準測試排行榜回答「在固定題庫上誰分數高」；OpenRouter 週排行回答「過去 7 天全球開發者實際燒掉多少 Token」。前者可被針對性最佳化，後者是用真錢（或免費額度）投出來的行為數據——花出去的錢不會說謊。

OpenRouter 作為中立 API 聚合層，接入 300+ 模型、覆蓋 60+ 供應商，平台月流量約 100 兆 Token 量級、使用者逾 800 萬。當某模型在週榜上連續攀升，代表生產流量正在遷移，而不只是新聞稿裡的「SOTA」。這與站內 OpenRouter 流行趨勢互補：那篇談六大趨勢與 Agent 選型矩陣，本篇聚焦週度帳單口徑與溢價悖論。

02 · 資料來源與統計方法

公開入口：openrouter.ai/rankings。核心口徑為按週（7 天滾動）Token 吞吐量，統計輸入與輸出 Token 總量，可按模型與廠商維度下鑽。本文錨定資料包括：

歷史週（錨點）：2026 年 5 月 18 日–5 月 24 日，全球週呼叫約 28.9 兆 Token，環比 +7.4%（連續五週上漲）。
最新週（2026 年 6 月初）：Tool Calling 集合顯示 DeepSeek V4 Flash 約 3.14T、騰訊 Hy3 Preview 約 2.75T、Xiaomi MiMo-V2.5 約 2.3T——榜單輪動極快，閱讀時請以官網即時資料為準。

讀榜時請同時看兩欄：Token 佔比（流量主導權）與美元收入佔比（定價 × 用量加權）。只看 Token 會低估 Claude；只看收入會高估「市場仍由美國閉源壟斷」——真相在兩者之間。

03 · 三大認知痛點拆解

1. 把發表會當選型依據。 廠商展示的是最佳案例；週榜統計的是 cron、批次處理、Agent 迴圈裡失敗重試也計費的真實呼叫。DeepSeek V4 Flash 週榜登頂，背後是 Agent 工作流對「低單價 + 1M 上下文 + 工具環穩定」的集體投票，而非單次聊天體驗。

2. 忽視「Token 量 ≠ 美元收入」。 Anthropic Token 佔比約 12%（一年前約 25%），美元收入佔比仍約 46%。團隊若只追流量冠軍，可能錯過企業合規場景仍願為 Claude Opus 付溢價的現實；若只追收入榜，又會誤判「性價比開源已接管一切」。

3. 在主力機輪換模型污染環境。 每週改 OpenRouter 預設路由、在主力 Mac 上裝三套 CLI，Keychain 與全域設定極易殘留。更穩妥的做法：在可丟棄的租用 macOS 節點對照週帳單與延遲，再推廣到團隊——邏輯同 Agent Skill 隔離試跑。

04 · 全球週總量：28.9 兆 Token 與中美格局

指標	資料（5/18–5/24 週）	環比
全球週呼叫量	28.9 兆 Token	+7.4%
中國模型週呼叫	9.223 兆 Token	+19.89%
美國模型週呼叫	4.93 兆 Token	+16.27%
中國 vs 美國排名	中國模型連續四週週 Token 量超美國

數量級感知：約一年前 OpenRouter 週處理量約 2.4 兆，至 2026 年 5 月約 28.9 兆，一年量級成長約 12 倍——AI 呼叫已從「試用」進入規模化爆發。對台港團隊而言，這代表頻寬與伺服器端延遲將成為路由決策的一等公民，而不只是模型分數。

時間節點	中國模型流量佔比（示意）
2025 年初	< 2%
2026 年 2 月	首次週 Token 量超美國
2026 年 5 月	約 45%+，連續四週領先

05 · 當週模型 Top 10（多週對照）

週榜輪動極快。下表合併 5 月下旬錨點與 6 月初 Tool Calling 集合公開資料，便於理解「誰在被呼叫」而非「誰發表會最強」。

排名	模型	廠商	週 Token（量級）	特點
1	DeepSeek V4 Flash	DeepSeek 🇨🇳	3.43T → ~3.14T	Agent 首選、極低單價、1M 上下文
2	騰訊 Hy3 Preview	Tencent 🇨🇳	3.07T → ~2.75T	開源 MoE 黑馬
3	Owl Alpha	Stealth	~1.15T → ~1.92T	百萬上下文、Agent 特化
4–5	V4 Pro / V3.2	DeepSeek 🇨🇳	矩陣占位	DeepSeek 三模型同進前列
6	Claude Sonnet 4.6	Anthropic 🇺🇸	~1.35T → ~1.77T	企業程式主力
7	Xiaomi MiMo-V2.5	Xiaomi 🇨🇳	— → ~2.3T	6 月新晉高頻流量
8	MiniMax M3	MiniMax 🇨🇳	— → ~1.68T	長上下文性價比
9	Step 3.7 Flash	StepFun 🇨🇳	— → ~654B	批次處理低價
10	Gemini 3 Flash Preview	Google 🇺🇸	~1.06T → ~1.02T	多模態學術／醫療

DeepSeek 矩陣：5 月下旬 DeepSeek 系列週呼叫合計約 5.74 兆 Token（環比 +25.9%），連續兩週在廠商維度超越 Anthropic 與 Google——這是「帳單層」的王者，不是評測簡報裡的王者。

06 · 廠商格局：Token 量 vs 美元的「雙重真相」

廠商／梯隊	Token 佔比（示意）	美元收入佔比（示意）	解讀
Anthropic	~12%	~46%	流量讓渡，溢價仍在
Google	~13%	~7%	Flash 走量、收入溫和
OpenAI	~10%	~24%	GPT-5.x 高價檔
中國開源集群	45%+	個位數 %	極低價吞噬 Token

市場正在分層而非「選出唯一贏家」：

高價值·低流量：Claude Opus — 企業複雜推理，單價 $5/$25 per M。
性價比·中流量：Gemini Flash — 多模態與學術場景。
極低價·高流量：DeepSeek／Xiaomi／MiniMax／StepFun — Agent、程式、批次處理。

Claude Opus 4.6 月收入約 2500 萬美元量級（第三方估算），Token 量卻僅為 DeepSeek 頭部模型的零頭——這正是「溢價悖論」：企業仍付高價，但流量主導權已遷移。

07 · 反直覺發現：基準分數與市佔近乎反比

OpenRouter 與 a16z 聯合發布的《2025 AI 使用報告》（覆蓋約 100 兆 Token 匿名中繼資料）指出：模型基準測試分數與其實際市佔幾乎呈反比。原因並不神秘：

開發者選型時，推理成本 > 極限能力；
Agent 工作流更依賴 API 穩定性、工具呼叫成功率與延遲，而非單次推理深度；
程式類任務占 OpenRouter 流量從 2025 年初約 11% 升至逾 50%，成為最大單一用途——這類任務天然偏愛「夠好且夠便宜」的模型。

結論：帳單上的數字，比任何評測榜單都誠實。 若你的路由策略仍由 LMSYS 排名驅動，建議改為「每週對照 openrouter.ai/rankings + 自家 Stripe／OpenRouter 帳單」雙軌決策。

08 · 為何週榜已成 AI 商業化晴雨表

投資人用其評估落地進度（OpenRouter 估值曾達約 26× PS 量級報導）；開發者用它做「不押寶單一廠商」的路由基準；研究機構用它追蹤地緣與技術路線變遷。Token 呼叫量已從技術指標升級為商業戰場體溫計——每週更新、免費公開，這是上一代雲端運算成本曲線在 LLM 時代的等價物。對需要記憶體充足本機備援的 macOS 團隊，週榜還能指示「哪個開源族值得在 Apple Silicon 上鏡像」。

09 · 場景路由決策表（按帳單邏輯）

場景	優先模型	帳單邏輯
Agent／批次 cron	DeepSeek V4 Flash	週榜 #1，單價極低
企業複雜推理／合規	Claude Opus／Sonnet 4.6	美元佔比高，工具環成熟
多模態文件	Gemini 3 Flash	全模態 + 中等單價
試探新品（Hy3、Owl）	Hy3 Preview／Owl Alpha	週環比增速是先行指標
本地不出域	ds4 + V4 Flash 權重	見 ds4 本地指南

建議每週一固定 15 分鐘：重新整理週榜截圖、匯出 OpenRouter Usage CSV、對照上表調整預設 model ID——比每季追發表會高效一個數量級。

10 · 五步週度路由驗證（HowTo）

租用隔離 macOS：Mac mini M4 起，SSH 接入；本機使用者與 Apple ID 隔離，勿在節點登入生產帳號。
快照當週榜：記錄 rankings 頁 Top 10 與自家上週 Token／美元。
固定 A/B 任務：對 V4 Flash、Sonnet 4.6、Hy3 跑同一 12k Token 編碼 + 工具呼叫任務，記錄延遲與成功率。
寫入 openclaw.json／Cursor 路由：主模型 + 回退模型 + 預算封頂。
匯出 CSV 並釋放：儲存證據、撤銷測試金鑰、退租擦碟。

                        # 拉取自家用量（範例，以 OpenRouter 文件為準）

                        curl -H "Authorization: Bearer $OPENROUTER_API_KEY" \

                          https://openrouter.ai/api/v1/auth/key

                        # 對照週榜 model ID

                        open https://openrouter.ai/rankings

雖然你可以在筆電上直接改 API 路由，但主力機混裝 Xcode 簽章、生產金鑰與實驗性 OpenClaw，一次誤設就可能把 Opus 單價燒進批次任務。若你需要可稽核的「週榜—帳單—延遲」三聯證據，又與 Apple 工具鏈同週期協作，在獨立 macOS 租用節點完成驗證再推廣，通常比衝動買斷頂配 Studio 更輕、比污染主力環境更安全。套餐見 M 系列算力定價，上手見按日租用 Mac FAQ。