6月 OpenRouter 排行榜深度分析
中国模型「接管」流量,下半年押注谁?
如果你在 Cursor 或 OpenClaw 里仍按去年的 MMLU 榜单选「默认模型」,很可能已经落后于真实市场——OpenRouter 6 月数据显示,中国模型已占据约 46% 头部公司份额,美国三大实验室合计从一年前的 70% 跌至 30%。本文基于 OpenRouter 实时流量、Artificial Analysis 与 SWE-bench Pro,给出公司与模型双榜、用量≠质量分层、场景选型速查表、Q3 发布预测与五步多模型路由验证清单(含对比表与落地步骤)。
📋 本文目录
01 · OpenRouter 6月榜单全解析
OpenRouter 是目前最具参考价值的 AI 模型使用数据来源之一——它聚合全球数百万开发者的真实调用量,不靠厂商自吹,只看代码投票。6 月榜单反映的是全球开发者真正在生产环境中信任哪个模型,远不止「谁用的人多」。
数据来源:OpenRouter 实时流量统计、Artificial Analysis Intelligence Index、SWE-bench Pro(截至 2026 年 6 月)。本月 AI 圈大事包括:Claude Fable 5 因出口管制神秘下架、OpenAI 与 Anthropic 双双传出 IPO 消息、中国模型在 OpenRouter 的份额突破 60%(全平台 Token 口径)。
按公司排名(周 Token 量)
| 排名 | 公司 | 来源地 | 周 Token 量 | 市占率 |
|---|---|---|---|---|
| 1 | DeepSeek | 🇨🇳 中国 | 5.13T | 17.6% |
| 2 | Anthropic | 🇺🇸 美国 | 4.34T | 14.8% |
| 3 | 🇺🇸 美国 | 3.66T | 12.5% | |
| 4 | OpenAI | 🇺🇸 美国 | 2.46T | 8.4% |
| 5 | 小米 (Xiaomi) | 🇨🇳 中国 | 2.42T | 8.3% |
| 6 | MiniMax | 🇨🇳 中国 | 2.37T | 8.1% |
| 7 | 腾讯 (Tencent) | 🇨🇳 中国 | 2.36T | 8.1% |
| 8 | 阿里 Qwen | 🇨🇳 中国 | 1.26T | 4.3% |
中国模型合计占比:约 46%(仅统计前 10 名内已标注来源的中国厂商)。
按模型排名(日均 Token 量 Top 10)
| 排名 | 模型 | 厂商 | 日均 Token |
|---|---|---|---|
| 1 | DeepSeek V4 Flash | DeepSeek | 619B |
| 2 | Hy3 Preview | 腾讯 | 451B |
| 3 | MiniMax M3 | MiniMax | 447B |
| 4 | MiMo-V2.5 | 小米 | 327B |
| 5 | DeepSeek V4 Pro | DeepSeek | 300B |
| 6 | Claude Opus 4.7 | Anthropic | 263B |
| 7 | Claude Opus 4.8 | Anthropic | ~200B |
| 8 | Claude Sonnet 4.6 | Anthropic | 178B |
| 9 | Gemini 3 Flash Preview | 156B | |
| 10 | Kimi K2.6 | Moonshot AI | ~150B |
可引用数据:① DeepSeek V4 Flash 日均 619B Token,为榜首;② 前 10 模型中中国团队占据 5 席;③ Anthropic 三档 Claude 仍合计占据大量高价值流量。
02 · 三大选型痛点拆解
1. 把排行榜当质量榜。 OpenRouter 统计的是付费意愿与调用频率,不是 SWE-bench 分数。DeepSeek V4 Flash 登顶主因是性价比,不代表它在最难 Agent 任务上超越 Claude Opus 4.8。
2. 忽视账单经济学。 一位圣地亚哥开发者的原话很能说明问题:「用 Claude 写代码,每小时大概花 10 美元。用 DeepSeek,不到 50 美分。」若团队无路由策略,要么烧穿预算,要么在关键任务上省错地方。
3. 单模型锁定带来技术债。 Q3 2026 将是模型发布最密集季度之一(GPT-6、Opus 5、Gemini 4、DeepSeek V5 等)。硬编码单一 provider 的团队,将在 90 天内被迫重写集成层——与 6 月初 OpenRouter 趋势文 强调的 Agent 选型逻辑一脉相承。
03 · 最大故事:一年之内美国模型从 70% 暴跌到 30%
Bloomberg 引用的 OpenRouter 与 Exponential View 数据把这件事说得很清楚:
- 2025 年 6 月:美国模型(Google + OpenAI + Anthropic 合计)占 OpenRouter 约 70% 的 Token 份额
- 2026 年 6 月:这个数字跌到了 30%
中间那 40 个百分点去哪了?全都被中国模型吃掉了。
这不是「中国开发者支持国产」的结果——OpenRouter 用户主体是全球开发者,大量来自美国、欧洲、印度。他们选择 DeepSeek、小米、MiniMax,是因为这些模型便宜、够快、够用。这不是质量的故事,这是经济学的故事。
04 · 分层理解:「用量第一」≠「质量第一」
质量天花板:Claude Opus 4.8 仍是综合能力第一
根据 Artificial Analysis Intelligence Index(截至 2026 年 5 月底):
| 模型 | 综合质量指数 | SWE-bench Pro | 备注 |
|---|---|---|---|
| Claude Opus 4.8 | 61.4(#1) | 69.2% | 长上下文与 Agent 领先 |
| GPT-5.5 | 59–60 | 63.1% | 生态与工具调用快 |
| Gemini 3.1 Pro | 57 | — | 最难推理任务 |
| Qwen 3.7 Max | 57 | — | 中国闭源旗舰 |
| Claude Sonnet 4.6 | — | 80.8%(Verified) | 写作与指令遵循 |
一位工程师在实测 20 个任务后的结论:Claude Opus 4.8 赢了 16 个,GPT-5.5 赢了 5 个,Gemini 3.1 Pro 赢了 4 个。特别是长上下文任务,Opus 几乎是碾压级别。
另需说明 Claude Fable 5:它在所有榜单上拿下满分质量评级(100/100),但因政府出口管制于 2026 年 6 月中旬全球下架,目前状态未定。它的存在说明:美国顶尖模型在纯能力层面仍然领先。详见站内 Fable 5 封禁与替代方案。
用量冠军:中国模型靠性价比统治日常任务
中国模型拿到高用量份额,核心逻辑三条:
- 价格:MiniMax M3 的 API 定价仅 $0.60/M 输入 token,约为 Claude Opus 4.8($5.00/M)的 1/8
- 够用:日常编程辅助、代码补全、翻译、摘要等任务,中国模型能达到顶级模型 80–90% 的效果
- 开放权重:DeepSeek V4、MiniMax M3 等提供开放权重,企业可自部署,消除数据隐私顾虑
达拉斯开发者描述其栈:「复杂任务每月 $500 Claude + ChatGPT,日常 90% 编码与语音识别每月 $200 MiniMax + Kimi + MiMo。」 playbook:按复杂度路由,按成本优化。
05 · 各场景最优选择速查表(2026 年 6 月版)
| 场景 | 推荐模型 | 理由 |
|---|---|---|
| 复杂代码 / Agent | Claude Opus 4.8 | 综合能力第一,长上下文无敌 |
| 日常编程辅助 | DeepSeek V4 Flash / MiMo-V2.5 | 性价比极高,速度快 |
| 超高性价比 API | MiniMax M3 | $0.60/M,开放权重,可自部署 |
| 长上下文处理 | Kimi K2.6(1M context) | 超长窗口,价格合理 |
| Google 生态整合 | Gemini 3.5 Flash | Google Workspace 原生支持 |
| 实时 Web 搜索 | Grok 4.3 | X/Twitter 实时内容获取 |
| 自建本地部署 | GLM 5.2 / Kimi K2.6 | 顶级开放权重模型 |
| 图像生成 | ChatGPT Images 2.0 | 文字渲染最强 |
| 最佳日常对话 | GPT-5.5 | 较 GPT-5.3 幻觉减少 52.5%,生态完整 |
06 · 下半年预测:即将到来的「模型大爆发季」
Q3 2026 很可能是 AI 史上模型发布最密集的季度。以下是目前最高置信度的预测:
| 模型 | 厂商 | 预计时间 | 核心看点 |
|---|---|---|---|
| GPT-6 | OpenAI | 2026 年 8–9 月 | 更长上下文(传闻 1.5M token),更强 Agent 能力 |
| Claude Opus 5 | Anthropic | 2026 年 9 月前后 | 接棒 Opus 4.8,长程 Agent 全面升级 |
| Gemini 4 | 2026 年 Q3 | 多模态升级,视频理解、音频输入强化 | |
| DeepSeek V5 | DeepSeek | 2026 年 Q3 | 开放权重,预计参数量破 1T,对标闭源前沿 |
| GLM 5.2 | 智谱 Z.ai | 已发布 | 当前顶级开放权重之一,编程能力极强 |
| Grok 4.3+ | xAI | 2026 年 Q3 | 1M 上下文,增强实时 Web |
其中三款很可能在 8 月中旬至 9 月下旬的六周窗口内密集落地——基准榜冠军换手速度将快于任何媒体周期。
07 · 宏观趋势预判(五条)
1. 竞争轴从「谁最强」转向「谁最适合这个场景」——五大实验室将在 90 天窗口内密集发布,理智策略是:闭源前沿处理最难 5% 任务,中国开放权重处理剩余 95% 日常量。
2. 中国模型份额将继续上升,但企业合规是上限——个人开发者 adoption 无停止迹象;企业采购受数据安全与美国国会监管约束。中国模型或在 OpenRouter 个人流量达 70%+,Fortune 500 采购仍可能低于 30%。
3. Agent 才是真正的战场——2026 年被定义为「Agent 从实验转向生产」元年。Anthropic《2026 年 AI Agent 状态报告》显示,近 44% 的 Claude API 调用来自数学和计算机任务。下半年,谁的 Agent 更稳定,谁才是真正的赢家。
4. OpenAI 和 Anthropic 双双 IPO 的影响——两家公司均于 2026 年 6 月传出 IPO 意向,将重新定价 AI 赛道估值;上市压力可能让定价更透明,也可能加速与中国模型的价格战。
5. 本地运行将在消费级硬件上突破 80% SWE-bench——预计在 2027 年内,32GB 消费级 GPU 上运行的本地模型将突破 SWE-bench 80% 编程能力门槛。本地跑「接近 Claude Opus 级别」的编程助手将不再是幻想。可对照 ds4 本地 DeepSeek 实测。
08 · 结语:利润层正在被压缩
这个故事的本质,是 AI 模型层的利润正在被快速压缩。DeepSeek 在 2025 年初的出现证明:在足够高效的架构下,顶尖模型不需要顶尖算力。小米、腾讯、MiniMax、Moonshot 迅速复制这一结论,把模型「基础定价」打到地板价。
美国厂商应对策略分化:OpenAI 押注生态(插件、企业集成、DALL-E、Codex Mobile);Anthropic 死守质量高地(Claude Opus 的 Agent 能力鹤立鸡群);Google 押注速度和多模态(Gemini Flash 系列是闭源性价比选项之一)。中间「质量不差但价格贵」的位置正在快速消失。
对于普通开发者和技术决策者来说,现在最值钱的能力,不是「选对最强模型」,而是「构建一个能随时切换模型的架构」——今天的第一名,三个月后可能就不是了。
09 · 五步多模型路由验证(HowTo)
- 租用干净 macOS:Mac mini M4 起,SSH 接入;与主力 Apple ID 隔离的本地用户。
- 配置 OpenRouter + 复杂度路由:沙箱
.env写入 Key;最难任务指向anthropic/claude-opus-4.8,日常指向deepseek/deepseek-v4-flash或minimax/minimax-m3。 - 跑 20 任务对照基准:记录美元成本、延迟、长上下文与工具调用成功率——复现 Opus 赢 16 / GPT 赢 5 的测试方法论。
- 接入 Cursor 或 OpenClaw Gateway:确认切换 model ID 无需改业务代码;检查 1M 上下文是否触发网关超时。
- 导出 CSV 并释放实例:吊销测试 Key,退租前擦除磁盘;将路由规则文档化供团队复用。
# 复杂度路由示例(OpenRouter)export OPENROUTER_API_KEY="sk-or-..."# 日常:DeepSeek V4 Flash (~$0.10/M in)# 攻坚:Claude Opus 4.8 ($5.00/M in)
虽然你可以在主力 MacBook 上直接改 OpenRouter 模型 ID,但多 Key、多 CLI、OpenClaw Gateway 与 Xcode 签名环境叠在同一台机器,一次误操作就可能烧穿生产配额或污染 Keychain。若你既要验收多模型 Agent 栈,又要保持 Apple 生态工具链稳定,在独立租用 macOS 上完成对照实验再推广,通常比冲动买断顶配硬件更轻、比污染主力环境更安全——套餐见 M 系列算力定价,流程见 按天租用 Mac FAQ。