📋 本文目录

01 · OpenRouter 6月榜单全解析

OpenRouter 是目前最具参考价值的 AI 模型使用数据来源之一——它聚合全球数百万开发者的真实调用量，不靠厂商自吹，只看代码投票。6 月榜单反映的是全球开发者真正在生产环境中信任哪个模型，远不止「谁用的人多」。

数据来源：OpenRouter 实时流量统计、Artificial Analysis Intelligence Index、SWE-bench Pro（截至 2026 年 6 月）。本月 AI 圈大事包括：Claude Fable 5 因出口管制神秘下架、OpenAI 与 Anthropic 双双传出 IPO 消息、中国模型在 OpenRouter 的份额突破 60%（全平台 Token 口径）。

按公司排名（周 Token 量）

排名	公司	来源地	周 Token 量	市占率
1	DeepSeek	🇨🇳 中国	5.13T	17.6%
2	Anthropic	🇺🇸 美国	4.34T	14.8%
3	Google	🇺🇸 美国	3.66T	12.5%
4	OpenAI	🇺🇸 美国	2.46T	8.4%
5	小米 (Xiaomi)	🇨🇳 中国	2.42T	8.3%
6	MiniMax	🇨🇳 中国	2.37T	8.1%
7	腾讯 (Tencent)	🇨🇳 中国	2.36T	8.1%
8	阿里 Qwen	🇨🇳 中国	1.26T	4.3%

中国模型合计占比：约 46%（仅统计前 10 名内已标注来源的中国厂商）。

按模型排名（日均 Token 量 Top 10）

排名	模型	厂商	日均 Token
1	DeepSeek V4 Flash	DeepSeek	619B
2	Hy3 Preview	腾讯	451B
3	MiniMax M3	MiniMax	447B
4	MiMo-V2.5	小米	327B
5	DeepSeek V4 Pro	DeepSeek	300B
6	Claude Opus 4.7	Anthropic	263B
7	Claude Opus 4.8	Anthropic	~200B
8	Claude Sonnet 4.6	Anthropic	178B
9	Gemini 3 Flash Preview	Google	156B
10	Kimi K2.6	Moonshot AI	~150B

可引用数据：① DeepSeek V4 Flash 日均 619B Token，为榜首；② 前 10 模型中中国团队占据 5 席；③ Anthropic 三档 Claude 仍合计占据大量高价值流量。

02 · 三大选型痛点拆解

1. 把排行榜当质量榜。 OpenRouter 统计的是付费意愿与调用频率，不是 SWE-bench 分数。DeepSeek V4 Flash 登顶主因是性价比，不代表它在最难 Agent 任务上超越 Claude Opus 4.8。

2. 忽视账单经济学。 一位圣地亚哥开发者的原话很能说明问题：「用 Claude 写代码，每小时大概花 10 美元。用 DeepSeek，不到 50 美分。」若团队无路由策略，要么烧穿预算，要么在关键任务上省错地方。

3. 单模型锁定带来技术债。 Q3 2026 将是模型发布最密集季度之一（GPT-6、Opus 5、Gemini 4、DeepSeek V5 等）。硬编码单一 provider 的团队，将在 90 天内被迫重写集成层——与 6 月初 OpenRouter 趋势文强调的 Agent 选型逻辑一脉相承。

03 · 最大故事：一年之内美国模型从 70% 暴跌到 30%

Bloomberg 引用的 OpenRouter 与 Exponential View 数据把这件事说得很清楚：

2025 年 6 月：美国模型（Google + OpenAI + Anthropic 合计）占 OpenRouter 约 70% 的 Token 份额
2026 年 6 月：这个数字跌到了 30%

中间那 40 个百分点去哪了？全都被中国模型吃掉了。

这不是「中国开发者支持国产」的结果——OpenRouter 用户主体是全球开发者，大量来自美国、欧洲、印度。他们选择 DeepSeek、小米、MiniMax，是因为这些模型便宜、够快、够用。这不是质量的故事，这是经济学的故事。

04 · 分层理解：「用量第一」≠「质量第一」

质量天花板：Claude Opus 4.8 仍是综合能力第一

根据 Artificial Analysis Intelligence Index（截至 2026 年 5 月底）：

模型	综合质量指数	SWE-bench Pro	备注
Claude Opus 4.8	61.4（#1）	69.2%	长上下文与 Agent 领先
GPT-5.5	59–60	63.1%	生态与工具调用快
Gemini 3.1 Pro	57	—	最难推理任务
Qwen 3.7 Max	57	—	中国闭源旗舰
Claude Sonnet 4.6	—	80.8%（Verified）	写作与指令遵循

一位工程师在实测 20 个任务后的结论：Claude Opus 4.8 赢了 16 个，GPT-5.5 赢了 5 个，Gemini 3.1 Pro 赢了 4 个。特别是长上下文任务，Opus 几乎是碾压级别。

另需说明 Claude Fable 5：它在所有榜单上拿下满分质量评级（100/100），但因政府出口管制于 2026 年 6 月中旬全球下架，目前状态未定。它的存在说明：美国顶尖模型在纯能力层面仍然领先。详见站内 Fable 5 封禁与替代方案。

用量冠军：中国模型靠性价比统治日常任务

中国模型拿到高用量份额，核心逻辑三条：

价格：MiniMax M3 的 API 定价仅 $0.60/M 输入 token，约为 Claude Opus 4.8（$5.00/M）的 1/8
够用：日常编程辅助、代码补全、翻译、摘要等任务，中国模型能达到顶级模型 80–90% 的效果
开放权重：DeepSeek V4、MiniMax M3 等提供开放权重，企业可自部署，消除数据隐私顾虑

达拉斯开发者描述其栈：「复杂任务每月 $500 Claude + ChatGPT，日常 90% 编码与语音识别每月 $200 MiniMax + Kimi + MiMo。」 playbook：按复杂度路由，按成本优化。

05 · 各场景最优选择速查表（2026 年 6 月版）

场景	推荐模型	理由
复杂代码 / Agent	Claude Opus 4.8	综合能力第一，长上下文无敌
日常编程辅助	DeepSeek V4 Flash / MiMo-V2.5	性价比极高，速度快
超高性价比 API	MiniMax M3	$0.60/M，开放权重，可自部署
长上下文处理	Kimi K2.6（1M context）	超长窗口，价格合理
Google 生态整合	Gemini 3.5 Flash	Google Workspace 原生支持
实时 Web 搜索	Grok 4.3	X/Twitter 实时内容获取
自建本地部署	GLM 5.2 / Kimi K2.6	顶级开放权重模型
图像生成	ChatGPT Images 2.0	文字渲染最强
最佳日常对话	GPT-5.5	较 GPT-5.3 幻觉减少 52.5%，生态完整

06 · 下半年预测：即将到来的「模型大爆发季」

Q3 2026 很可能是 AI 史上模型发布最密集的季度。以下是目前最高置信度的预测：

模型	厂商	预计时间	核心看点
GPT-6	OpenAI	2026 年 8–9 月	更长上下文（传闻 1.5M token），更强 Agent 能力
Claude Opus 5	Anthropic	2026 年 9 月前后	接棒 Opus 4.8，长程 Agent 全面升级
Gemini 4	Google	2026 年 Q3	多模态升级，视频理解、音频输入强化
DeepSeek V5	DeepSeek	2026 年 Q3	开放权重，预计参数量破 1T，对标闭源前沿
GLM 5.2	智谱 Z.ai	已发布	当前顶级开放权重之一，编程能力极强
Grok 4.3+	xAI	2026 年 Q3	1M 上下文，增强实时 Web

其中三款很可能在 8 月中旬至 9 月下旬的六周窗口内密集落地——基准榜冠军换手速度将快于任何媒体周期。

07 · 宏观趋势预判（五条）

1. 竞争轴从「谁最强」转向「谁最适合这个场景」——五大实验室将在 90 天窗口内密集发布，理智策略是：闭源前沿处理最难 5% 任务，中国开放权重处理剩余 95% 日常量。

2. 中国模型份额将继续上升，但企业合规是上限——个人开发者 adoption 无停止迹象；企业采购受数据安全与美国国会监管约束。中国模型或在 OpenRouter 个人流量达 70%+，Fortune 500 采购仍可能低于 30%。

3. Agent 才是真正的战场——2026 年被定义为「Agent 从实验转向生产」元年。Anthropic《2026 年 AI Agent 状态报告》显示，近 44% 的 Claude API 调用来自数学和计算机任务。下半年，谁的 Agent 更稳定，谁才是真正的赢家。

4. OpenAI 和 Anthropic 双双 IPO 的影响——两家公司均于 2026 年 6 月传出 IPO 意向，将重新定价 AI 赛道估值；上市压力可能让定价更透明，也可能加速与中国模型的价格战。

5. 本地运行将在消费级硬件上突破 80% SWE-bench——预计在 2027 年内，32GB 消费级 GPU 上运行的本地模型将突破 SWE-bench 80% 编程能力门槛。本地跑「接近 Claude Opus 级别」的编程助手将不再是幻想。可对照 ds4 本地 DeepSeek 实测。

08 · 结语：利润层正在被压缩

这个故事的本质，是 AI 模型层的利润正在被快速压缩。DeepSeek 在 2025 年初的出现证明：在足够高效的架构下，顶尖模型不需要顶尖算力。小米、腾讯、MiniMax、Moonshot 迅速复制这一结论，把模型「基础定价」打到地板价。

美国厂商应对策略分化：OpenAI 押注生态（插件、企业集成、DALL-E、Codex Mobile）；Anthropic 死守质量高地（Claude Opus 的 Agent 能力鹤立鸡群）；Google 押注速度和多模态（Gemini Flash 系列是闭源性价比选项之一）。中间「质量不差但价格贵」的位置正在快速消失。

对于普通开发者和技术决策者来说，现在最值钱的能力，不是「选对最强模型」，而是「构建一个能随时切换模型的架构」——今天的第一名，三个月后可能就不是了。

09 · 五步多模型路由验证（HowTo）

租用干净 macOS：Mac mini M4 起，SSH 接入；与主力 Apple ID 隔离的本地用户。
配置 OpenRouter + 复杂度路由：沙箱 .env 写入 Key；最难任务指向 anthropic/claude-opus-4.8，日常指向 deepseek/deepseek-v4-flash 或 minimax/minimax-m3。
跑 20 任务对照基准：记录美元成本、延迟、长上下文与工具调用成功率——复现 Opus 赢 16 / GPT 赢 5 的测试方法论。
接入 Cursor 或 OpenClaw Gateway：确认切换 model ID 无需改业务代码；检查 1M 上下文是否触发网关超时。
导出 CSV 并释放实例：吊销测试 Key，退租前擦除磁盘；将路由规则文档化供团队复用。

                        # 复杂度路由示例（OpenRouter）

                        export OPENROUTER_API_KEY="sk-or-..."

                        # 日常：DeepSeek V4 Flash (~$0.10/M in)

                        # 攻坚：Claude Opus 4.8 ($5.00/M in)

虽然你可以在主力 MacBook 上直接改 OpenRouter 模型 ID，但多 Key、多 CLI、OpenClaw Gateway 与 Xcode 签名环境叠在同一台机器，一次误操作就可能烧穿生产配额或污染 Keychain。若你既要验收多模型 Agent 栈，又要保持 Apple 生态工具链稳定，在独立租用 macOS 上完成对照实验再推广，通常比冲动买断顶配硬件更轻、比污染主力环境更安全——套餐见 M 系列算力定价，流程见按天租用 Mac FAQ。