📋 本文目录

01 · OpenRouter 是什么？CLI 专项榜怎么读？

OpenRouter 是统一 AI 模型路由平台：一个 API Key 可接入数百个 LLM，并维护公开的 Top Apps 排行榜。接入工具若选择公开追踪，其 Token 消耗会对所有人可见——这比 GitHub Stars 更能反映实际使用频率。

本文在 2026 年 6 月 2–8 日「This Week」全平台数据基础上，筛选终端可用、面向开发者的 CLI / Agent 类工具，并结合 GitHub Stars、MCP 支持、沙箱能力与社区口碑做 CLI 专项综合排名。与站内周 Token 账单解读、大模型流行趋势互补：那两篇讲模型层与账单层，本篇聚焦「你用哪款 CLI 在烧 Token」。

02 · 三大选型痛点拆解

1. 把「模型榜」当成「工具榜」。 DeepSeek V4 Flash 周 Token 再高，也不等于你的团队该换 Aider 为默认 CLI。模型路由在 API 层；CLI 层决定 Git 集成、沙箱、MCP、Plan Mode 等工程体验——两层决策不可混为一谈。

2. 在主力 Mac 上并行装五款 CLI。 每款工具都会写全局配置、缓存 API Key、甚至改 shell 别名。一次误配可能把生产 OpenRouter Key 暴露给实验性 Agent。更稳妥的做法是在可丢弃的租用 macOS 并行试跑，对照账单后再锁定主力——逻辑同 Agent Skill 隔离试跑。

3. 忽视硬件与 CLI 的匹配。 Goose / OpenCode 的 Docker 沙箱、本地 Ollama 后端，对内存与 I/O 要求远高于纯 API 型 Aider。选错机器会出现「CLI 本身没问题，但沙箱 OOM」的假象，从而误判工具能力。

03 · 本周全平台 Top 10 快照（6/2–6/8）

截至 2026 年 6 月 8 日，OpenRouter 本周全平台 Token 消耗前列中，CLI 与 Agent 类工具表现突出：

全平台排名	工具	类型	本周 Token
1	Hermes Agent	AI Agent（CLI）	4.94T
2	OpenClaw	通用 Agent	1.26T
3	Kilo Code	CLI / IDE 插件	1.22T
4	Claude Code	终端原生 CLI	606B
5–10	Descript、pi、Lemonade 等	非纯开发类	218B–454B

关键趋势： CLI 与 Agent 类工具合计消耗本周约 70%+ Token 量；Kilo Code 与 Claude Code 双双挤进全平台 Top 5，说明「在终端里写代码」已从尝鲜进入主流生产流量。

04 · CLI 工具专项 Top 10 综合榜

下表综合本周 OpenRouter 实时数据、近 30 日累计表现与功能完整度。纯娱乐 / 非开发类应用不计入。

CLI 排名	工具	本周 Token	开源	核心亮点
🥇 1	Kilo Code	1.22T（全平台 #3）	✅	500+ 模型，Architect/Code/Debug/Orchestrator 四模式
🥈 2	Claude Code	606B（全平台 #4）	❌	最强推理，Sub-agent，macOS Seatbelt 沙箱
🥉 3	Hermes Agent	4.94T（全平台 #1）	✅	完全开源，零门槛，自动化场景渗透极深
4	Aider	~2.4B/月	✅	Git 原生，41,200+ Stars，最成熟纯 CLI
5	Cline	~140B/月	✅	逐步审批，浏览器自动化，58,600+ Stars
6	Goose	~46.4B/月	✅	MCP 原生 1700+ 服务，Recipes 工作流
7	OpenCode	快速增长	✅	75+ 提供商，97,500+ Stars，增速最快
8	OpenAI Codex CLI	~91B/月	✅	云端沙箱，Codex 专属高速模型
9	Roo Code	~111.8B/月	✅	Cline 增强 Fork，任务看板与 Boomerang
10	Qwen Code	~39.9M/月	✅	阿里出品，中英双语与 Qwen Coder 深度集成

05 · 前五名深度解读

Kilo Code — 模型灵活性之王

本周 1.22T Token，与 OpenClaw（1.26T）仅差 40B，说明日活与使用深度极高。支持 500+ 模型、零溢价 BYOK，VS Code / JetBrains / CLI 全覆盖，Orchestrator 模式可协调规划 / 编码 / 调试子任务。适合需要在 IDE 内自由切换模型、又不想被单一厂商锁定的团队。

Claude Code — 推理天花板

本周 606B Token，稳居全平台第 4。终端原生、Sub-agent 并行、Plan Mode 与 Headless CI 成熟；macOS 上专项使用 Seatbelt 沙箱隔离。局限是仅支持 Claude 系列，重度使用成本较高。适合大型重构与预算充足的工程团队。

Hermes Agent — 用量王者

本周 4.94T Token，约为第二名 OpenClaw 的近 4 倍。完全免费开源，不限于编程，在研究、写作、自动化脚本中大规模部署。高 Token partly 反映「无人值守批处理」模式，与交互式 CLI 不可直接类比，但足以证明其渗透率。详见 Hermes Agent 安装指南。

Aider — Git 工作流专家

虽不在全平台 Top 10，但 41,200+ GitHub Stars 与最成熟的 Git 原生流程（自动 commit、Architect 双模型降本、Tree-sitter Repo Map 省 Token）使其仍是许多资深开发者的默认选择。不支持 MCP 与 Sub-agent，扩展性有限。

Cline — 安全审计派首选

「审批一切」哲学：每个文件修改与终端命令需显式确认；内置浏览器自动化与工作区 Checkpoint 回滚。适合对 AI 操作有合规审计需求的企业团队。

第 6–10 名速览：Goose 到 Qwen Code

Goose（Block 出品）以 Rust 编写，MCP 原生架构对接 1,700+ 服务，Recipes 系统可把「读 Issue → 修 Bug → 跑测试 → 发 PR」固化为可复用工作流；月 Token 约 46.4B，在 DevOps 场景中增长迅速。OpenCode GitHub Stars 已超 97,500，75+ 模型提供商、Docker 沙箱与 Headless CI 使其成为 2026 年增速最快的开源 CLI 之一。OpenAI Codex CLI 依托云端沙箱与 Codex 专属高速模型（宣称约 1000 Token/秒），适合不愿在本地执行不可信代码的团队。Roo Code 在 Cline 基础上增强任务看板与 Boomerang 子任务系统；Qwen Code 则在中英混合文档与 Qwen2.5-Coder 配合上表现突出，月 Token 约 39.9M 但中文社区增速稳定。

这五款工具虽未达到 Kilo / Claude 的全平台 Top 5 用量，但在细分场景（企业工具链、容器沙箱、中文代码库）中往往比「流量冠军」更贴合实际需求——选型时应以任务类型而非单纯排名做决策。

06 · 功能横向对比速查表

特性	Kilo	Claude Code	Hermes	Aider	Cline	Goose	OpenCode
开源	✅	❌	✅	✅	✅	✅	✅
MCP	✅	✅	✅	❌	✅	✅	✅
沙箱	—	Seatbelt	—	—	快照	Docker	Docker
Sub-agent	✅	✅	✅	❌	✅	✅	✅
免费 BYOK	✅	❌	✅	✅	✅	✅	✅
Git 集成	✅	✅	✅	✅✅	✅	✅	✅
浏览器自动化	❌	❌	❌	❌	✅	❌	❌

07 · 七类场景选型矩阵

场景	推荐工具	理由
A · 日常编码 + Git 历史整洁	Aider	自动 commit、双模型 Architect 降本
B · 大型重构 + 预算充足	Claude Code	推理最强，Sub-agent 并行
C · 最大模型灵活性	Kilo Code	500+ 模型，本周 1.22T 验证热度
D · 安全敏感 / 逐步审计	Cline	每步确认 + 快照回滚
E · DevOps / 工具链自动化	Goose	MCP 原生，Recipes 固化工作流
F · 预算有限 / 个人开发者	Hermes Agent	完全免费开源，4.94T 周用量
G · 中文开发者 / 阿里云生态	Qwen Code	中英混合文档与 Qwen Coder 优化

08 · 五步隔离试跑（HowTo）

租用隔离 macOS：Mac mini M4 起，SSH 接入；本地用户与 Apple ID 与主力机隔离。
为每款 CLI 创建独立 OpenRouter Key：设置周预算封顶，避免批处理误烧主 Key。
在同一仓库并行安装 2–3 款候选：例如 Aider + Kilo Code + Claude Code，跑固定 12k Token 编码 + 工具调用任务。
记录对照维度：延迟、Git diff 质量、MCP 可用性、沙箱是否触发误报、周账单美元。
导出 CSV 并释放环境：将结论写入团队 ADR，吊销测试 Key，退租擦盘。

                        # 示例：Aider + OpenRouter

                        export OPENROUTER_API_KEY="sk-or-test-..."

                        pip install aider-chat && aider --model openrouter/anthropic/claude-sonnet-4

                        # Kilo CLI

                        npm install -g @kilocode/cli && kilo

                        # 对照 OpenRouter Apps 排行

                        open https://openrouter.ai/apps

09 · Mac 租赁配置决策表

榜单内工具均支持 macOS；部分（如 Claude Code）对 Apple Silicon 沙箱有专项优化。按使用强度选型：

使用场景	推荐配置	说明
轻量 CLI（Aider、Hermes）	MacBook Air M2/M3，16GB	主要依赖云端 API，本地算力要求低
中等强度（Kilo、Cline）	MacBook Pro M3，16–32GB	多文件并发、浏览器自动化需更多内存
重度（Goose + Docker 沙箱）	Mac mini M4 Pro / MBP M4 Max，32GB+	并行 Agent + 容器对 I/O 与内存敏感
本地模型（Ollama + OpenCode）	Mac Studio M4 Ultra，64GB+	7B/14B 量化模型需大统一内存

M 系列统一内存架构让 CPU/GPU 共享内存池，即便只跑云端 CLI，长时 Agent 任务也能获得更低功耗与更安静的环境——对 7×24 试跑尤为重要。

按团队规模快速选型

团队规模	推荐组合	理由
个人开发者	Aider / Hermes Agent	免费、轻量、上手快
小团队（2–10 人）	Kilo Code / Cline	模型自由 + 可审计操作
中型团队（10–50 人）	Claude Code / Goose	强推理 + 企业工具链 MCP
大型企业	Claude Code + Kilo Code	推理天花板 + 500+ 模型灵活性

OpenRouter 官方榜单每周一滚动更新；阅读本文时建议同步打开 openrouter.ai/apps 核对最新 Token 量——CLI 排名随用量动态变化，但功能矩阵与场景选型逻辑在 2026 年下半年仍具参考价值。

10 · 常见问题

Q：Hermes 4.94T 为何远超其他 CLI？ 完全免费 + 开源，在自动化脚本与批处理中大规模无人值守部署，单流程即可产生巨量 Token；与 Aider 等「交互式」模式不同。

Q：OpenRouter 接入 CLI 要额外平台费吗？ 绝大多数模型无平台溢价；BYOK 模式下费用与直连 API 接近。

Q：初学者从哪款入手？ Aider（pip install aider-chat）最简单；其次 Hermes Agent 与 Kilo Code 文档完善。

虽然你可以在 Windows WSL 或 Linux 笔记本上试跑上述 CLI，但主力机混装生产 Key、Xcode 签名与多款 Agent 全局配置，一次误配就可能把 Opus 单价烧进 cron 批处理；WSL 文件系统与 macOS 原生 Seatbelt 沙箱体验也不等价。若你需要可审计的「多 CLI 并行对照 + OpenRouter 周账单」证据，又与 Apple 工具链同周期协作，在独立 macOS 租用节点完成 1–3 天试跑再决定是否自购顶配，通常比冲动下单 Studio 更轻、比污染主力环境更安全。套餐见 M 系列算力定价，上手见按天租用 Mac FAQ。