OpenRouter CLI 工具
Top 10 谁在用?
如果你在 Kilo Code、Claude Code、Aider 之间反复横跳,却从不看 OpenRouter 官方应用级 Token 用量,很可能在用 GitHub Stars 对抗真实账单。本文面向正在选型 AI 命令行助手的开发者与技术负责人,基于 2026 年 6 月 2–8 日「This Week」公开数据解读 CLI 专项 Top 10(含 Hermes Agent 4.94T、Kilo Code 1.22T、Claude Code 606B),并给出功能横向对比表、七类场景选型矩阵、五步隔离试跑与 Mac 租赁配置决策表。
📋 本文目录
01 · OpenRouter 是什么?CLI 专项榜怎么读?
OpenRouter 是统一 AI 模型路由平台:一个 API Key 可接入数百个 LLM,并维护公开的 Top Apps 排行榜。接入工具若选择公开追踪,其 Token 消耗会对所有人可见——这比 GitHub Stars 更能反映实际使用频率。
本文在 2026 年 6 月 2–8 日「This Week」全平台数据基础上,筛选终端可用、面向开发者的 CLI / Agent 类工具,并结合 GitHub Stars、MCP 支持、沙箱能力与社区口碑做 CLI 专项综合排名。与站内 周 Token 账单解读、大模型流行趋势 互补:那两篇讲模型层与账单层,本篇聚焦「你用哪款 CLI 在烧 Token」。
02 · 三大选型痛点拆解
1. 把「模型榜」当成「工具榜」。 DeepSeek V4 Flash 周 Token 再高,也不等于你的团队该换 Aider 为默认 CLI。模型路由在 API 层;CLI 层决定 Git 集成、沙箱、MCP、Plan Mode 等工程体验——两层决策不可混为一谈。
2. 在主力 Mac 上并行装五款 CLI。 每款工具都会写全局配置、缓存 API Key、甚至改 shell 别名。一次误配可能把生产 OpenRouter Key 暴露给实验性 Agent。更稳妥的做法是在可丢弃的租用 macOS 并行试跑,对照账单后再锁定主力——逻辑同 Agent Skill 隔离试跑。
3. 忽视硬件与 CLI 的匹配。 Goose / OpenCode 的 Docker 沙箱、本地 Ollama 后端,对内存与 I/O 要求远高于纯 API 型 Aider。选错机器会出现「CLI 本身没问题,但沙箱 OOM」的假象,从而误判工具能力。
03 · 本周全平台 Top 10 快照(6/2–6/8)
截至 2026 年 6 月 8 日,OpenRouter 本周全平台 Token 消耗前列中,CLI 与 Agent 类工具表现突出:
| 全平台排名 | 工具 | 类型 | 本周 Token |
|---|---|---|---|
| 1 | Hermes Agent | AI Agent(CLI) | 4.94T |
| 2 | OpenClaw | 通用 Agent | 1.26T |
| 3 | Kilo Code | CLI / IDE 插件 | 1.22T |
| 4 | Claude Code | 终端原生 CLI | 606B |
| 5–10 | Descript、pi、Lemonade 等 | 非纯开发类 | 218B–454B |
关键趋势: CLI 与 Agent 类工具合计消耗本周约 70%+ Token 量;Kilo Code 与 Claude Code 双双挤进全平台 Top 5,说明「在终端里写代码」已从尝鲜进入主流生产流量。
04 · CLI 工具专项 Top 10 综合榜
下表综合本周 OpenRouter 实时数据、近 30 日累计表现与功能完整度。纯娱乐 / 非开发类应用不计入。
| CLI 排名 | 工具 | 本周 Token | 开源 | 核心亮点 |
|---|---|---|---|---|
| 🥇 1 | Kilo Code | 1.22T(全平台 #3) | ✅ | 500+ 模型,Architect/Code/Debug/Orchestrator 四模式 |
| 🥈 2 | Claude Code | 606B(全平台 #4) | ❌ | 最强推理,Sub-agent,macOS Seatbelt 沙箱 |
| 🥉 3 | Hermes Agent | 4.94T(全平台 #1) | ✅ | 完全开源,零门槛,自动化场景渗透极深 |
| 4 | Aider | ~2.4B/月 | ✅ | Git 原生,41,200+ Stars,最成熟纯 CLI |
| 5 | Cline | ~140B/月 | ✅ | 逐步审批,浏览器自动化,58,600+ Stars |
| 6 | Goose | ~46.4B/月 | ✅ | MCP 原生 1700+ 服务,Recipes 工作流 |
| 7 | OpenCode | 快速增长 | ✅ | 75+ 提供商,97,500+ Stars,增速最快 |
| 8 | OpenAI Codex CLI | ~91B/月 | ✅ | 云端沙箱,Codex 专属高速模型 |
| 9 | Roo Code | ~111.8B/月 | ✅ | Cline 增强 Fork,任务看板与 Boomerang |
| 10 | Qwen Code | ~39.9M/月 | ✅ | 阿里出品,中英双语与 Qwen Coder 深度集成 |
05 · 前五名深度解读
Kilo Code — 模型灵活性之王
本周 1.22T Token,与 OpenClaw(1.26T)仅差 40B,说明日活与使用深度极高。支持 500+ 模型、零溢价 BYOK,VS Code / JetBrains / CLI 全覆盖,Orchestrator 模式可协调规划 / 编码 / 调试子任务。适合需要在 IDE 内自由切换模型、又不想被单一厂商锁定的团队。
Claude Code — 推理天花板
本周 606B Token,稳居全平台第 4。终端原生、Sub-agent 并行、Plan Mode 与 Headless CI 成熟;macOS 上专项使用 Seatbelt 沙箱隔离。局限是仅支持 Claude 系列,重度使用成本较高。适合大型重构与预算充足的工程团队。
Hermes Agent — 用量王者
本周 4.94T Token,约为第二名 OpenClaw 的近 4 倍。完全免费开源,不限于编程,在研究、写作、自动化脚本中大规模部署。高 Token partly 反映「无人值守批处理」模式,与交互式 CLI 不可直接类比,但足以证明其渗透率。详见 Hermes Agent 安装指南。
Aider — Git 工作流专家
虽不在全平台 Top 10,但 41,200+ GitHub Stars 与最成熟的 Git 原生流程(自动 commit、Architect 双模型降本、Tree-sitter Repo Map 省 Token)使其仍是许多资深开发者的默认选择。不支持 MCP 与 Sub-agent,扩展性有限。
Cline — 安全审计派首选
「审批一切」哲学:每个文件修改与终端命令需显式确认;内置浏览器自动化与工作区 Checkpoint 回滚。适合对 AI 操作有合规审计需求的企业团队。
第 6–10 名速览:Goose 到 Qwen Code
Goose(Block 出品)以 Rust 编写,MCP 原生架构对接 1,700+ 服务,Recipes 系统可把「读 Issue → 修 Bug → 跑测试 → 发 PR」固化为可复用工作流;月 Token 约 46.4B,在 DevOps 场景中增长迅速。OpenCode GitHub Stars 已超 97,500,75+ 模型提供商、Docker 沙箱与 Headless CI 使其成为 2026 年增速最快的开源 CLI 之一。OpenAI Codex CLI 依托云端沙箱与 Codex 专属高速模型(宣称约 1000 Token/秒),适合不愿在本地执行不可信代码的团队。Roo Code 在 Cline 基础上增强任务看板与 Boomerang 子任务系统;Qwen Code 则在中英混合文档与 Qwen2.5-Coder 配合上表现突出,月 Token 约 39.9M 但中文社区增速稳定。
这五款工具虽未达到 Kilo / Claude 的全平台 Top 5 用量,但在细分场景(企业工具链、容器沙箱、中文代码库)中往往比「流量冠军」更贴合实际需求——选型时应以任务类型而非单纯排名做决策。
06 · 功能横向对比速查表
| 特性 | Kilo | Claude Code | Hermes | Aider | Cline | Goose | OpenCode |
|---|---|---|---|---|---|---|---|
| 开源 | ✅ | ❌ | ✅ | ✅ | ✅ | ✅ | ✅ |
| MCP | ✅ | ✅ | ✅ | ❌ | ✅ | ✅ | ✅ |
| 沙箱 | — | Seatbelt | — | — | 快照 | Docker | Docker |
| Sub-agent | ✅ | ✅ | ✅ | ❌ | ✅ | ✅ | ✅ |
| 免费 BYOK | ✅ | ❌ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Git 集成 | ✅ | ✅ | ✅ | ✅✅ | ✅ | ✅ | ✅ |
| 浏览器自动化 | ❌ | ❌ | ❌ | ❌ | ✅ | ❌ | ❌ |
07 · 七类场景选型矩阵
| 场景 | 推荐工具 | 理由 |
|---|---|---|
| A · 日常编码 + Git 历史整洁 | Aider | 自动 commit、双模型 Architect 降本 |
| B · 大型重构 + 预算充足 | Claude Code | 推理最强,Sub-agent 并行 |
| C · 最大模型灵活性 | Kilo Code | 500+ 模型,本周 1.22T 验证热度 |
| D · 安全敏感 / 逐步审计 | Cline | 每步确认 + 快照回滚 |
| E · DevOps / 工具链自动化 | Goose | MCP 原生,Recipes 固化工作流 |
| F · 预算有限 / 个人开发者 | Hermes Agent | 完全免费开源,4.94T 周用量 |
| G · 中文开发者 / 阿里云生态 | Qwen Code | 中英混合文档与 Qwen Coder 优化 |
08 · 五步隔离试跑(HowTo)
- 租用隔离 macOS:Mac mini M4 起,SSH 接入;本地用户与 Apple ID 与主力机隔离。
- 为每款 CLI 创建独立 OpenRouter Key:设置周预算封顶,避免批处理误烧主 Key。
- 在同一仓库并行安装 2–3 款候选:例如 Aider + Kilo Code + Claude Code,跑固定 12k Token 编码 + 工具调用任务。
- 记录对照维度:延迟、Git diff 质量、MCP 可用性、沙箱是否触发误报、周账单美元。
- 导出 CSV 并释放环境:将结论写入团队 ADR,吊销测试 Key,退租擦盘。
# 示例:Aider + OpenRouterexport OPENROUTER_API_KEY="sk-or-test-..."pip install aider-chat && aider --model openrouter/anthropic/claude-sonnet-4# Kilo CLInpm install -g @kilocode/cli && kilo# 对照 OpenRouter Apps 排行open https://openrouter.ai/apps
09 · Mac 租赁配置决策表
榜单内工具均支持 macOS;部分(如 Claude Code)对 Apple Silicon 沙箱有专项优化。按使用强度选型:
| 使用场景 | 推荐配置 | 说明 |
|---|---|---|
| 轻量 CLI(Aider、Hermes) | MacBook Air M2/M3,16GB | 主要依赖云端 API,本地算力要求低 |
| 中等强度(Kilo、Cline) | MacBook Pro M3,16–32GB | 多文件并发、浏览器自动化需更多内存 |
| 重度(Goose + Docker 沙箱) | Mac mini M4 Pro / MBP M4 Max,32GB+ | 并行 Agent + 容器对 I/O 与内存敏感 |
| 本地模型(Ollama + OpenCode) | Mac Studio M4 Ultra,64GB+ | 7B/14B 量化模型需大统一内存 |
M 系列统一内存架构让 CPU/GPU 共享内存池,即便只跑云端 CLI,长时 Agent 任务也能获得更低功耗与更安静的环境——对 7×24 试跑尤为重要。
按团队规模快速选型
| 团队规模 | 推荐组合 | 理由 |
|---|---|---|
| 个人开发者 | Aider / Hermes Agent | 免费、轻量、上手快 |
| 小团队(2–10 人) | Kilo Code / Cline | 模型自由 + 可审计操作 |
| 中型团队(10–50 人) | Claude Code / Goose | 强推理 + 企业工具链 MCP |
| 大型企业 | Claude Code + Kilo Code | 推理天花板 + 500+ 模型灵活性 |
OpenRouter 官方榜单每周一滚动更新;阅读本文时建议同步打开 openrouter.ai/apps 核对最新 Token 量——CLI 排名随用量动态变化,但功能矩阵与场景选型逻辑在 2026 年下半年仍具参考价值。
10 · 常见问题
Q:Hermes 4.94T 为何远超其他 CLI? 完全免费 + 开源,在自动化脚本与批处理中大规模无人值守部署,单流程即可产生巨量 Token;与 Aider 等「交互式」模式不同。
Q:OpenRouter 接入 CLI 要额外平台费吗? 绝大多数模型无平台溢价;BYOK 模式下费用与直连 API 接近。
Q:初学者从哪款入手? Aider(pip install aider-chat)最简单;其次 Hermes Agent 与 Kilo Code 文档完善。
虽然你可以在 Windows WSL 或 Linux 笔记本上试跑上述 CLI,但主力机混装生产 Key、Xcode 签名与多款 Agent 全局配置,一次误配就可能把 Opus 单价烧进 cron 批处理;WSL 文件系统与 macOS 原生 Seatbelt 沙箱体验也不等价。若你需要可审计的「多 CLI 并行对照 + OpenRouter 周账单」证据,又与 Apple 工具链同周期协作,在独立 macOS 租用节点完成 1–3 天试跑再决定是否自购顶配,通常比冲动下单 Studio 更轻、比污染主力环境更安全。套餐见 M 系列算力定价,上手见 按天租用 Mac FAQ。