OpenRouter CLI 工具 Top 10
Kilo Code、Hermes、Claude Code 誰在用?
若你仍用 GitHub Stars 挑「預設 AI 命令列助手」,卻從未對照 OpenRouter 公開的 App 週 Token 吞吐量,等於拿社群聲量對抗真實帳單。本文面向在 Cursor、Claude Code、Aider、Cline 之間猶豫的開發者與技術主管,依 2026 年 6 月第一週(6/2–6/8)資料解讀 CLI 專項 Top 10——Hermes 4.94T、Kilo Code 1.22T、Claude Code 606B 等硬核數字,並提供十款功能對照表、七類場景選型矩陣、Apple Silicon 租賃配置表,以及五步隔離試跑清單。
📋 本文目錄
01 · 為何 CLI 週榜比 GitHub Stars 更可信
GitHub Stars 回答的是「誰在按讚」;OpenRouter App 排行回答的是「過去 7 天全球開發者實際燒掉了多少 Token」。前者可被行銷活動灌水,後者是用 API 金鑰投出來的行為數據——CLI 工具若選擇公開追蹤,每一筆請求都會累計到週榜,比任何評測文章都誠實。
OpenRouter 作為中立 API 聚合層,維護 openrouter.ai/apps 公開榜單。2026 年 6 月第一週,CLI 與 Agent 類工具合計消耗約平台週流量 70% 以上,說明終端原生 AI 助手已從「試用玩具」變成生產流水線的預設介面。這與站內 OpenRouter 週 Token 帳單解讀 互補:那篇聚焦模型份額與溢價悖論;本篇聚焦CLI 工具誰在扛量。若你同時關心模型路由,可交叉閱讀 2026 大模型流行趨勢 的 Agent 選型矩陣。
02 · 資料來源與統計方法
公開入口:openrouter.ai/apps,篩選維度為「This Week」(自然週,週一至週日)。核心口徑為輸入 + 輸出 Token 總量,僅統計選擇公開追蹤的應用——非全樣本,但覆蓋主流 CLI 與 Agent 閘道。本文錨定 2026 年 6 月 2 日–6 月 8 日快照,CLI 專項榜另綜合近 30 日累計、GitHub Stars 與功能完整度做排序調整(純娛樂類 App 如 Janitor AI 不計入 CLI 榜)。
讀榜時請區分兩列:全平台排名(含 Descript、Lemonade 等非開發工具)與CLI 專項排名(本文主線)。Hermes Agent 以 4.94T 登頂全平台,但大量 Token 來自自動化腳本與 7×24 閘道,與 Kilo Code、Claude Code 的「互動式編程」使用模式不同——選型時不能只看數字大小,還要看任務型態。
03 · 三大 CLI 選型痛點拆解
1. 把 Stars 當生產依據。 OpenCode 近月 GitHub Stars 衝破 97,500,但 OpenRouter 週榜尚未擠進全平台 Top 10——Stars 反映關注度,Token 反映付費或 BYOK 後的真實呼叫頻率。Cline 有 58,600+ Stars,週榜外卻有 ~140B/月 Token,說明重度用戶早已進入生產,而非停留在 README 階段。
2. 在主力機輪裝多套 CLI 污染環境。 同一台 MacBook 同時試 Kilo Code 外掛、Claude Code 全域 npm、Hermes 閘道,Keychain、~/.config 與 shell profile 極易殘留 API 金鑰。更穩妥的路徑:在可拋棄的租用 macOS 節點並行試跑,再推廣到團隊——邏輯同 Agent Skill 隔離試跑 與 零殘留歸還五步清單。
3. 忽略 CLI 與硬體的綁定關係。 Claude Code 的沙箱依賴 macOS Seatbelt;Goose 以 Rust 撰寫,Apple Silicon 上 I/O 延遲明顯低於 x86 VPS;Cline 的瀏覽器自動化需要足夠記憶體跑無頭 Chromium。在 8GB 老機上試完就否定某 CLI,往往是硬體瓶頸而非工具本身——這也是下文 Mac 租賃配置表的存在理由。
04 · 2026 年 6 月 CLI 專項 Top 10
下表合併本週 OpenRouter 公開資料與 CLI 專項評分。Token 量為 6/2–6/8 週快照或近 30 日累計(標註處);榜單每週輪動,閱讀時請以官網即時資料為準。
| CLI 排名 | 工具 | 全平台本週 | Token 量 | 開源 | 核心亮點 |
|---|---|---|---|---|---|
| 1 | Kilo Code | #3 | 1.22T | ✅ | 500+ 模型、Architect/Code/Debug/Orchestrator 四模式 |
| 2 | Claude Code | #4 | 606B | ❌ | 終端原生、Sub-agent 編排、Seatbelt 沙箱 |
| 3 | Hermes Agent | #1 | 4.94T | ✅ | Nous Research 全開源、7×24 閘道、Telegram 整合 |
| 4 | Aider | 榜外 | ~2.4B/月 | ✅ | Git 原生最成熟、Architect 雙模型降本 |
| 5 | Cline | 榜外 | ~140B/月 | ✅ | 逐步審批、瀏覽器自動化、Checkpoint 回滾 |
| 6 | Goose | 榜外 | ~46.4B/月 | ✅ | Block 出品、MCP 原生 1700+、Recipes 工作流 |
| 7 | OpenCode | 榜外 | 快速成長 | ✅ | 75+ 供應商、Docker 沙箱、Stars 增速最快 |
| 8 | Codex CLI | 榜外 | ~91B/月 | ✅ | OpenAI 雲端沙箱、~1000 tok/s、Headless CI |
| 9 | Roo Code | 榜外 | ~111.8B/月 | ✅ | Cline 增強 Fork、Boomerang 子任務、任務看板 |
| 10 | Qwen Code | 榜外 | ~39.9M/月 | ✅ | 阿里雲出品、中英雙語、Qwen2.5-Coder 深度整合 |
三強解讀: Hermes 4.94T 是全平台第一,距第二名 OpenClaw(1.26T)近四倍——反映開源閘道在自動化、cron、Telegram Bot 場景的規模化部署;詳細部署可見 Hermes Agent 安裝指南。Kilo Code 1.22T 與 OpenClaw 僅差 40B,說明 IDE 外掛 + CLI 雙軌已深度滲透 VS Code/JetBrains 生態。Claude Code 606B 雖數字較小,但單價高、推理深度強,在企業複雜重構場景仍占溢價帶——呼應 Anthropic 溢價悖論 的模型層邏輯。
榜外四傑(Aider、Cline、Goose、OpenCode)週 Token 未進全平台 Top 10,卻在 GitHub 社群與特定場景(Git 歷史、審計合規、DevOps MCP、CI Headless)有不可替代性——選 CLI 不能只看週榜名次,要看你的任務型態是否命中其設計哲學。
Top 3 速覽
Kilo Code:Apache-2.0 開源,VS Code/JetBrains 外掛 + CLI,BYOK 零溢價,500+ 模型一鍵切換 OpenRouter。四種工作模式讓同一工具覆蓋架構設計、直接改檔、除錯與多子任務編排——本週 1.22T 證明「模型自由 + IDE 原生」是 2026 年開發者最願意付 Token 的組合。
Claude Code:Anthropic 閉源終端代理,$20/月起或按 Token 計費。Sub-agent 並行、CLAUDE.md 專案記憶、Plan Mode 先規劃後執行、Headless CI 整合——在 SWE-bench 等基準持續領先,約占 GitHub AI 輔助提交 4%。限制是僅支援 Claude 系列,無法走 OpenRouter 多模型路由。
Hermes Agent:Nous Research 完全開源,免訂閱、免信用卡,可對接 OpenRouter 任意模型後端。4.94T 週量 partly 來自大量無人值守自動化——若你需要 7×24 個人助理或研究用 Agent,它是零門檻首選;若只要互動式寫 code,Kilo Code 或 Aider 可能更順手。
05 · 十款 CLI 功能對照表
橫向比較十款工具在開源、MCP、沙箱、Sub-agent、Plan Mode、Git 整合等維度的差異——選型時先圈定「不可妥協」欄位,再對照 Token 榜單。
| 功能 | Kilo | Claude Code | Hermes | Aider | Cline | Goose | OpenCode | Codex | Roo | Qwen |
|---|---|---|---|---|---|---|---|---|---|---|
| 開源 | ✅ | ❌ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| MCP | ✅ | ✅ | ✅ | ❌ | ✅ | ✅✅ | ✅ | ✅ | ✅ | ✅ |
| 沙箱 | ❌ | Seatbelt | ❌ | ❌ | 快照 | Docker | Docker | 雲端 | 快照 | Docker |
| Sub-agent | ✅ | ✅ | ✅ | ❌ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Plan Mode | ✅ | ✅ | ✅ | ❌ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Git 整合 | ✅ | ✅ | ✅ | ✅✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| 瀏覽器自動化 | ❌ | ❌ | ❌ | ❌ | ✅ | ❌ | ❌ | ✅ | ✅ | ❌ |
| 模型數 | 500+ | Claude | 多 | 100+ | 全平台 | 多 | 75+ | Codex | 全平台 | Qwen |
| BYOK 免費 | ✅ | ❌ | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ✅ | ✅ |
幾個非直覺結論:Aider Git 整合最強但無 MCP,適合純終端 Git 工作流;Cline/Roo 是唯一內建瀏覽器自動化的 IDE 外掛路線,全端工程師值得優先試;Goose MCP 原生最徹底,適合已標準化 MCP 的 Platform 團隊;Codex CLI 雲端沙箱不污染本機,但綁定 OpenAI 計費,與 OpenRouter BYOK 路線不同。Gemini CLI 因 2026 年 6 月政策變更,免費訂閱路徑即將關閉,遷移議題見 Gemini CLI 政策解讀。
06 · 七類場景選型矩陣
| 場景 | 首選 CLI | 次選 | 選型邏輯 |
|---|---|---|---|
| A · 日常編碼 + Git 歷史整潔 | Aider | Kilo Code | 自動 commit、Architect 雙模型降本 |
| B · 大型重構 + 預算充足 | Claude Code | Goose | 最強推理、Sub-agent 並行 |
| C · 最大模型彈性 | Kilo Code | OpenCode | 500+ 模型、本週 1.22T 驗證 |
| D · 合規審計/逐步確認 | Cline | Roo Code | 每步審批、Checkpoint 回滾 |
| E · DevOps/MCP 工具鏈 | Goose | Hermes | 1700+ MCP、Recipes 可複用 |
| F · 預算有限/7×24 自動化 | Hermes Agent | Aider | 全開源、4.94T 週量、零訂閱 |
| G · 中文/阿里雲生態 | Qwen Code | Kilo Code | 中英雙語、Qwen2.5-Coder 最佳化 |
團隊規模補充:個人優先 Aider 或 Hermes;2–10 人小隊 Kilo Code + Cline 覆蓋模型自由與審計;10–50 人可 Claude Code 扛複雜推理、Goose 接 Jira/Slack MCP;企業常見組合是 Claude Code(合規推理)+ Kilo Code(500+ 模型試驗田),OpenRouter 統一帳單對帳。
若你的流水線已用 OpenClaw 作閘道,CLI 選型需與 models CLI 同步與快取 交叉驗證,避免「CLI 顯示 A、Session 實際走 B」的幽靈路由。混合本機推理時,可搭配 ds4 本地 DeepSeek V4 Flash 作 API 回退。
07 · Mac 租賃硬體配置表
榜單前列 CLI 與 macOS 有天然綁定:Claude Code Seatbelt、Goose Rust 在 Apple Silicon 上的 I/O、Cline 無頭 Chromium 的記憶體需求。以下配置供「按日租用、隔離試跑」決策,非自購 TCO 結論。
| 使用強度 | 代表 CLI | 建議配置 | 記憶體 | 說明 |
|---|---|---|---|---|
| 輕量 | Aider、Hermes、Qwen Code | MacBook Air M3 | 16GB | 主要走雲端 API,本機算力需求低 |
| 中等 | Kilo Code、Cline、Roo Code | MacBook Pro M3 / Mac mini M4 | 16–32GB | 多檔並行、瀏覽器自動化吃記憶體 |
| 重度 | Goose + Docker、OpenCode 沙箱 | Mac mini M4 Pro | 32GB+ | 容器 + 並行 Agent 對 I/O 與記憶體要求高 |
| 本地模型 | OpenCode + Ollama/ds4 | Mac Studio M4 Max | 64GB+ | 7B–14B 本機推理需統一記憶體架構 |
租賃優勢在於專案制彈性:黑客松試 Kilo Code 一週、合規 sprint 試 Cline 審計流、MCP 整合 spike 試 Goose——不同 CLI 對硬體差異大,按天切換配置比一次買斷 Mac Studio 更省。機房頻寬與獨立伺服器節點也讓大型 repo 基準上傳、SSH 多工終端更穩定;定價見 裸機 macOS 定價,SSH 與 VNC 細節見 按日租用 Mac FAQ。
08 · 五步隔離試跑(HowTo)
- 租用隔離 macOS。 Mac mini M4 16GB 起;要並跑 Goose Docker 或本機 ds4 則選 32GB+ Studio 規格。SSH 接入,勿登入生產 Apple ID;與主力機 Keychain 完全隔離。
- 快照 CLI 週榜。 記錄 openrouter.ai/apps 當週 Top 10 與自家 OpenRouter Usage CSV,對照本文 Kilo 1.22T、Hermes 4.94T、Claude Code 606B 錨點。
- 固定 A/B 任務。 選同一 12k Token 五工具重構任務,分別用 Kilo Code、Claude Code、Hermes(或 Aider)各跑一輪;記錄 p50/p95 延遲、USD 估算、工具呼叫成功率。
- 寫入 CLI 路由表。 依七類場景矩陣映射「主 CLI + 回退 CLI + OpenRouter model slug」;OpenClaw 使用者同步執行
openclaw models sync避免快取漂移。 - 匯出證據並釋放。 CSV 拉回筆電、撤銷沙箱 API 金鑰、刪除
~/.config殘留,依 零殘留歸還清單 退租擦碟。未做第五步的團隊常付兩次錢:金鑰外洩 + 假陽性基準。
# 租用機沙箱:探測 OpenRouter 金鑰額度export OPENROUTER_API_KEY=sk-or-sandbox-...curl -H "Authorization: Bearer $OPENROUTER_API_KEY" \ https://openrouter.ai/api/v1/auth/key# 對照本週 CLI App 排行open https://openrouter.ai/apps
09 · 租用 vs 自購:CLI 試錯節奏
CLI 選型不是一次性決策。2026 年 6 月第一週榜單已證明:Hermes 可以一週燒 4.94T,Kilo Code 緊咬 OpenClaw,OpenCode Stars 暴漲但週榜尚未跟上——工具與模型每週都在換位。自購滿配 Mac Studio 在約每年 200 個有效開發日以上才比按日租賃划算;低於該門檻,按日租用只為 CLI 試錯活著的日子付費,並把 API 金鑰、npm 全域 CLI、OpenClaw 設定隔離在可拋棄節點。
雖然你可以在主力 MacBook 上直接 npm i -g @anthropic-ai/claude-code 或裝 Kilo Code 外掛,但多 CLI、多金鑰、多閘道版本疊在同一台機器,一次誤配就可能把 Opus 單價燒進 Hermes cron 批處理。Windows 或 Linux VPS 可跑部分 Node 閘道,但若流水線含 TestFlight 簽章、Metal 除錯、Keychain 型憑證,最終仍須回到原生 macOS——Claude Code 的 Seatbelt 在 macOS 上才有完整沙箱語意。在與生產一致的系統裡並行試跑三款 CLI,通常比「VPS 試 Hermes + 筆電試 Claude Code」更少半夜工單;機房頻寬也讓大型 monorepo 的 Aider repo-map 上傳更順。
六月 CLI 榜傳遞的市場訊息很直白:Hermes 扛自動化量、Kilo Code 扛 IDE 互動、Claude Code 扛高價推理——沒有唯一贏家,只有場景匹配。MacDate 提供裸機 Apple Silicon 節點;OpenRouter 提供模型與 App 帳單;你提供五步試跑紀律。延伸閱讀:OpenClaw 租用 Mac 部署、M4 彈性租用 TCO。