📋 本文目錄

01 · 為何 CLI 週榜比 GitHub Stars 更可信

GitHub Stars 回答的是「誰在按讚」；OpenRouter App 排行回答的是「過去 7 天全球開發者實際燒掉了多少 Token」。前者可被行銷活動灌水，後者是用 API 金鑰投出來的行為數據——CLI 工具若選擇公開追蹤，每一筆請求都會累計到週榜，比任何評測文章都誠實。

OpenRouter 作為中立 API 聚合層，維護 openrouter.ai/apps 公開榜單。2026 年 6 月第一週，CLI 與 Agent 類工具合計消耗約平台週流量 70% 以上，說明終端原生 AI 助手已從「試用玩具」變成生產流水線的預設介面。這與站內 OpenRouter 週 Token 帳單解讀互補：那篇聚焦模型份額與溢價悖論；本篇聚焦CLI 工具誰在扛量。若你同時關心模型路由，可交叉閱讀 2026 大模型流行趨勢的 Agent 選型矩陣。

02 · 資料來源與統計方法

公開入口：openrouter.ai/apps，篩選維度為「This Week」（自然週，週一至週日）。核心口徑為輸入 + 輸出 Token 總量，僅統計選擇公開追蹤的應用——非全樣本，但覆蓋主流 CLI 與 Agent 閘道。本文錨定 2026 年 6 月 2 日–6 月 8 日快照，CLI 專項榜另綜合近 30 日累計、GitHub Stars 與功能完整度做排序調整（純娛樂類 App 如 Janitor AI 不計入 CLI 榜）。

讀榜時請區分兩列：全平台排名（含 Descript、Lemonade 等非開發工具）與CLI 專項排名（本文主線）。Hermes Agent 以 4.94T 登頂全平台，但大量 Token 來自自動化腳本與 7×24 閘道，與 Kilo Code、Claude Code 的「互動式編程」使用模式不同——選型時不能只看數字大小，還要看任務型態。

03 · 三大 CLI 選型痛點拆解

1. 把 Stars 當生產依據。 OpenCode 近月 GitHub Stars 衝破 97,500，但 OpenRouter 週榜尚未擠進全平台 Top 10——Stars 反映關注度，Token 反映付費或 BYOK 後的真實呼叫頻率。Cline 有 58,600+ Stars，週榜外卻有 ~140B/月 Token，說明重度用戶早已進入生產，而非停留在 README 階段。

2. 在主力機輪裝多套 CLI 污染環境。 同一台 MacBook 同時試 Kilo Code 外掛、Claude Code 全域 npm、Hermes 閘道，Keychain、~/.config 與 shell profile 極易殘留 API 金鑰。更穩妥的路徑：在可拋棄的租用 macOS 節點並行試跑，再推廣到團隊——邏輯同 Agent Skill 隔離試跑與零殘留歸還五步清單。

3. 忽略 CLI 與硬體的綁定關係。 Claude Code 的沙箱依賴 macOS Seatbelt；Goose 以 Rust 撰寫，Apple Silicon 上 I/O 延遲明顯低於 x86 VPS；Cline 的瀏覽器自動化需要足夠記憶體跑無頭 Chromium。在 8GB 老機上試完就否定某 CLI，往往是硬體瓶頸而非工具本身——這也是下文 Mac 租賃配置表的存在理由。

04 · 2026 年 6 月 CLI 專項 Top 10

下表合併本週 OpenRouter 公開資料與 CLI 專項評分。Token 量為 6/2–6/8 週快照或近 30 日累計（標註處）；榜單每週輪動，閱讀時請以官網即時資料為準。

CLI 排名	工具	全平台本週	Token 量	開源	核心亮點
1	Kilo Code	#3	1.22T	✅	500+ 模型、Architect／Code／Debug／Orchestrator 四模式
2	Claude Code	#4	606B	❌	終端原生、Sub-agent 編排、Seatbelt 沙箱
3	Hermes Agent	#1	4.94T	✅	Nous Research 全開源、7×24 閘道、Telegram 整合
4	Aider	榜外	~2.4B/月	✅	Git 原生最成熟、Architect 雙模型降本
5	Cline	榜外	~140B/月	✅	逐步審批、瀏覽器自動化、Checkpoint 回滾
6	Goose	榜外	~46.4B/月	✅	Block 出品、MCP 原生 1700+、Recipes 工作流
7	OpenCode	榜外	快速成長	✅	75+ 供應商、Docker 沙箱、Stars 增速最快
8	Codex CLI	榜外	~91B/月	✅	OpenAI 雲端沙箱、~1000 tok/s、Headless CI
9	Roo Code	榜外	~111.8B/月	✅	Cline 增強 Fork、Boomerang 子任務、任務看板
10	Qwen Code	榜外	~39.9M/月	✅	阿里雲出品、中英雙語、Qwen2.5-Coder 深度整合

三強解讀： Hermes 4.94T 是全平台第一，距第二名 OpenClaw（1.26T）近四倍——反映開源閘道在自動化、cron、Telegram Bot 場景的規模化部署；詳細部署可見 Hermes Agent 安裝指南。Kilo Code 1.22T 與 OpenClaw 僅差 40B，說明 IDE 外掛 + CLI 雙軌已深度滲透 VS Code／JetBrains 生態。Claude Code 606B 雖數字較小，但單價高、推理深度強，在企業複雜重構場景仍占溢價帶——呼應 Anthropic 溢價悖論的模型層邏輯。

榜外四傑（Aider、Cline、Goose、OpenCode）週 Token 未進全平台 Top 10，卻在 GitHub 社群與特定場景（Git 歷史、審計合規、DevOps MCP、CI Headless）有不可替代性——選 CLI 不能只看週榜名次，要看你的任務型態是否命中其設計哲學。

Top 3 速覽

Kilo Code：Apache-2.0 開源，VS Code／JetBrains 外掛 + CLI，BYOK 零溢價，500+ 模型一鍵切換 OpenRouter。四種工作模式讓同一工具覆蓋架構設計、直接改檔、除錯與多子任務編排——本週 1.22T 證明「模型自由 + IDE 原生」是 2026 年開發者最願意付 Token 的組合。

Claude Code：Anthropic 閉源終端代理，$20/月起或按 Token 計費。Sub-agent 並行、CLAUDE.md 專案記憶、Plan Mode 先規劃後執行、Headless CI 整合——在 SWE-bench 等基準持續領先，約占 GitHub AI 輔助提交 4%。限制是僅支援 Claude 系列，無法走 OpenRouter 多模型路由。

Hermes Agent：Nous Research 完全開源，免訂閱、免信用卡，可對接 OpenRouter 任意模型後端。4.94T 週量 partly 來自大量無人值守自動化——若你需要 7×24 個人助理或研究用 Agent，它是零門檻首選；若只要互動式寫 code，Kilo Code 或 Aider 可能更順手。

05 · 十款 CLI 功能對照表

橫向比較十款工具在開源、MCP、沙箱、Sub-agent、Plan Mode、Git 整合等維度的差異——選型時先圈定「不可妥協」欄位，再對照 Token 榜單。

功能	Kilo	Claude Code	Hermes	Aider	Cline	Goose	OpenCode	Codex	Roo	Qwen
開源	✅	❌	✅	✅	✅	✅	✅	✅	✅	✅
MCP	✅	✅	✅	❌	✅	✅✅	✅	✅	✅	✅
沙箱	❌	Seatbelt	❌	❌	快照	Docker	Docker	雲端	快照	Docker
Sub-agent	✅	✅	✅	❌	✅	✅	✅	✅	✅	✅
Plan Mode	✅	✅	✅	❌	✅	✅	✅	✅	✅	✅
Git 整合	✅	✅	✅	✅✅	✅	✅	✅	✅	✅	✅
瀏覽器自動化	❌	❌	❌	❌	✅	❌	❌	✅	✅	❌
模型數	500+	Claude	多	100+	全平台	多	75+	Codex	全平台	Qwen
BYOK 免費	✅	❌	✅	✅	✅	✅	✅	❌	✅	✅

幾個非直覺結論：Aider Git 整合最強但無 MCP，適合純終端 Git 工作流；Cline／Roo 是唯一內建瀏覽器自動化的 IDE 外掛路線，全端工程師值得優先試；Goose MCP 原生最徹底，適合已標準化 MCP 的 Platform 團隊；Codex CLI 雲端沙箱不污染本機，但綁定 OpenAI 計費，與 OpenRouter BYOK 路線不同。Gemini CLI 因 2026 年 6 月政策變更，免費訂閱路徑即將關閉，遷移議題見 Gemini CLI 政策解讀。

06 · 七類場景選型矩陣

場景	首選 CLI	次選	選型邏輯
A · 日常編碼 + Git 歷史整潔	Aider	Kilo Code	自動 commit、Architect 雙模型降本
B · 大型重構 + 預算充足	Claude Code	Goose	最強推理、Sub-agent 並行
C · 最大模型彈性	Kilo Code	OpenCode	500+ 模型、本週 1.22T 驗證
D · 合規審計／逐步確認	Cline	Roo Code	每步審批、Checkpoint 回滾
E · DevOps／MCP 工具鏈	Goose	Hermes	1700+ MCP、Recipes 可複用
F · 預算有限／7×24 自動化	Hermes Agent	Aider	全開源、4.94T 週量、零訂閱
G · 中文／阿里雲生態	Qwen Code	Kilo Code	中英雙語、Qwen2.5-Coder 最佳化

團隊規模補充：個人優先 Aider 或 Hermes；2–10 人小隊 Kilo Code + Cline 覆蓋模型自由與審計；10–50 人可 Claude Code 扛複雜推理、Goose 接 Jira／Slack MCP；企業常見組合是 Claude Code（合規推理）+ Kilo Code（500+ 模型試驗田），OpenRouter 統一帳單對帳。

若你的流水線已用 OpenClaw 作閘道，CLI 選型需與 models CLI 同步與快取交叉驗證，避免「CLI 顯示 A、Session 實際走 B」的幽靈路由。混合本機推理時，可搭配 ds4 本地 DeepSeek V4 Flash 作 API 回退。

07 · Mac 租賃硬體配置表

榜單前列 CLI 與 macOS 有天然綁定：Claude Code Seatbelt、Goose Rust 在 Apple Silicon 上的 I/O、Cline 無頭 Chromium 的記憶體需求。以下配置供「按日租用、隔離試跑」決策，非自購 TCO 結論。

使用強度	代表 CLI	建議配置	記憶體	說明
輕量	Aider、Hermes、Qwen Code	MacBook Air M3	16GB	主要走雲端 API，本機算力需求低
中等	Kilo Code、Cline、Roo Code	MacBook Pro M3 / Mac mini M4	16–32GB	多檔並行、瀏覽器自動化吃記憶體
重度	Goose + Docker、OpenCode 沙箱	Mac mini M4 Pro	32GB+	容器 + 並行 Agent 對 I/O 與記憶體要求高
本地模型	OpenCode + Ollama／ds4	Mac Studio M4 Max	64GB+	7B–14B 本機推理需統一記憶體架構

租賃優勢在於專案制彈性：黑客松試 Kilo Code 一週、合規 sprint 試 Cline 審計流、MCP 整合 spike 試 Goose——不同 CLI 對硬體差異大，按天切換配置比一次買斷 Mac Studio 更省。機房頻寬與獨立伺服器節點也讓大型 repo 基準上傳、SSH 多工終端更穩定；定價見裸機 macOS 定價，SSH 與 VNC 細節見按日租用 Mac FAQ。

08 · 五步隔離試跑（HowTo）

租用隔離 macOS。 Mac mini M4 16GB 起；要並跑 Goose Docker 或本機 ds4 則選 32GB+ Studio 規格。SSH 接入，勿登入生產 Apple ID；與主力機 Keychain 完全隔離。
快照 CLI 週榜。 記錄 openrouter.ai/apps 當週 Top 10 與自家 OpenRouter Usage CSV，對照本文 Kilo 1.22T、Hermes 4.94T、Claude Code 606B 錨點。
固定 A/B 任務。 選同一 12k Token 五工具重構任務，分別用 Kilo Code、Claude Code、Hermes（或 Aider）各跑一輪；記錄 p50／p95 延遲、USD 估算、工具呼叫成功率。
寫入 CLI 路由表。 依七類場景矩陣映射「主 CLI + 回退 CLI + OpenRouter model slug」；OpenClaw 使用者同步執行 openclaw models sync 避免快取漂移。
匯出證據並釋放。 CSV 拉回筆電、撤銷沙箱 API 金鑰、刪除 ~/.config 殘留，依零殘留歸還清單退租擦碟。未做第五步的團隊常付兩次錢：金鑰外洩 + 假陽性基準。

                        # 租用機沙箱：探測 OpenRouter 金鑰額度

                        export OPENROUTER_API_KEY=sk-or-sandbox-...

                        curl -H "Authorization: Bearer $OPENROUTER_API_KEY" \

                          https://openrouter.ai/api/v1/auth/key

                        # 對照本週 CLI App 排行

                        open https://openrouter.ai/apps

09 · 租用 vs 自購：CLI 試錯節奏

CLI 選型不是一次性決策。2026 年 6 月第一週榜單已證明：Hermes 可以一週燒 4.94T，Kilo Code 緊咬 OpenClaw，OpenCode Stars 暴漲但週榜尚未跟上——工具與模型每週都在換位。自購滿配 Mac Studio 在約每年 200 個有效開發日以上才比按日租賃划算；低於該門檻，按日租用只為 CLI 試錯活著的日子付費，並把 API 金鑰、npm 全域 CLI、OpenClaw 設定隔離在可拋棄節點。

雖然你可以在主力 MacBook 上直接 npm i -g @anthropic-ai/claude-code 或裝 Kilo Code 外掛，但多 CLI、多金鑰、多閘道版本疊在同一台機器，一次誤配就可能把 Opus 單價燒進 Hermes cron 批處理。Windows 或 Linux VPS 可跑部分 Node 閘道，但若流水線含 TestFlight 簽章、Metal 除錯、Keychain 型憑證，最終仍須回到原生 macOS——Claude Code 的 Seatbelt 在 macOS 上才有完整沙箱語意。在與生產一致的系統裡並行試跑三款 CLI，通常比「VPS 試 Hermes + 筆電試 Claude Code」更少半夜工單；機房頻寬也讓大型 monorepo 的 Aider repo-map 上傳更順。

六月 CLI 榜傳遞的市場訊息很直白：Hermes 扛自動化量、Kilo Code 扛 IDE 互動、Claude Code 扛高價推理——沒有唯一贏家，只有場景匹配。MacDate 提供裸機 Apple Silicon 節點；OpenRouter 提供模型與 App 帳單；你提供五步試跑紀律。延伸閱讀：OpenClaw 租用 Mac 部署、M4 彈性租用 TCO。