我把 Hermes Agent 跑了 30 天:它真的在變聰明,但有一個問題沒人告訴你
以及為什麼我最終月租 Mac Mini M4 而不是繼續用 VPS(2026)
我是一名獨立開發者,維護兩個 SaaS 程式碼庫,出差時主要靠 Telegram 協調。我想要的是能記住倉庫約定、每週自動彙總 GitHub Issue 的 Agent——不是關視窗就失憶的聊天分頁。三十個自然日裡,我先在廉價 Linux VPS 上跑 Hermes Agent(Nous Research,2026 年 2 月),再遷移到 MacDate 的 Mac mini M4 月租節點。本文是現場報告:~/.hermes/skills/ 裡的技能文件如何複利、Closed Learning Loop 為何不止「裝得上」、三個逼我換機的 VPS 痛點、帶 30 天實測註解的硬體對照表、24 個月買斷 vs 月租 TCO、六步遷移路徑、三條可貼進方案書的硬數據,以及何時月租 Apple 硬體比 VPS 和買斷都更理性。
多數 Hermes 教學停在安裝截圖:curl -fsSL https://get.hermes-agent.org | bash、Telegram ping 一下、再配一句「持久記憶真香」。它們很少講三十天曲線——第一週像 clever CLI 包裝;第三週 ~/.hermes/skills/ 裡已有 Agent 自己寫的 runbook;第四週你才意識到:宿主機器和模型一樣重要。我記錄了 uptime、Telegram 往返延遲、技能檔案數、state.db 體積,故事分得很清楚:Hermes 會按 schedule 變聰明,但前提是機器保持喚醒、可觸達、磁碟穩定。這是和 ChatGPT 對比時沒人強調的問題。本文與 Hermes Agent 7×24 常駐架構指南(主題 99)互補:那邊講三層記憶與選型理論,這邊用 lived numbers 和遷移敘事,不重複決策表推導。
目錄 · TABLE OF CONTENTS
01. 導語:這 30 天怎麼安排的
我是誰、要什麼:我不跑 70B 本地模型,Hermes 調 Claude 和 GPT API。我的 bar 是記憶連續性與流程複用——記住「push 前必須 make lint」、Cron 每週一 9 點發 Issue 摘要、別再每會話重講 CI 怪癖。Nous Research 把狀態全放在 ~/.hermes/:memories/MEMORY.md、USER.md、技能庫、SQLite state.db。Closed Learning Loop 的承諾是:任務完成 → 提煉成 SKILL.md → 下次直接載入摘要。三十天後我可以確認:承諾是真的,但對宿主的依賴 README 裡寫得太輕。
實驗結構(只換宿主,不換模型):
- 第 1–12 天:約 NT$200/月 Linux VPS(2 vCPU、4 GB 記憶體、40 GB SSD,美國西部)。一行 curl 安裝、Telegram 頻道、每日 GitHub digest Cron。
- 第 13–30 天:MacDate 香港節點 Mac mini M4 16GB 月租。還原
~/.hermes/tarball,同一套 API Key、同一個 Telegram Bot。
若你在評估 Hermes-3、Atropos RL 或 GEPA 自進化,結論一樣:學習循環是 uptime 產品,不是裝完就結束的 demo。
02. 真正變聰明的是什麼:技能文件與 Closed Learning Loop
Hermes 記憶分三層(細節見 主題 99 架構指南):短會話上下文、程序性技能文件、跨會話使用者模型。我的三十天裡,第二層才是 headline。
~/.hermes/skills/ 裡的技能文件
當 Hermes 完成非平凡工作流——例如「用 gh CLI 開 draft PR、打 label、等 required checks」——Closed Learning Loop 會在 ~/.hermes/skills/ 寫入技能檔案。每個 Skill 用 progressive disclosure:system prompt 裡一行摘要,相關時才展開完整命令序列。VPS 階段第 18 天,我已有 11 個技能檔案、合計約 84 KB。第 3 天需 12 次 tool call 的任務,第 15 天降到 4 次——Hermes 檢索自己的 procedure,不再重新推導 shell 參數。
這就是「變聰明」的實感。也是 ephemeral 宿主傷人的地方:技能是磁碟上的 Markdown,不備份就銷毀,等於抹掉 Agent 兩週掙來的程序性記憶。
記憶快照與會話交接
Hermes 為 prefix cache 在會話開始時凍結記憶快照——會話中寫入 MEMORY.md 會落盤,但要到下一會話才進 system prompt。Cron 與 Telegram 非同步回覆因此需要 daemon 線上,才能開新會話載入昨日寫入。我的 VPS 因伺服器提供商核心修補重啟兩次錯過 overnight Cron,每次讓 Skill consolidate 延遲一天。M4 月租節點上,連續三十夜 Cron 全部準時觸發。
03. 三個 VPS 痛點:逼我換 Mac mini M4 月租
VPS 派說得對:月費貼紙價碾壓一切 Apple 選項。十二天後我有三個錢解決不了的具體失敗。
痛點 1:非計畫宕機侵蝕 Closed Learning Loop
VPS 累計 7 小時 40 分非計畫 downtime——兩次維護視窗、一次 hypervisor 遷移。Hermes 因此錯過三次 Cron、約四十則 Telegram 訊息排隊到手動重啟。每次 gap 重置會話節奏:技能還在磁碟上,但 GEPA consolidate 和 Hindsight retain 本應在任務完成後跑——沒跑,Agent outage 後感覺「變笨了」,不是權重變了,而是循環是時間性的,需要連續行程時間,不只是持久檔案。
痛點 2:跨太平洋延遲讓 Telegram 像壞掉
從台北經美國西部 VPS,Telegram bot 往返延遲日誌均值 380–520 ms——非同步聊天勉強,「現在就跑」三連 tool call 很折磨。MacDate 香港 M4 節點同測試 45–90 ms。這不是 vanity:頻寬與路由更短 → 更少中途放棄 → 更多完成任務 → 更多技能寫入。延遲是學習率乘數。
痛點 3:Linux CPU-only 嵌入路徑卡住第三層 recall
我開了 Hindsight 做長程 recall。VPS 上 local_embedded 只能 CPU——無 Apple MPS、4 GB 記憶體盒子上無 CUDA。冷 recall 查詢超 8 秒;第 9 天為保 Telegram 回應關掉 Hindsight。Mac mini M4 統一記憶體(UMA)頻寬夠 embed 與 session_search 並發,典型查詢亞秒級,MPS workaround 見 GitHub #7135。VPS 省了錢,稅加在讓 Hermes 感覺「魔法」的記憶棧上。
04. 硬體對照表:樹莓派 vs VPS vs Mac mini M4(30 天實測註解)
遷移後我把對照表重填一遍,註解換成30 天欄位筆記,不是 spec sheet 泛泛而談——也不重複主題 99 的三層架構推導。
| 維度 | 樹莓派 5(8GB) | Linux VPS(2C4G) | Mac mini M4(16~24GB) |
|---|---|---|---|
| Hermes 安裝 | ARM64 Linux,自管 systemd | curl 成熟,公網 IP 現成 | macOS 原生 get.hermes-agent.org |
| 30 天 uptime(我的日誌) | 未測;homelab 斷電風險 | 96.7%(非計畫損失 7h40m) | 99.97%(一次 MacDate 計畫網路視窗) |
| Telegram RTT(台北) | 家用上行抖動 | 380–520 ms 美西 | 45–90 ms 香港節點 |
| 本地嵌入 / UMA | 純 CPU | 純 CPU,recall >8 s | UMA 頻寬;MPS + FORCE_CPU workaround |
| 7×24 功耗 / 噪音 | 約 5~8 W,無風扇 | 含在 VPS 月費 | 待機 4~7 W,峰值 <40 W,靜音 |
| 典型 Hermes 適配 | 極客 homelab、純 CLI | 最便宜試跑,備份紀律 mandatory | 生產級個人 Agent,Telegram + Cron + Skills |
脈衝負載(Ollama burst、4K 匯出、Xcode)見 主題 98 Mac mini M4 彈性租用 AI 工作站 TCO;本表針對always-on Agent 記憶,不是八小時剪輯會話。
05. 24 個月買斷 vs 月租 TCO 表(7×24 Hermes 場景)
Hermes 強制 7×24 成本模型:8760 小時/年,不是主題 98 的 56 天脈衝 crossover。下面是我決定月租 vs 桌下買斷前用的表。
| 24 個月成本項 | 買斷 Mac mini M4 16GB | VPS 2C4G 7×24 | MacDate 租用 · 180 天/年 | MacDate 租用 · 365 天/年 |
|---|---|---|---|---|
| 硬體 / 租金 | NT$49,900 | NT$200×24 = NT$4,800 | NT$680×360 = NT$244,800 | NT$680×730 = NT$496,400 |
| 7×24 電費(24 個月) | ≈ NT$3,600 | 含在 VPS | 含在租金 | 含在租金 |
| 頻寬 / 公網 IP | 家用上行 + DDNS | 含 | 100Mbps + 獨立 IP | 含 |
| 維運 / 磁碟擦除 | 自管更新、Time Machine | 快照另付費 | MDM + NIST 擦除 | 含 |
| 二手殘值(扣除) | -NT$20,000 | NT$0 | NT$0 | NT$0 |
| 24 個月 TCO 合計 | ≈ NT$33,500 | ≈ NT$4,800 | ≈ NT$244,800 | ≈ NT$496,400 |
三十天後的讀法:
- 確定兩年真·7×24 且 workflow 已驗證 → 買斷 Mac mini M4 淨 TCO 最優(≈ NT$33.5k),除非你極度看重 optionality。
- 六個月驗證或季節性開關 → MacDate 月租約 180 天/年(24 月 ≈ NT$245k)換 macOS 原生 Hermes、低延遲 Telegram、隔離
~/.hermes/——VPS 痛點後我的選擇。 - 可重建記憶的 disposable 實驗 → VPS 仍是地板;cron
tar備份到物件儲存不可省略。
套餐單價見 Mac mini M4 定價頁。MacDate 是 Apple 硬體彈性租用平台,與任何名為 Hermes 的第三方租賃服務無關。
06. 六步遷移:VPS 備份 → MacDate M4 → curl → 還原 → 頻道 → cron 備份
牆鐘時間約 90 分鐘。希望 day one 就有這六步。
- 租用 MacDate Mac mini M4 節點。純 API Hermes 選 16GB;同機 Ollama 14B 建議 M4 Pro 24GB。月租 billing 貼合「先證 30 天再決定」節奏。約 2 小時收到憑證。首次租用讀 按天租用 Mac 完全指南 FAQ。
- SSH 登入並驗證出站。
ssh -i ~/.ssh/macdate_key admin@[IP]。確認 macOS 版本、磁碟剩餘 >10GB、出站 HTTPS 正常。 - curl 安裝 Hermes Agent。 官方一行腳本,設定 LLM API Key,空
~/.hermes/上跑hermes doctor與hermes memory status。 - 還原 VPS tarball。 VPS 上
tar czf hermes-backup.tar.gz ~/.hermes/,SCP 到 M4,解壓到 home,重啟 gateway。技能數與state.db應對齊 day-twelve。 - 重接 Telegram 或 Discord。
hermes channels add telegram --token "$TELEGRAM_BOT_TOKEN",設 allowlist,手機發測試。節點區域匹配使用者時 RTT 應 <100 ms。 - 續租前設定 nightly 備份。 Cron
tar czf hermes-backup-$(date +%F).tar.gz ~/.hermes/加 off-boxscp。MacDate 釋放實例會 NIST 擦除——不備份等於格式化 Agent 大腦。
Apple Silicon 上啟用 Hindsight 前,先套用 CPU 嵌入 workaround:
07. 三條硬核數據(來自 30 天日誌)
寫方案書或團隊郵件時直接貼上,不要形容詞。
- ① 第 18 天 11 個技能檔案 / 84 KB(~/.hermes/skills/)——重複工作流 tool call 從約 12 次降到約 4 次;程序性記憶是有界 Markdown + progressive disclosure,不是 uncontrolled prompt 膨脹。
- ② 同月 VPS uptime 96.7% vs M4 月租 99.97%——VPS 損失 7h40m 對應三次 missed Cron digest,磁碟 state intact 但使用者感知「變笨一週」。
- ③ Telegram RTT 380–520 ms(美西 VPS)→ 45–90 ms(香港 M4),中位任務完成時間約降 28%——更少 abandoned 多步 thread → 每天更多 Closed Learning Loop 完成次數。
次要常數:MEMORY.md 上限約 2,200 字元、USER.md 約 1,375——Hermes 刻意 bound 內聯記憶;技能文件承載 long tail。典型完整 ~/.hermes/ 樹數月專案仍僅數十~數百 MB。
08. 轉化段:何時月租 Mac mini M4 是理性中間路線
三十天教會我:Hermes 不是週末 demo。~/.hermes/skills/ 裡的技能庫是 compound returns 資產——但複利需要 uptime、低延遲頻道、不跟 Hindsight 打架的 macOS 棧。主力 MacBook 7×24 常開:風扇、電池、Agent state 污染 dev 環境,全不 accept。workflow 未驗證就桌下買斷 Mac mini:NT$49,900 CapEx 加 M5 折舊焦慮。VPS 階段證明記憶 work;也證明宿主是每篇 Hermes 評測裡隱藏的變數。
MacDate 月租 Mac mini M4 是我留的路:裸機 macOS、原生 get.hermes-agent.org、獨立頻寬、香港低延遲 Telegram、釋放時 NIST 擦除。按月付 while Closed Learning Loop 自證,nightly tarball ~/.hermes/,把買斷 vs 365 天租決策推遲到有六個月技能成長曲線。比 365 天/年租(上表 ≈ NT$496k TCO)便宜,比廉價 VPS 可靠,比烤 laptop 電池乾淨。
要完整記憶架構與 Pi/VPS/M4 spec 對照、不要日記 tone,讀 主題 99 Hermes 7×24 指南。Ollama 與 4K 脈衝數學見 主題 98。並行跑 OpenClaw 做企業 IM?閘道分開——Hermes 記憶一台,OpenClaw 頻道一台。