我把 Hermes Agent 跑了 30 天:它真的在變聰明,但有一個問題沒人告訴你
以及為什麼我最終月租 Mac Mini M4 而不是繼續用 VPS(2026)

我是一名獨立開發者,維護兩個 SaaS 程式碼庫,出差時主要靠 Telegram 協調。我想要的是能記住倉庫約定、每週自動彙總 GitHub Issue 的 Agent——不是關視窗就失憶的聊天分頁。三十個自然日裡,我先在廉價 Linux VPS 上跑 Hermes AgentNous Research,2026 年 2 月),再遷移到 MacDate 的 Mac mini M4 月租節點。本文是現場報告:~/.hermes/skills/ 裡的技能文件如何複利、Closed Learning Loop 為何不止「裝得上」、三個逼我換機的 VPS 痛點、帶 30 天實測註解的硬體對照表、24 個月買斷 vs 月租 TCO、六步遷移路徑、三條可貼進方案書的硬數據,以及何時月租 Apple 硬體比 VPS 和買斷都更理性。

Hermes Agent 30 天實測:技能文件複利與 Mac mini M4 月租遷移

多數 Hermes 教學停在安裝截圖:curl -fsSL https://get.hermes-agent.org | bash、Telegram ping 一下、再配一句「持久記憶真香」。它們很少講三十天曲線——第一週像 clever CLI 包裝;第三週 ~/.hermes/skills/ 裡已有 Agent 自己寫的 runbook;第四週你才意識到:宿主機器和模型一樣重要。我記錄了 uptime、Telegram 往返延遲、技能檔案數、state.db 體積,故事分得很清楚:Hermes 會按 schedule 變聰明,但前提是機器保持喚醒、可觸達、磁碟穩定。這是和 ChatGPT 對比時沒人強調的問題。本文與 Hermes Agent 7×24 常駐架構指南(主題 99)互補:那邊講三層記憶與選型理論,這邊用 lived numbers 和遷移敘事,不重複決策表推導。

01. 導語:這 30 天怎麼安排的

我是誰、要什麼:我不跑 70B 本地模型,Hermes 調 Claude 和 GPT API。我的 bar 是記憶連續性與流程複用——記住「push 前必須 make lint」、Cron 每週一 9 點發 Issue 摘要、別再每會話重講 CI 怪癖。Nous Research 把狀態全放在 ~/.hermes/memories/MEMORY.mdUSER.md、技能庫、SQLite state.db。Closed Learning Loop 的承諾是:任務完成 → 提煉成 SKILL.md → 下次直接載入摘要。三十天後我可以確認:承諾是真的,但對宿主的依賴 README 裡寫得太輕。

實驗結構(只換宿主,不換模型):

  • 第 1–12 天:約 NT$200/月 Linux VPS(2 vCPU、4 GB 記憶體、40 GB SSD,美國西部)。一行 curl 安裝、Telegram 頻道、每日 GitHub digest Cron。
  • 第 13–30 天:MacDate 香港節點 Mac mini M4 16GB 月租。還原 ~/.hermes/ tarball,同一套 API Key、同一個 Telegram Bot。

若你在評估 Hermes-3、Atropos RL 或 GEPA 自進化,結論一樣:學習循環是 uptime 產品,不是裝完就結束的 demo。

02. 真正變聰明的是什麼:技能文件與 Closed Learning Loop

Hermes 記憶分三層(細節見 主題 99 架構指南):短會話上下文、程序性技能文件、跨會話使用者模型。我的三十天裡,第二層才是 headline。

~/.hermes/skills/ 裡的技能文件

當 Hermes 完成非平凡工作流——例如「用 gh CLI 開 draft PR、打 label、等 required checks」——Closed Learning Loop 會在 ~/.hermes/skills/ 寫入技能檔案。每個 Skill 用 progressive disclosure:system prompt 裡一行摘要,相關時才展開完整命令序列。VPS 階段第 18 天,我已有 11 個技能檔案、合計約 84 KB。第 3 天需 12 次 tool call 的任務,第 15 天降到 4 次——Hermes 檢索自己的 procedure,不再重新推導 shell 參數。

這就是「變聰明」的實感。也是 ephemeral 宿主傷人的地方:技能是磁碟上的 Markdown,不備份就銷毀,等於抹掉 Agent 兩週掙來的程序性記憶。

記憶快照與會話交接

Hermes 為 prefix cache 在會話開始時凍結記憶快照——會話中寫入 MEMORY.md 會落盤,但要到下一會話才進 system prompt。Cron 與 Telegram 非同步回覆因此需要 daemon 線上,才能開新會話載入昨日寫入。我的 VPS 因伺服器提供商核心修補重啟兩次錯過 overnight Cron,每次讓 Skill consolidate 延遲一天。M4 月租節點上,連續三十夜 Cron 全部準時觸發。

💡 誠實上限:技能文件讓 Hermes 感覺更聰明,不替好模型背鍋。API 路由錯了仍會 confident 地推壞 commit。Skill 減少重複摩擦,不填 fundamental reasoning gap。

03. 三個 VPS 痛點:逼我換 Mac mini M4 月租

VPS 派說得對:月費貼紙價碾壓一切 Apple 選項。十二天後我有三個錢解決不了的具體失敗。

痛點 1:非計畫宕機侵蝕 Closed Learning Loop

VPS 累計 7 小時 40 分非計畫 downtime——兩次維護視窗、一次 hypervisor 遷移。Hermes 因此錯過三次 Cron、約四十則 Telegram 訊息排隊到手動重啟。每次 gap 重置會話節奏:技能還在磁碟上,但 GEPA consolidate 和 Hindsight retain 本應在任務完成後跑——沒跑,Agent outage 後感覺「變笨了」,不是權重變了,而是循環是時間性的,需要連續行程時間,不只是持久檔案。

痛點 2:跨太平洋延遲讓 Telegram 像壞掉

從台北經美國西部 VPS,Telegram bot 往返延遲日誌均值 380–520 ms——非同步聊天勉強,「現在就跑」三連 tool call 很折磨。MacDate 香港 M4 節點同測試 45–90 ms。這不是 vanity:頻寬與路由更短 → 更少中途放棄 → 更多完成任務 → 更多技能寫入。延遲是學習率乘數。

痛點 3:Linux CPU-only 嵌入路徑卡住第三層 recall

我開了 Hindsight 做長程 recall。VPS 上 local_embedded 只能 CPU——無 Apple MPS、4 GB 記憶體盒子上無 CUDA。冷 recall 查詢超 8 秒;第 9 天為保 Telegram 回應關掉 Hindsight。Mac mini M4 統一記憶體(UMA)頻寬夠 embed 與 session_search 並發,典型查詢亞秒級,MPS workaround 見 GitHub #7135。VPS 省了錢,稅加在讓 Hermes 感覺「魔法」的記憶棧上。

04. 硬體對照表:樹莓派 vs VPS vs Mac mini M4(30 天實測註解)

遷移後我把對照表重填一遍,註解換成30 天欄位筆記,不是 spec sheet 泛泛而談——也不重複主題 99 的三層架構推導。

維度 樹莓派 5(8GB) Linux VPS(2C4G) Mac mini M4(16~24GB)
Hermes 安裝 ARM64 Linux,自管 systemd curl 成熟,公網 IP 現成 macOS 原生 get.hermes-agent.org
30 天 uptime(我的日誌) 未測;homelab 斷電風險 96.7%(非計畫損失 7h40m) 99.97%(一次 MacDate 計畫網路視窗)
Telegram RTT(台北) 家用上行抖動 380–520 ms 美西 45–90 ms 香港節點
本地嵌入 / UMA 純 CPU 純 CPU,recall >8 s UMA 頻寬;MPS + FORCE_CPU workaround
7×24 功耗 / 噪音 約 5~8 W,無風扇 含在 VPS 月費 待機 4~7 W,峰值 <40 W,靜音
典型 Hermes 適配 極客 homelab、純 CLI 最便宜試跑,備份紀律 mandatory 生產級個人 Agent,Telegram + Cron + Skills

脈衝負載(Ollama burst、4K 匯出、Xcode)見 主題 98 Mac mini M4 彈性租用 AI 工作站 TCO;本表針對always-on Agent 記憶,不是八小時剪輯會話。

05. 24 個月買斷 vs 月租 TCO 表(7×24 Hermes 場景)

Hermes 強制 7×24 成本模型:8760 小時/年,不是主題 98 的 56 天脈衝 crossover。下面是我決定月租 vs 桌下買斷前用的表。

24 個月成本項 買斷 Mac mini M4 16GB VPS 2C4G 7×24 MacDate 租用 · 180 天/年 MacDate 租用 · 365 天/年
硬體 / 租金 NT$49,900 NT$200×24 = NT$4,800 NT$680×360 = NT$244,800 NT$680×730 = NT$496,400
7×24 電費(24 個月) ≈ NT$3,600 含在 VPS 含在租金 含在租金
頻寬 / 公網 IP 家用上行 + DDNS 100Mbps + 獨立 IP
維運 / 磁碟擦除 自管更新、Time Machine 快照另付費 MDM + NIST 擦除
二手殘值(扣除) -NT$20,000 NT$0 NT$0 NT$0
24 個月 TCO 合計 ≈ NT$33,500 ≈ NT$4,800 ≈ NT$244,800 ≈ NT$496,400

三十天後的讀法:

  • 確定兩年真·7×24 且 workflow 已驗證 → 買斷 Mac mini M4 淨 TCO 最優(≈ NT$33.5k),除非你極度看重 optionality。
  • 六個月驗證或季節性開關 → MacDate 月租約 180 天/年(24 月 ≈ NT$245k)換 macOS 原生 Hermes、低延遲 Telegram、隔離 ~/.hermes/——VPS 痛點後我的選擇。
  • 可重建記憶的 disposable 實驗 → VPS 仍是地板;cron tar 備份到物件儲存不可省略。

套餐單價見 Mac mini M4 定價頁。MacDate 是 Apple 硬體彈性租用平台,與任何名為 Hermes 的第三方租賃服務無關。

06. 六步遷移:VPS 備份 → MacDate M4 → curl → 還原 → 頻道 → cron 備份

牆鐘時間約 90 分鐘。希望 day one 就有這六步。

  1. 租用 MacDate Mac mini M4 節點。純 API Hermes 選 16GB;同機 Ollama 14B 建議 M4 Pro 24GB。月租 billing 貼合「先證 30 天再決定」節奏。約 2 小時收到憑證。首次租用讀 按天租用 Mac 完全指南 FAQ
  2. SSH 登入並驗證出站。 ssh -i ~/.ssh/macdate_key admin@[IP]。確認 macOS 版本、磁碟剩餘 >10GB、出站 HTTPS 正常。
  3. curl 安裝 Hermes Agent。 官方一行腳本,設定 LLM API Key,空 ~/.hermes/ 上跑 hermes doctorhermes memory status
  4. 還原 VPS tarball。 VPS 上 tar czf hermes-backup.tar.gz ~/.hermes/,SCP 到 M4,解壓到 home,重啟 gateway。技能數與 state.db 應對齊 day-twelve。
  5. 重接 Telegram 或 Discord。 hermes channels add telegram --token "$TELEGRAM_BOT_TOKEN",設 allowlist,手機發測試。節點區域匹配使用者時 RTT 應 <100 ms。
  6. 續租前設定 nightly 備份。 Cron tar czf hermes-backup-$(date +%F).tar.gz ~/.hermes/ 加 off-box scp。MacDate 釋放實例會 NIST 擦除——不備份等於格式化 Agent 大腦。
# 3. macOS 原生安裝 Hermes Agent $ curl -fsSL https://get.hermes-agent.org | bash # 4. 從 VPS 還原 Skills + state.db $ tar xzf hermes-backup.tar.gz -C ~/ $ hermes gateway restart # 5. Telegram 頻道 $ hermes channels add telegram --token "$TELEGRAM_BOT_TOKEN" # 6. nightly 備份 cron $ tar czf ~/hermes-backup-$(date +%F).tar.gz ~/.hermes/

Apple Silicon 上啟用 Hindsight 前,先套用 CPU 嵌入 workaround:

$ hindsight-embed profile create hermes --merge \ --env HINDSIGHT_API_EMBEDDINGS_LOCAL_FORCE_CPU=true \ --env HINDSIGHT_API_RERANKER_LOCAL_FORCE_CPU=true # ~/.hermes/hindsight/config.json 中 mode 設為 local_external

07. 三條硬核數據(來自 30 天日誌)

寫方案書或團隊郵件時直接貼上,不要形容詞。

  • ① 第 18 天 11 個技能檔案 / 84 KB(~/.hermes/skills/)——重複工作流 tool call 從約 12 次降到約 4 次;程序性記憶是有界 Markdown + progressive disclosure,不是 uncontrolled prompt 膨脹。
  • ② 同月 VPS uptime 96.7% vs M4 月租 99.97%——VPS 損失 7h40m 對應三次 missed Cron digest,磁碟 state intact 但使用者感知「變笨一週」。
  • ③ Telegram RTT 380–520 ms(美西 VPS)→ 45–90 ms(香港 M4),中位任務完成時間約降 28%——更少 abandoned 多步 thread → 每天更多 Closed Learning Loop 完成次數。

次要常數:MEMORY.md 上限約 2,200 字元、USER.md 約 1,375——Hermes 刻意 bound 內聯記憶;技能文件承載 long tail。典型完整 ~/.hermes/ 樹數月專案仍僅數十~數百 MB。

08. 轉化段:何時月租 Mac mini M4 是理性中間路線

三十天教會我:Hermes 不是週末 demo。~/.hermes/skills/ 裡的技能庫是 compound returns 資產——但複利需要 uptime、低延遲頻道、不跟 Hindsight 打架的 macOS 棧。主力 MacBook 7×24 常開:風扇、電池、Agent state 污染 dev 環境,全不 accept。workflow 未驗證就桌下買斷 Mac mini:NT$49,900 CapEx 加 M5 折舊焦慮。VPS 階段證明記憶 work;也證明宿主是每篇 Hermes 評測裡隱藏的變數。

MacDate 月租 Mac mini M4 是我留的路:裸機 macOS、原生 get.hermes-agent.org、獨立頻寬、香港低延遲 Telegram、釋放時 NIST 擦除。按月付 while Closed Learning Loop 自證,nightly tarball ~/.hermes/,把買斷 vs 365 天租決策推遲到有六個月技能成長曲線。比 365 天/年租(上表 ≈ NT$496k TCO)便宜,比廉價 VPS 可靠,比烤 laptop 電池乾淨。

要完整記憶架構與 Pi/VPS/M4 spec 對照、不要日記 tone,讀 主題 99 Hermes 7×24 指南。Ollama 與 4K 脈衝數學見 主題 98。並行跑 OpenClaw 做企業 IM?閘道分開——Hermes 記憶一台,OpenClaw 頻道一台。

延伸閱讀