2026 Hermes Agent 為什麼需要 7×24 常駐機器?
三層記憶架構、VPS/樹莓派/Mac mini M4 選型對照與彈性租用決策表
台北、新竹與香港的後端工程師、技術部落客與 AI 研究者都在問:Nous Research 推出的 Hermes Agent 號稱「跨會話持久記憶」,但為什麼官方文件強調要有一台永遠開著的機器?MEMORY.md、Skills 與 SQLite 會話檢索三層架構各自管什麼?月付 5 美元 VPS、家裡樹莓派 5、還是 MacDate 按日租 Mac mini M4——哪條路最適合台港開發者的實戰節奏?本文以繁體中文 IT 語境拆解硬體選型、五步部署與三條可引用數據。
2026 年 5 月,Nous Research 的 Hermes Agent 在 GitHub 上 Star 破萬,核心賣點只有一句:Agent 不該每次開新對話就失憶。與 OpenClaw 這類「輕量常駐二進位」不同,Hermes 走「CLI 與聊天平台之間」的路線——支援 Terminal、Telegram、Discord、WhatsApp 多通道,內建 Cron 排程、子 Agent 並行、五種執行後端(本機、Docker、SSH、Singularity、Modal),並用三層記憶架構把專案慣例、使用者偏好與歷史會話分層保存。問題來了:記憶要寫進磁碟、排程要定時喚醒、Webhook 要接外網——這台機器必須 7×24 在線。本文寫給四類讀者:想把 Hermes 當「第二個工程師」的獨立開發者、寫技術部落格想實測持久記憶的內容創作者、在 VPS 與 Mac 之間猶豫的 DevOps,以及3~5 人新創想共享一台 Agent 節點的技術長。你會得到 Hermes 定位、三層記憶拆解、VPS/樹莓派/Mac mini M4 選型矩陣、五步部署流程、三條硬核數據,以及自購 vs MacDate 按日租用的 TCO 臨界點。
目錄 · TABLE OF CONTENTS
- 01 Hermes Agent 是什麼:Nous Research 的「會累積的 Agent」
- 02 為什麼必須 7×24 常駐:Cron、Webhook 與記憶落盤
- 03 三層記憶架構:MEMORY.md、Skills 與 SQLite 會話檢索
- 04 VPS/樹莓派/Mac mini M4 選型對照矩陣
- 05 為什麼 macOS + Mac mini M4 是 Hermes 的甜點配置
- 06 五步在 MacDate 租用的 Mac mini M4 上跑通 Hermes
- 07 三條硬核數據與 1~3 天試用日程
- 08 自購 Mac mini vs 按日租用:成本臨界點
- 09 安全與合規:記憶注入、資料駐留與退租擦除
- 10 局限與更優選擇:把 Agent 節點與主力機分離
01. Hermes Agent 是什麼:Nous Research 的「會累積的 Agent」
Hermes Agent 由 Nous Research 維護,標語是 Your AI that actually remembers。它不像 ChatGPT 網頁版那樣「關分頁就清零」,而是把狀態拆成四層:messages(執行期對話)、session(SQLite 持久化)、memory(跨會話檔案)、config(YAML + 環境變數)。底層模型預設對接 Hermes-3 系列——經 Atropos RL 微調,針對 tool-call 精度與長程任務執行優化;也可切 OpenAI、Anthropic 或本機 Ollama 後端。
2026 年 Agent 賽道有三條路:OpenClaw 走「極輕常駐二進位 + 插件」;Cursor / Claude Code 走「IDE 內嵌、無持久記憶」;Hermes 走「跨平台 CLI + 多通道 + 自改善記憶」。對台港開發者的實際意義是:你可以讓 Hermes 在 Telegram 回你「上週二修的那個 race condition 怎麼修的」,因為它會從 SQLite 會話庫做 FTS5 全文檢索,再用 LLM 摘要拉回上下文——而不是讓你手動貼 200 行 log。
02. 為什麼必須 7×24 常駐:Cron、Webhook 與記憶落盤
Hermes 不是「需要時才 python main.py」的腳本,而是長期執行的 Agent 執行期。以下功能都假設主機永遠在線:
- 自然語言 Cron:在
jobs.json裡用白話設定「每週一早上 9 點掃 GitHub PR 並摘要到 Telegram」——排程器需要 daemon 常駐。 - 多平台 Webhook:Telegram Bot、Discord Gateway 需要穩定公網或 Tailscale 入口;筆電合蓋就斷線。
- 記憶 Frozen Snapshot:
MEMORY.md/USER.md的變更即時寫盤,但注入 system prompt 要等到下一個 session——若機器休眠,跨日記憶同步會延遲。 - 子 Agent 並行:Hermes 可 spawn subagent 平行跑任務;父程序消失,子任務全部中斷。
- SSH / Docker 執行後端:遠端跑命令時,Hermes 本體必須穩定在線等待 callback。
這就是為什麼「先在我 MacBook Pro 上試試」往往踩坑:合蓋、睡眠、換 Wi‑Fi、Time Machine 備份都會讓 Agent 失聯。7×24 常駐 ≠ 一定要買新機器,但一定需要專用節點——可以是 VPS、樹莓派,或 MacDate 按日租的 Mac mini M4 裸機。
03. 三層記憶架構:MEMORY.md、Skills 與 SQLite 會話檢索
官方文件把 Hermes 記憶分成三個實用層級(外加可選的外部 Provider)。理解這三層,才能算清硬碟、記憶體與備份需求。
第一層:持久事實檔(MEMORY.md + USER.md)
這是高信噪比、低延遲的「硬記憶」。MEMORY.md 上限約 2,200 字元,存專案慣例、環境怪癖、踩過的坑;USER.md 上限約 1,375 字元,存你的時區、溝通風格、技術棧偏好。兩者在每個 session 啟動時直接注入 system prompt,不走機率檢索——保證 Agent 一開口就知道「這個 repo 用 pnpm 不用 npm」。
Hermes 用 Frozen Snapshot 模式:執行中可改檔,但 active prompt 不變,避免破壞 LLM prefix cache。另有一套主動記憶鞏固:runtime 會週期性要求 Agent 評估近期互動、提取關鍵事實;沒通過評估的資訊不會寫入——這是「用進廢退」,防止記憶庫退化成雜訊。
第二層:程序型 Skills
skills/ 目錄存放可重複載入的工作流:何時觸發、跑哪些命令、怎麼驗證成功、有哪些 pitfall。與 MEMORY.md 不同,Skill 可以很長,但只在相關任務時按需載入。Hermes 會在解決複雜問題後,自動合成 Skill 文件供未來 session 引用——這是「自改善」的核心。
第三層:SQLite 會話搜尋
所有歷史對話寫入 SQLite,啟用 FTS5 全文索引。當你說「記得上週修的那個 API timeout 嗎?」,Agent 對 session DB 做關鍵字搜尋 + LLM 摘要,把片段拉回當前上下文。這一層決定了磁碟 I/O 與 DB 大小:長期跑下來,session DB 可能到數 GB,需要 SSD 而非 SD 卡。
可選:外部記憶 Provider
企業場景可接 Honcho、Mem0、LightRAG 等外部向量/圖譜記憶——但官方強調同時間只啟用一個外部 Provider,避免語意檢索結果互相打架。
04. VPS/樹莓派/Mac mini M4 選型對照矩陣
下面這張表是 2026 年 5 月台港開發者部署 Hermes Agent 的實戰選型矩陣。評分以「7×24 穩定 + 記憶 I/O + macOS 生態 + 總成本」四維加權。
| 維度 | VPS($5~20/月) | 樹莓派 5(8GB) | Mac mini M4(16/24GB) | MacDate 按日租 M4 |
|---|---|---|---|---|
| 7×24 穩定性 | ★★★★★ 機房 UPS | ★★★ 家用電/網路風險 | ★★★★ 低功耗常開 | ★★★★★ 機房裸機 |
| SQLite / SSD I/O | ★★★ NVMe 視方案 | ★★ microSD 易磨損 | ★★★★★ 內建 NVMe | ★★★★★ 同左 |
| 本機 LLM(Ollama) | ★ 僅 CPU/GPU 雲加價 | ★★ 7B 量化勉強 | ★★★★ M4 NPU 38 TOPS | ★★★★ 同左 |
| macOS / Xcode 工具鏈 | ✗ Linux only | ✗ Linux only | ★★★★★ 原生 | ★★★★★ 原生 |
| 記憶體(Agent+DB+模型) | 1~2GB 雲端 API 夠 | 8GB 邊界 | 16GB 舒適 / 24GB 可跑 7B | 16~24GB 可選 |
| 24 個月 TCO(粗估) | $120~480 | ~NT$6,000 硬體+電 | ~NT$20,000 買斷 | 按日計,<90 天更省 |
| 最適場景 | 純雲端 API、低預算 | 實驗/邊緣 IoT | 長期自架、本機 LLM | 試跑、短衝刺、團隊共享 |
決策快取:只用 OpenAI/Anthropic API、預算 < $10/月 → VPS 夠用。要本機 Ollama + Apple 工具鏈 + 穩定 SSD → Mac mini M4。不確定要跑多久 → MacDate 按日租 3~7 天試跑,比先花兩萬台幣買斷更理性。
05. 為什麼 macOS + Mac mini M4 是 Hermes 的甜點配置
Hermes 官方支援 Linux 與 macOS,但台港 iOS / macOS 開發者選 Mac mini M4 有四個硬理由:
- launchd 原生常駐:比 systemd 更適配 macOS 睡眠策略;Hermes daemon 可設
KeepAlive自動重啟。 - Apple Silicon 統一記憶體:16GB 同時跑 Hermes runtime + 7B Ollama 量化模型 + SQLite,不會像 VPS 1GB 那樣 OOM。
- Keychain 與 SSH Agent:Telegram Bot Token、API Key 存 Keychain,比 .env 平文安全;SSH 後端跑遠端任務時可复用 agent forwarding。
- 與主力機分離:Agent 節點 7×24 跑 Cron、寫 session DB,你的 MacBook 只負責寫 code——不會再出現「Time Machine 備份把 I/O 吃滿、Agent 超時」的尷尬。
M4 基礎款 16GB 統一記憶體、256GB SSD,官方售價約 NT$19,900。若你一年實際只需要 Agent 常駐 90 天以下(例如專案衝刺期、論文實驗期),按日租用的總帳通常低於買斷 + 折旧。
06. 五步在 MacDate 租用的 Mac mini M4 上跑通 Hermes
以下流程假設你已在 macdate.com 取得 Mac mini M4 裸機節點的 SSH 憑證,目標是3 小時內讓 Hermes 在 Telegram 上跨日記得你的專案偏好。
- 租用並接入:選按日 / 按週方案,SSH 登入。執行
xcode-select --install(若需要)與/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)",安裝 Python 3.11+。 - 安裝 Hermes Agent:
pip install hermes-agent或 clone 官方 repo。設定export HERMES_HOME=~/hermes-data,複製config.yaml.example,填入 LLM provider(OpenAI key 或 Ollama localhost)。 - 初始化三層記憶:建立
MEMORY.md(專案慣例)、USER.md(你的時區 Asia/Taipei、偏好繁中回覆)、空skills/目錄。跑一輪對話確認 SQLite session 檔案已生成。 - 設定 7×24 常駐:寫
~/Library/LaunchAgents/com.hermes.agent.plist,KeepAlive+RunAtLoad。綁定 Telegram Bot webhook(或 Tailscale Funnel)。在jobs.json加一條「每天早上 8 點推送昨日 git log 摘要」測 Cron。 - 驗證與退租:Day 2 重開對話問「我昨天說的 package manager 是什麼?」——應從 USER/MEMORY 召回。匯出
HERMES_HOMEtarball 備份。退租前在 MacDate 主控台觸發 NIST 800-88 擦除。
07. 三條硬核數據與 1~3 天試用日程
寫技術文章或向 co-founder 簡報時,可以直接引用這三個數字:
- 2,200 字元:
MEMORY.md硬上限——超過會被拒絕寫入,這是 Hermes 控制 prompt 膨脹的設計邊界。 - < 200ms:第一、二層記憶注入 session 啟動的額外延遲(純檔案讀取,無向量檢索)——比 RAG 方案穩定一個數量級。
- 90 天:Mac mini M4 買斷 vs MacDate 按日租用的成本交叉點(假設每日租金 NT$200~350、買斷 NT$19,900);低於 90 天實際使用,租用更省且零折旧風險。
1~3 天試用日程(適合週末實驗):
- Day 0 晚:MacDate 下單 M4 16GB,準備 Telegram Bot Token 與 API Key。
- Day 1 上午:SSH 接入 → 安裝 Hermes → 寫 MEMORY/USER → 跑 10 輪對話灌入專案上下文。
- Day 1 下午:設定 launchd + Cron,合蓋筆電離開——用手機 Telegram 測跨裝置。
- Day 2:新開 session 問歷史問題,驗證 SQLite 召回;可選接 Ollama 跑本機 7B。
- Day 3:匯出 HERMES_HOME、擦除、退租——帶走備份,節點零殘留。
08. 自購 Mac mini vs 按日租用:成本臨界點
把帳算清楚,避免「為了一個實驗買一台永遠開著的 Mac」:
- 買斷 Mac mini M4 16GB:約 NT$19,900 + 電費 ~NT$300/月 ≈ 24 個月 NT$27,100。
- MacDate 按日租:假設 NT$250/天 × 30 天 = NT$7,500/月;只租衝刺月,年度 OpEx 可控。
- 團隊共享:3 人共用一台租用 M4 Agent 節點,人均成本再除以 3。
- 折旧:M5 世代若 2027 上市,M4 二手折价 15~25%;租用模式天然迴避。
參考 Mac mini M4 彈性租用 TCO 對照 與 按日租用 Mac 完全指南 取得最新報價與 SSH/VNC 細節。
09. 安全與合規:記憶注入、資料駐留與退租擦除
持久記憶 Agent 的安全面比無狀態 Chat 更複雜:
- Prompt 注入防護:Hermes 寫入 MEMORY.md 前會掃描 injection 模式,並拒絕重複條目——但仍建議不要讓 Agent 讀取不可信外部網頁後直接寫記憶。
- 資料駐留:session DB 可能含 API Key、客戶名稱;選 MacDate 物理裸機 + 退租 NIST 擦除,比共用 VPS 更符合台灣個資法「可刪除」要求。
- 網路暴露:Webhook 優先走 Tailscale,不要把 Hermes 端口直接暴露公網 0.0.0.0。
10. 局限與更優選擇:把 Agent 節點與主力機分離
Hermes Agent 解決了「Agent 失憶」問題,但不解決「Agent 該跑在哪」。把 Hermes 裝在主力 MacBook 上 7×24 常駐,會污染你的開發環境、吃掉 sleep 時間、讓 session DB 與 Xcode DerivedData 搶 SSD。更乾淨的組合是:
- Agent 節點:MacDate 按日租 Mac mini M4——專跑 Hermes、Ollama、Cron、Telegram Bot。
- 主力機:你的 MacBook / iMac——只透過 SSH 或 Tailscale 下指令,不常駐 daemon。
- 雲端 API:推理走 OpenAI/Anthropic;節點只負責記憶與編排,16GB 記憶體綽綽有餘。
先租 3 天跑通三層記憶與 Cron,再決定要不要花 NT$19,900 買斷——這才是 2026 年台港開發者部署 Hermes Agent 的理性路徑。Agent 框架選 Hermes,常駐硬體交給 macdate.com 的物理 Mac 節點。