2026 Hermes Agent 為什麼需要 7×24 常駐機器?
三層記憶架構、VPS/樹莓派/Mac mini M4 選型對照與彈性租用決策表

台北、新竹與香港的後端工程師、技術部落客與 AI 研究者都在問:Nous Research 推出的 Hermes Agent 號稱「跨會話持久記憶」,但為什麼官方文件強調要有一台永遠開著的機器?MEMORY.md、Skills 與 SQLite 會話檢索三層架構各自管什麼?月付 5 美元 VPS、家裡樹莓派 5、還是 MacDate 按日租 Mac mini M4——哪條路最適合台港開發者的實戰節奏?本文以繁體中文 IT 語境拆解硬體選型、五步部署與三條可引用數據。

Hermes Agent 三層記憶架構與 7×24 常駐 AI Agent 部署示意

2026 年 5 月,Nous ResearchHermes Agent 在 GitHub 上 Star 破萬,核心賣點只有一句:Agent 不該每次開新對話就失憶。與 OpenClaw 這類「輕量常駐二進位」不同,Hermes 走「CLI 與聊天平台之間」的路線——支援 Terminal、Telegram、Discord、WhatsApp 多通道,內建 Cron 排程、子 Agent 並行、五種執行後端(本機、Docker、SSH、Singularity、Modal),並用三層記憶架構把專案慣例、使用者偏好與歷史會話分層保存。問題來了:記憶要寫進磁碟、排程要定時喚醒、Webhook 要接外網——這台機器必須 7×24 在線。本文寫給四類讀者:想把 Hermes 當「第二個工程師」的獨立開發者寫技術部落格想實測持久記憶的內容創作者在 VPS 與 Mac 之間猶豫的 DevOps,以及3~5 人新創想共享一台 Agent 節點的技術長。你會得到 Hermes 定位、三層記憶拆解、VPS/樹莓派/Mac mini M4 選型矩陣、五步部署流程、三條硬核數據,以及自購 vs MacDate 按日租用的 TCO 臨界點。

01. Hermes Agent 是什麼:Nous Research 的「會累積的 Agent」

Hermes Agent 由 Nous Research 維護,標語是 Your AI that actually remembers。它不像 ChatGPT 網頁版那樣「關分頁就清零」,而是把狀態拆成四層:messages(執行期對話)、session(SQLite 持久化)、memory(跨會話檔案)、config(YAML + 環境變數)。底層模型預設對接 Hermes-3 系列——經 Atropos RL 微調,針對 tool-call 精度與長程任務執行優化;也可切 OpenAI、Anthropic 或本機 Ollama 後端。

2026 年 Agent 賽道有三條路:OpenClaw 走「極輕常駐二進位 + 插件」;Cursor / Claude Code 走「IDE 內嵌、無持久記憶」;Hermes 走「跨平台 CLI + 多通道 + 自改善記憶」。對台港開發者的實際意義是:你可以讓 Hermes 在 Telegram 回你「上週二修的那個 race condition 怎麼修的」,因為它會從 SQLite 會話庫做 FTS5 全文檢索,再用 LLM 摘要拉回上下文——而不是讓你手動貼 200 行 log。

💡 與 OpenClaw 的分工:OpenClaw 適合「10 美元硬體 + 單一二進位」的邊緣部署;Hermes 適合「需要累積專案知識、多通道、Cron 排程」的持久記憶工作流。兩者可以並存:OpenClaw 做裝置端感測,Hermes 做知識中樞。

02. 為什麼必須 7×24 常駐:Cron、Webhook 與記憶落盤

Hermes 不是「需要時才 python main.py」的腳本,而是長期執行的 Agent 執行期。以下功能都假設主機永遠在線:

  • 自然語言 Cron:在 jobs.json 裡用白話設定「每週一早上 9 點掃 GitHub PR 並摘要到 Telegram」——排程器需要 daemon 常駐。
  • 多平台 Webhook:Telegram Bot、Discord Gateway 需要穩定公網或 Tailscale 入口;筆電合蓋就斷線。
  • 記憶 Frozen SnapshotMEMORY.md / USER.md 的變更即時寫盤,但注入 system prompt 要等到下一個 session——若機器休眠,跨日記憶同步會延遲。
  • 子 Agent 並行:Hermes 可 spawn subagent 平行跑任務;父程序消失,子任務全部中斷。
  • SSH / Docker 執行後端:遠端跑命令時,Hermes 本體必須穩定在線等待 callback。

這就是為什麼「先在我 MacBook Pro 上試試」往往踩坑:合蓋、睡眠、換 Wi‑Fi、Time Machine 備份都會讓 Agent 失聯。7×24 常駐 ≠ 一定要買新機器,但一定需要專用節點——可以是 VPS、樹莓派,或 MacDate 按日租的 Mac mini M4 裸機。

03. 三層記憶架構:MEMORY.md、Skills 與 SQLite 會話檢索

官方文件把 Hermes 記憶分成三個實用層級(外加可選的外部 Provider)。理解這三層,才能算清硬碟、記憶體與備份需求。

第一層:持久事實檔(MEMORY.md + USER.md)

這是高信噪比、低延遲的「硬記憶」。MEMORY.md 上限約 2,200 字元,存專案慣例、環境怪癖、踩過的坑;USER.md 上限約 1,375 字元,存你的時區、溝通風格、技術棧偏好。兩者在每個 session 啟動時直接注入 system prompt,不走機率檢索——保證 Agent 一開口就知道「這個 repo 用 pnpm 不用 npm」。

Hermes 用 Frozen Snapshot 模式:執行中可改檔,但 active prompt 不變,避免破壞 LLM prefix cache。另有一套主動記憶鞏固:runtime 會週期性要求 Agent 評估近期互動、提取關鍵事實;沒通過評估的資訊不會寫入——這是「用進廢退」,防止記憶庫退化成雜訊。

第二層:程序型 Skills

skills/ 目錄存放可重複載入的工作流:何時觸發、跑哪些命令、怎麼驗證成功、有哪些 pitfall。與 MEMORY.md 不同,Skill 可以很長,但只在相關任務時按需載入。Hermes 會在解決複雜問題後,自動合成 Skill 文件供未來 session 引用——這是「自改善」的核心。

第三層:SQLite 會話搜尋

所有歷史對話寫入 SQLite,啟用 FTS5 全文索引。當你說「記得上週修的那個 API timeout 嗎?」,Agent 對 session DB 做關鍵字搜尋 + LLM 摘要,把片段拉回當前上下文。這一層決定了磁碟 I/O 與 DB 大小:長期跑下來,session DB 可能到數 GB,需要 SSD 而非 SD 卡。

可選:外部記憶 Provider

企業場景可接 Honcho、Mem0、LightRAG 等外部向量/圖譜記憶——但官方強調同時間只啟用一個外部 Provider,避免語意檢索結果互相打架。

04. VPS/樹莓派/Mac mini M4 選型對照矩陣

下面這張表是 2026 年 5 月台港開發者部署 Hermes Agent 的實戰選型矩陣。評分以「7×24 穩定 + 記憶 I/O + macOS 生態 + 總成本」四維加權。

維度 VPS($5~20/月) 樹莓派 5(8GB) Mac mini M4(16/24GB) MacDate 按日租 M4
7×24 穩定性 ★★★★★ 機房 UPS ★★★ 家用電/網路風險 ★★★★ 低功耗常開 ★★★★★ 機房裸機
SQLite / SSD I/O ★★★ NVMe 視方案 ★★ microSD 易磨損 ★★★★★ 內建 NVMe ★★★★★ 同左
本機 LLM(Ollama) ★ 僅 CPU/GPU 雲加價 ★★ 7B 量化勉強 ★★★★ M4 NPU 38 TOPS ★★★★ 同左
macOS / Xcode 工具鏈 ✗ Linux only ✗ Linux only ★★★★★ 原生 ★★★★★ 原生
記憶體(Agent+DB+模型) 1~2GB 雲端 API 夠 8GB 邊界 16GB 舒適 / 24GB 可跑 7B 16~24GB 可選
24 個月 TCO(粗估) $120~480 ~NT$6,000 硬體+電 ~NT$20,000 買斷 按日計,<90 天更省
最適場景 純雲端 API、低預算 實驗/邊緣 IoT 長期自架、本機 LLM 試跑、短衝刺、團隊共享

決策快取:只用 OpenAI/Anthropic API、預算 < $10/月 → VPS 夠用。要本機 Ollama + Apple 工具鏈 + 穩定 SSD → Mac mini M4。不確定要跑多久 → MacDate 按日租 3~7 天試跑,比先花兩萬台幣買斷更理性。

05. 為什麼 macOS + Mac mini M4 是 Hermes 的甜點配置

Hermes 官方支援 Linux 與 macOS,但台港 iOS / macOS 開發者選 Mac mini M4 有四個硬理由:

  • launchd 原生常駐:比 systemd 更適配 macOS 睡眠策略;Hermes daemon 可設 KeepAlive 自動重啟。
  • Apple Silicon 統一記憶體:16GB 同時跑 Hermes runtime + 7B Ollama 量化模型 + SQLite,不會像 VPS 1GB 那樣 OOM。
  • Keychain 與 SSH Agent:Telegram Bot Token、API Key 存 Keychain,比 .env 平文安全;SSH 後端跑遠端任務時可复用 agent forwarding。
  • 與主力機分離:Agent 節點 7×24 跑 Cron、寫 session DB,你的 MacBook 只負責寫 code——不會再出現「Time Machine 備份把 I/O 吃滿、Agent 超時」的尷尬。

M4 基礎款 16GB 統一記憶體、256GB SSD,官方售價約 NT$19,900。若你一年實際只需要 Agent 常駐 90 天以下(例如專案衝刺期、論文實驗期),按日租用的總帳通常低於買斷 + 折旧。

06. 五步在 MacDate 租用的 Mac mini M4 上跑通 Hermes

以下流程假設你已在 macdate.com 取得 Mac mini M4 裸機節點的 SSH 憑證,目標是3 小時內讓 Hermes 在 Telegram 上跨日記得你的專案偏好。

  1. 租用並接入:選按日 / 按週方案,SSH 登入。執行 xcode-select --install(若需要)與 /bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)",安裝 Python 3.11+。
  2. 安裝 Hermes Agentpip install hermes-agent 或 clone 官方 repo。設定 export HERMES_HOME=~/hermes-data,複製 config.yaml.example,填入 LLM provider(OpenAI key 或 Ollama localhost)。
  3. 初始化三層記憶:建立 MEMORY.md(專案慣例)、USER.md(你的時區 Asia/Taipei、偏好繁中回覆)、空 skills/ 目錄。跑一輪對話確認 SQLite session 檔案已生成。
  4. 設定 7×24 常駐:寫 ~/Library/LaunchAgents/com.hermes.agent.plistKeepAlive + RunAtLoad。綁定 Telegram Bot webhook(或 Tailscale Funnel)。在 jobs.json 加一條「每天早上 8 點推送昨日 git log 摘要」測 Cron。
  5. 驗證與退租:Day 2 重開對話問「我昨天說的 package manager 是什麼?」——應從 USER/MEMORY 召回。匯出 HERMES_HOME tarball 備份。退租前在 MacDate 主控台觸發 NIST 800-88 擦除。
# 快速驗證 Hermes 常駐 $ export HERMES_HOME=~/hermes-data $ hermes chat --platform telegram # launchd 載入 $ launchctl load ~/Library/LaunchAgents/com.hermes.agent.plist # 檢查 session DB 大小 $ ls -lh ~/hermes-data/sessions/*.db

07. 三條硬核數據與 1~3 天試用日程

寫技術文章或向 co-founder 簡報時,可以直接引用這三個數字:

  • 2,200 字元MEMORY.md 硬上限——超過會被拒絕寫入,這是 Hermes 控制 prompt 膨脹的設計邊界。
  • < 200ms:第一、二層記憶注入 session 啟動的額外延遲(純檔案讀取,無向量檢索)——比 RAG 方案穩定一個數量級。
  • 90 天:Mac mini M4 買斷 vs MacDate 按日租用的成本交叉點(假設每日租金 NT$200~350、買斷 NT$19,900);低於 90 天實際使用,租用更省且零折旧風險。

1~3 天試用日程(適合週末實驗):

  1. Day 0 晚:MacDate 下單 M4 16GB,準備 Telegram Bot Token 與 API Key。
  2. Day 1 上午:SSH 接入 → 安裝 Hermes → 寫 MEMORY/USER → 跑 10 輪對話灌入專案上下文。
  3. Day 1 下午:設定 launchd + Cron,合蓋筆電離開——用手機 Telegram 測跨裝置。
  4. Day 2:新開 session 問歷史問題,驗證 SQLite 召回;可選接 Ollama 跑本機 7B。
  5. Day 3:匯出 HERMES_HOME、擦除、退租——帶走備份,節點零殘留。

08. 自購 Mac mini vs 按日租用:成本臨界點

把帳算清楚,避免「為了一個實驗買一台永遠開著的 Mac」:

  • 買斷 Mac mini M4 16GB:約 NT$19,900 + 電費 ~NT$300/月 ≈ 24 個月 NT$27,100。
  • MacDate 按日租:假設 NT$250/天 × 30 天 = NT$7,500/月;只租衝刺月,年度 OpEx 可控。
  • 團隊共享:3 人共用一台租用 M4 Agent 節點,人均成本再除以 3。
  • 折旧:M5 世代若 2027 上市,M4 二手折价 15~25%;租用模式天然迴避。

參考 Mac mini M4 彈性租用 TCO 對照按日租用 Mac 完全指南 取得最新報價與 SSH/VNC 細節。

09. 安全與合規:記憶注入、資料駐留與退租擦除

持久記憶 Agent 的安全面比無狀態 Chat 更複雜:

  • Prompt 注入防護:Hermes 寫入 MEMORY.md 前會掃描 injection 模式,並拒絕重複條目——但仍建議不要讓 Agent 讀取不可信外部網頁後直接寫記憶。
  • 資料駐留:session DB 可能含 API Key、客戶名稱;選 MacDate 物理裸機 + 退租 NIST 擦除,比共用 VPS 更符合台灣個資法「可刪除」要求。
  • 網路暴露:Webhook 優先走 Tailscale,不要把 Hermes 端口直接暴露公網 0.0.0.0。

10. 局限與更優選擇:把 Agent 節點與主力機分離

Hermes Agent 解決了「Agent 失憶」問題,但不解決「Agent 該跑在哪」。把 Hermes 裝在主力 MacBook 上 7×24 常駐,會污染你的開發環境、吃掉 sleep 時間、讓 session DB 與 Xcode DerivedData 搶 SSD。更乾淨的組合是:

  • Agent 節點:MacDate 按日租 Mac mini M4——專跑 Hermes、Ollama、Cron、Telegram Bot。
  • 主力機:你的 MacBook / iMac——只透過 SSH 或 Tailscale 下指令,不常駐 daemon。
  • 雲端 API:推理走 OpenAI/Anthropic;節點只負責記憶與編排,16GB 記憶體綽綽有餘。

先租 3 天跑通三層記憶與 Cron,再決定要不要花 NT$19,900 買斷——這才是 2026 年台港開發者部署 Hermes Agent 的理性路徑。Agent 框架選 Hermes,常駐硬體交給 macdate.com 的物理 Mac 節點。

延伸閱讀