2026 Hermes Agent persistentes Gedächtnis:
3-Schicht-Architektur, 7×24 Mac mini M4 vs VPS/Raspberry Pi — DSGVO-konforme MacDate-Miete
Wer Hermes Agent von Nous Research als persönlichen KI-Assistenten mit Gedächtnis über Sessions hinweg betreiben will, stellt dieselben Fragen: Braucht der Agent wirklich eine Maschine, die nie schläft? Wie funktioniert die Dreischicht-Gedächtnisarchitektur? Und warum entscheiden sich datenschutzbewusste Teams in der EU eher für einen dedizierten Mac mini M4 als für einen günstigen Linux-VPS oder einen Raspberry Pi im Keller?
Im Februar 2026 veröffentlichte Nous Research Hermes Agent — ein Open-Source-Framework, das sich von Chatbots dadurch unterscheidet, dass es über Sessions hinweg lernt. Cron-Jobs, Telegram-/Discord-Gateways, Browser-Automatisierung und ein selbstschreibendes Skill-System machen Hermes zu einem Agenten, der nicht bei jedem Neustart bei null beginnt. Bis Mai 2026 überschritt das Repository 160.000 GitHub-Stars — schneller als LangChain oder AutoGPT. Der Kern-Insight: Persistentes Gedächtnis erfordert persistente Hardware. Wer Hermes nur auf dem Arbeits-MacBook startet, verliert Cron-Trigger, Gateway-Verbindungen und den zusammengesetzten Kontext, sobald das Gerät zugeklappt wird. Dieser Leitfaden erklärt die offizielle Dreischicht-Gedächtnisarchitektur, vergleicht VPS, Raspberry Pi und Mac mini M4 für 7×24-Betrieb, zeigt die curl-Installation auf macOS, definiert eine DSGVO-taugliche ~/.hermes-Backup-Strategie ohne Telemetrie — und ordnet ein, wann flexible MacDate-Miete sinnvoller ist als Kauf oder VPS.
INHALTSVERZEICHNIS
- 01 Was Hermes Agent ist und warum Nous Research auf Gedächtnis setzt
- 02 Warum 7×24-Betrieb keine Option, sondern Voraussetzung ist
- 03 Die Dreischicht-Gedächtnisarchitektur im Detail
- 04 Schicht 1: MEMORY.md und USER.md — kuratiertes Kerngedächtnis
- 05 Schicht 2: Session Search — state.db mit FTS5
- 06 Schicht 3: Externe Memory-Provider und Skill-Dokumente
- 07 VPS vs Raspberry Pi vs Mac mini M4: Entscheidungstabelle
- 08 curl-Installation auf macOS und Erstkonfiguration
- 09 ~/.hermes sichern: Backup, Migration und Wiederherstellung
- 10 DSGVO, Zero Telemetry und Datenresidenz in der EU
- 11 1–3-Tage-Mietplan: Hermes auf gemietetem Mac mini M4
- 12 Grenzen, ehrliche Alternativen und MacDate-CTA
01. Was Hermes Agent ist und warum Nous Research auf Gedächtnis setzt
Hermes Agent positioniert sich zwischen CLI-Tool und Chat-Plattform. Der Agent führt Shell-Befehle aus, durchsucht Dateien, steuert Browser, antwortet in Telegram und Discord und schreibt sich nach komplexen Aufgaben Skill-Dokumente nach (~/.hermes/skills/), die in künftigen Sessions automatisch geladen werden. Das zentrale Versprechen lautet offizieller Dokumentation: „The agent that grows with you."
Im Gegensatz zu OpenClaw, das als Gateway für viele Kanäle und Modelle gedacht ist, konzentriert Hermes auf kontinuierliches Lernen. Alle 15 Tool-Aufrufe kann der Agent pausieren, reflektieren und Workflows konsolidieren. Modelle sind austauschbar — Claude, GPT-4o, Gemini oder lokale Llama-Instanzen über Ollama —, aber das Gedächtnis bleibt modellunabhängig in ~/.hermes/ gespeichert.
Für deutsche und EU-basierte Teams ist das relevant, weil Hermes keine eingebaute Telemetrie an Nous Research sendet. Konfiguration, Memories, Sessions und Skills liegen lokal auf der Maschine. Sie entscheiden, ob und wohin API-Aufrufe gehen — ein entscheidender Unterschied zu SaaS-Assistenten, deren Datenflüsse oft außerhalb der EU enden.
02. Warum 7×24-Betrieb keine Option, sondern Voraussetzung ist
Hermes ist nicht nur ein interaktives Terminal-Programm. Drei Betriebsmodi erfordern eine Maschine, die dauerhaft erreichbar bleibt:
- Cron-Scheduling. Hermes kann zeitgesteuerte Aufgaben ausführen — tägliche Zusammenfassungen, Repository-Scans, Wettbewerbsmonitoring. Schläft der Host, verpassen Sie den Trigger.
- Messaging-Gateways. Telegram-, Discord- und WhatsApp-Integrationen halten Webhooks oder Long-Polling-Verbindungen offen. Ein Laptop, der nachts offline geht, trennt alle Kanäle.
- Gedächtnis-Akkumulation. Session Search schreibt jede Unterhaltung in
state.db. Unterbrechungen fragmentieren den Kontext; ein dedizierter Host sammelt kontinuierlich.
Die Community-Praxis im Frühjahr 2026 — dokumentiert in Blogposts und Foren — zeigt ein klares Muster: Enthusiasten kaufen oder mieten dedizierte Mac minis, die ausschließlich Hermes hosten. Der Arbeits-Mac bleibt sauber; der Agent läuft isoliert per SSH oder Tailscale erreichbar.
03. Die Dreischicht-Gedächtnisarchitektur im Detail
Die offizielle Hermes-Dokumentation beschreibt Gedächtnis nicht als monolithische Datenbank, sondern als drei kooperierende Schichten, die unterschiedliche Latenz-, Kapazitäts- und Kostenprofile abdecken:
| Schicht | Speicherort | Kapazität | Latenz | Typischer Einsatz |
|---|---|---|---|---|
| 1 — Kerngedächtnis | MEMORY.md, USER.md |
~1.300 Tokens gesamt | 0 ms (Prompt-Injection) | Präferenzen, Umgebungsfakten, Konventionen |
| 2 — Session Search | state.db (SQLite FTS5) |
Unbegrenzt (alle Sessions) | ~20 ms FTS5-Query | „Haben wir letzte Woche über X gesprochen?" |
| 3 — Externe Provider | Honcho, Mem0, Hindsight u. a. | Provider-abhängig | 100–500 ms Retrieval | Semantische Suche, Wissensgraphen, User-Modell |
Dazu kommen Skill-Dokumente in ~/.hermes/skills/ — prozedurales Gedächtnis, das der Agent selbst schreibt. Sie sind keine vierte offizielle Schicht, ergänzen aber Schicht 1, indem komplexe Workflows als wiederverwendbare Markdown-Dateien persistieren.
Ab 2026 Q2 migriert Hermes Schicht 1 schrittweise von reinen Markdown-Dateien zu einem SQLite-backed Memory v2 (Pull Request #4722), behält aber MEMORY.md/USER.md als Kompatibilitäts-Exporte. Für Betreiber bedeutet das: Backup-Strategien müssen sowohl Dateien als auch memory.db umfassen.
04. Schicht 1: MEMORY.md und USER.md — kuratiertes Kerngedächtnis
Schicht 1 ist das, was Hermes bei jedem Session-Start in den System-Prompt injiziert — als eingefrorener Snapshot, der während der Session nicht neu geladen wird (Prefix-Cache-Optimierung).
- MEMORY.md (2.200 Zeichen): Agent-Notizen — OS-Fakten, Projektstruktur, Tool-Quirks, abgeschlossene Aufgaben.
- USER.md (1.375 Zeichen): Nutzerprofil — Name, Zeitzone, Kommunikationsstil, technisches Niveau.
Der Agent verwaltet diese Dateien über das memory-Tool mit drei Aktionen: add, replace (Substring-Matching via old_text) und remove. Duplikate werden abgelehnt; Einträge werden auf Prompt-Injection und Credential-Exfiltration gescannt, bevor sie akzeptiert werden.
Die Zeichenlimits sind absichtlich eng. Hermes soll kuratiertes Wissen speichern, nicht Transkripte. Liegt MEMORY.md bei 80 % Kapazität, konsolidiert der Agent Einträge — drei separate „Projekt nutzt X"-Zeilen werden zu einer kompakten Beschreibung zusammengeführt.
Für DSGVO-konforme Deployments ist Schicht 1 der sensibelste Bereich: Hier landen Nutzerpräferenzen, interne Projekt-Codenames und manchmal pseudonymisierte Geschäftsdaten. Auf einem dedizierten Mac mini M4 mit Verschlüsselung (FileVault) und EU-Rechenzentrum bleiben diese Daten unter Ihrer Kontrolle — ohne Cloud-Sync, sofern Sie keinen externen Provider aktivieren.
05. Schicht 2: Session Search — state.db mit FTS5
Schicht 2 löst ein Problem, das Schicht 1 nicht abbilden kann: unbegrenzte Gesprächshistorie. Jede CLI- und Messaging-Session wird in ~/.hermes/state.db gespeichert. SQLite FTS5 ermöglicht Volltextsuche in ~20 ms — ohne LLM-Aufruf, ohne Token-Kosten.
Das session_search-Tool liefert echte Nachrichten aus der Datenbank, nicht LLM-Zusammenfassungen. Der Agent kann vorwärts und rückwärts in gefundenen Sessions scrollen. Vergleich:
- Schicht 1 = „Was muss ich immer wissen?" — feste ~1.300 Tokens pro Session.
- Schicht 2 = „Was haben wir damals genau gesagt?" — on-demand, unbegrenzt, kostenlos.
Bei 7×24-Betrieb wächst state.db stetig. Ein Mac mini M4 mit 512 GB SSD und regelmäßigem Backup (hermes sessions list zur Inventarisierung) ist realistischer als ein Raspberry Pi mit SD-Karte, die bei dauerhaftem SQLite-Schreibbetrieb versagt.
06. Schicht 3: Externe Memory-Provider und Skill-Dokumente
Schicht 3 erweitert Hermes über die eingebauten Dateien hinaus. Acht Provider-Plugins stehen bereit — darunter Honcho (dialektische User-Modellierung), Mem0, Hindsight, Holographic, RetainDB, ByteRover, OpenViking und Supermemory:
Wichtig: Externe Provider laufen neben Schicht 1, ersetzen sie nicht. Nur ein externer Provider ist gleichzeitig aktiv. Für EU-Teams bedeutet das eine zusätzliche Datenschutz-Prüfung: Honcho oder Mem0 können Cloud-Backends nutzen — prüfen Sie AV-Verträge und Serverstandort, bevor Sie sie in produktiven Workflows aktivieren.
Parallel dazu schreibt Hermes Skill-Dokumente (SKILL.md) in ~/.hermes/skills/. Nach komplexen Aufgaben synthetisiert der Agent den erfolgreichen Workflow in eine durchsuchbare Datei. Im Laufe von Wochen verbessert sich ein Skill mehrfach — der Agent überschreibt und verfeinert eigenständig. Das ist prozedurales Gedächtnis: nicht was der Nutzer gesagt hat, sondern wie eine Aufgabe zuverlässig erledigt wird.
07. VPS vs Raspberry Pi vs Mac mini M4: Entscheidungstabelle
Hermes läuft offiziell auf Linux, macOS, WSL2 und Termux. Für 7×24-Persistent-Memory-Deployments vergleichen wir drei realistische Optionen:
| Kriterium | Linux-VPS | Raspberry Pi 5 | Mac mini M4 |
|---|---|---|---|
| 7×24-Zuverlässigkeit | Hoch (Rechenzentrum) | Mittel (SD-Karte, Stromausfall) | Hoch (SSD, launchd) |
| Lokale LLM-Inferenz | Nein (nur Cloud-APIs) | Kaum (RAM-Limit) | Ja (Ollama + ANE) |
| Browser-Automatisierung | Headless Chrome (fragil) | Sehr langsam | Nativ + schnell |
| DSGVO / Datenresidenz | Provider-abhängig | Vollständig lokal | Vollständig lokal + FileVault |
| Telemetrie | VPS-Monitoring des Anbieters | Zero (eigenes Netz) | Zero (Hermes sendet nichts) |
| SQLite I/O (state.db) | NVMe, geeignet | SD-Karten-Verschleiß | NVMe SSD |
| CapEx / OpEx | 5–30 EUR/Monat | ~100 EUR einmalig + Strom | 599 EUR+ Kauf oder Tagesmiete |
VPS eignet sich für reine Cloud-API-Nutzung (Claude/GPT) ohne lokale Inferenz — aber Sie verlassen sich auf US-Cloud-Provider und VPS-Standorte außerhalb der EU, sofern nicht explizit EU-Region gewählt wird.
Raspberry Pi ist verlockend günstig, scheitert aber bei dauerhaftem SQLite-Schreibbetrieb, Browser-Tasks und fehlender NVMe-Leistung. Für Experimente am Wochenende reicht er; für produktiven 7×24-Gedächtnis-Agent nicht.
Mac mini M4 kombiniert NVMe-I/O, native Browser-Automatisierung, optional lokale Llama-Inferenz über Ollama und FileVault-Verschlüsselung. Für datenschutzbewusste EU-Teams ist er die ausgewogenste Wahl — besonders, wenn Sie Hermes nicht kaufen, sondern tageweise mieten, um CapEx zu vermeiden.
08. curl-Installation auf macOS und Erstkonfiguration
Die offizielle Einzeiler-Installation richtet Python 3.11 (via uv), Node.js v22, ripgrep, ffmpeg und das Hermes-Repository ein:
Alternativ ab v0.14 per PyPI: pip install hermes-agent gefolgt von hermes postinstall. Auf einem gemieteten Mac mini M4 empfiehlt sich der curl-Pfad, weil er alle Abhängigkeiten isoliert unter ~/.hermes/ installiert — ohne System-Python zu verändern.
Nach der Installation liegt die Struktur typischerweise so:
~/.hermes/hermes-agent/— Quellcode und venv~/.hermes/memories/MEMORY.mdundUSER.md— Schicht 1~/.hermes/state.db— Schicht 2 (Sessions + FTS5)~/.hermes/skills/— prozedurale Skill-Dokumente~/.hermes/config.yaml— Modellrouting, Memory-Limits, Gateway-Kanäle
Für 7×24-Betrieb auf macOS registrieren Sie Hermes als LaunchAgent:
Verbinden Sie den gemieteten Mac per Tailscale oder SSH-Tunnel — niemals Gateway-Ports ungeschützt ins öffentliche Internet stellen.
09. ~/.hermes sichern: Backup, Migration und Wiederherstellung
Persistentes Gedächtnis ist nur so gut wie Ihr Backup. Ein kompletter Hermes-Stand umfasst:
- Vollbackup:
tar -czf hermes-backup-$(date +%Y%m%d).tar.gz -C ~ .hermes - Inkrementell: Nur
memories/,state.db,skills/undconfig.yaml— nicht das gesamte venv. - Verschlüsselt: Backup mit GPG oder in einem EU-basierten verschlüsselten Object Storage (Hetzner, Scaleway) — nie unverschlüsselt in US-Clouds.
- Vor Mietende: Auf MacDate-Instanz exportieren, dann NIST-800-88-konforme Löschung auslösen.
Migration auf einen neuen Host:
hermes doctor meldet ab v0.14 auch den Zustand von memory.db (SQLite-backed Memory v2). Führen Sie doctor nach jedem Restore aus.
Zero-Telemetry-Hinweis: Hermes selbst sendet keine Diagnosedaten an Nous Research. Telemetrie entsteht nur, wenn Sie Cloud-API-Keys konfigurieren — dann fließen Prompts zum gewählten Modellanbieter. Für maximale Privatsphäre: lokale Modelle via Ollama und kein externer Memory-Provider.
10. DSGVO, Zero Telemetry und Datenresidenz in der EU
Für deutsche KMU und Behörden mit DSGVO-Pflichten ist Hermes auf dedizierter EU-Hardware attraktiver als SaaS-Assistenten:
- Verarbeitung auf dem Gerät. MEMORY.md, USER.md und state.db verbleiben auf dem Mac mini — kein Multi-Tenant-Cloud-Speicher.
- Keine Hermes-Telemetrie. Im Gegensatz zu vielen SaaS-Tools gibt es keinen eingebauten Usage-Tracker. Sie kontrollieren, was das Netzwerk verlässt.
- AV-Vertrag nur bei Cloud-APIs. Nutzen Sie Claude oder GPT-4o, brauchen Sie einen Auftragsverarbeitungsvertrag mit Anthropic/OpenAI. Mit lokalem Llama entfällt dieser Punkt.
- FileVault + MDM. MacDate-Mietknoten unterstützen FileVault-Verschlüsselung; KMU können über Apple Business Manager Zertifikate zentral verteilen.
- Löschkonzept. Vor Instanz-Freigabe:
~/.hermesexportieren, dann sichere Löschung — dokumentierbar für Art. 17 DSGVO (Recht auf Löschung).
Externe Memory-Provider (Schicht 3) sind der häufigste DSGVO-Stolperstein. Honcho und Mem0 können US-Cloud-Backends nutzen. Für strenge Compliance: Schicht 1+2 ohne externen Provider betreiben — das reicht für die meisten persönlichen und kleinen Team-Workflows.
11. 1–3-Tage-Mietplan: Hermes auf gemietetem Mac mini M4
Bevor Sie 599 EUR+ für einen Mac mini M4 ausgeben, validieren Sie Hermes in einem isolierten Mietfenster:
- Tag 0, Abend. Mac mini M4 (16 GB RAM, 512 GB SSD empfohlen) bei macdate.com buchen. SSH-Schlüssel und Tailscale vorbereiten.
- Tag 1, Vormittag. Per SSH einloggen, curl-Install ausführen,
hermesstarten, API-Key oder Ollama konfigurieren. - Tag 1, Nachmittag. MEMORY.md mit Projekt-Fakten füllen lassen, Telegram-Gateway testen, ersten Cron-Job anlegen.
- Tag 2. Session Search mit
session_searchtesten — absichtlich eine Frage stellen, deren Antwort nur in Tag-1-Session steht. Skill-Dokumente in~/.hermes/skills/inspizieren. - Tag 3.
tar-Backup von~/.hermeserstellen,hermes doctorausführen, SSH-Schlüssel entfernen, Instanz freigeben.
Drei zitierfähige Kennzahlen: Erstens wächst state.db bei aktivem Telegram-Gateway typischerweise um 50–200 MB pro Woche. Zweitens reicht eine 1–3-Tages-Miete für den vollen Evaluationszyklus. Drittens liegt der Break-Even Miete vs Kauf bei etwa 120–150 aktiven Tagen pro Jahr für einen Mac mini M4 Basis.
12. Grenzen, ehrliche Alternativen und MacDate-CTA
Hermes Agent ist kein Ersatz für Enterprise-RPA oder compliance-zertifizierte Plattformen. Drei Grenzen bleiben:
- Zeichenlimits in Schicht 1. 2.200 + 1.375 Zeichen erzwingen Kuration — kein Ersatz für eine Wissensdatenbank.
- Abhängigkeit von Modell-APIs. Ohne lokales Modell fließen Prompts zu US-Anbietern — DSGVO-Aufwand bleibt.
- Kein eingebautes Multi-User-RBAC. Hermes ist ein persönlicher Agent; Team-Sharing erfordert getrennte Instanzen oder sorgfältige Zugriffskontrolle.
Die saubere Kombination für EU-Teams: Hermes auf einem tageweise gemieteten Mac mini M4 betreiben — isoliert vom Arbeits-Mac, mit FileVault, Tailscale-Zugang und exportierbarem ~/.hermes-Backup. Sie testen die Dreischicht-Gedächtnisarchitektur, validieren Cron und Gateways, und entscheiden dann über Kauf — ohne CapEx-Risiko. Lesen Sie ergänzend den Leitfaden zur Mac-Tagesmiete und den ds4-Artikel für lokale LLM-Inferenz auf Apple Silicon.