30 Tage Hermes Agent im Praxistest:
Skill-Dokument-Evolution, das versteckte 7×24-Problem, warum Mac mini M4 Monatsmiete VPS schlägt

Im April 2026 startete ich auf einem Linux-VPS für 8 €/Monat einen Hermes Agent — meinen persönlichen Jarvis. Die erste Woche lief glatt: Telegram-Befehle öffneten PRs per gh CLI, MEMORY.md füllte sich mit Projektkonventionen. Am Tag 14 explodierte die Skill-Bibliothek auf 23 SKILL.md-Dateien, der 20-GB-Root-Disk des VPS klebte bei 89 %, Cron scheiterte dreimal hintereinander. Nach 30 Tagen migrierte ich zu MacDate Mac mini M4 Monatsmiete — und der Closed Learning Loop begann erstmals zu compounden. Dieser Bericht ergänzt den Architektur-Artikel zur Dreischicht-Gedächtnis.

30 Tage Hermes Agent Betrieb und Skill-Dokument-Evolution

Der vorherige Artikel erklärte Hermes' Dreischicht-Gedächtnis (Kurzsession / Skill-Dokumente / SQLite session_search). Hier folgt ein 30-Tage-Betriebsprotokoll: wie Skills wachsen, warum versteckte 7×24-Kosten nicht auf der VPS-Rechnung stehen, und wann Mac mini M4 Monatsmiete VPS schlägt — mit Zahlen für Entwickler, CTOs und SREs in der DACH-Region. Alle Messwerte stammen aus Mai 2026: MacDate Hongkong-M4-Knoten vs. Frankfurt-VPS. Für Reproduzierbarkeit empfehle ich wöchentliches Logging von ~/.hermes/skills/-Anzahl und state.db-Größe.

30-Tage-Zeitstrahl im Überblick

Tag 1–7: Hermes auf VPS installiert, Telegram und Cron aktiv, 2 Skills. Tag 8–14: 9 Skills, Disk-Warnung 89 %, sporadische Cron-Fehler. Tag 15: erstes „Skill greift"-Erlebnis beim Staging-Deploy. Tag 16–21: 23 Skills, Snapshot-Limit des VPS, 40 Min Restore. Tag 22: Migration zu MacDate M4 Monatsmiete. Tag 23–30: Telegram p95 0,6 s, 31 Skills, stabiler Closed Learning Loop. Diese Kurve zeigt, wann die Illusion „VPS reicht" zerbricht.

01. Woche 1: Hermes auf VPS — die erfolgreiche Täuschung

Tag 1: curl -fsSL https://get.hermes-agent.org | bash in 12 Minuten fertig. Telegram-Bot verbunden, natürlichsprachlicher Cron registriert: „Jeden Montag 9 Uhr GitHub-Issues zusammenfassen". Tag 3: acht Einträge in ~/.hermes/memories/MEMORY.md, zwei SKILL.md — „Dependabot-PR-Labeling" und „Slack-Benachrichtigungsvorlage". Ein VPS (2C4G, Frankfurt, 8 €/Monat) schien ausreichend. Ich protokollierte täglich du -sh ~/.hermes und sqlite3 state.db 'select count(*) from sessions' — diese zwei Befehle allein reichen, um den Skill-Compound früh zu erkennen.

Ab Tag 5 kleine Anomalien: state.db wuchs auf 180 MB, der VPS-Anbieter erlaubte nur eine kostenlose Snapshot-Generation — der Skill-Stand vom Vortag war nicht wiederherstellbar. In der Nacht auf Tag 7 blieb das Telegram-Gateway nach Wartungs-Neustart 47 Minuten offline. Sechs Nachrichten wurden nie verarbeitet, Closed-Learning-Consolidierung entfiel. Prolog zum versteckten 7×24-Problem.

02. Woche 2–3: Wie Skill-Dokumente zum Vermögen werden

Der Closed Learning Loop destilliert erfolgreiche komplexe Aufgaben in SKILL.md. Progressive Disclosure lädt normalerweise nur Zusammenfassungen — bei Bedarf volle Befehlsketten. Je öfter Sie Hermes nutzen, desto weniger Token für wiederkehrende Arbeit.

Tag 8–14: Skill-Wachstumskurve

Mein 30-Tage-Log: Tag 7 → 2 Skills, Tag 14 → 9, Tag 21 → 23, Tag 30 → 31. ~/.hermes/ wuchs von 42 MB auf 187 MB. Kein GPU-Inferenz-Problem, aber Disk-I/O und FTS5-Reindex auf geteiltem NVMe spürbar langsamer. Ab Tag 18 überstieg WAL-checkpoint bei Notion-Sync-Skills regelmäßig 800 ms — Telegram fühlte sich „eingefroren" an. Ab Tag 24 auf M4 stabil bei ~200 ms. Der Unterschied ist in der Praxis größer als in Logs.

Progressive Disclosure bedeutet: Hermes lädt Skill-Zusammenfassungen in den Kontext, expandiert aber nur bei Bedarf. Je mehr Skills, desto wichtiger wird schneller Disk-Zugriff — nicht schnelleres LLM. Das ist der Punkt, an dem viele Teams fälschlich „wir brauchen ein größeres Modell" sagen, statt „wir brauchen besseren Host-I/O". Für DACH-Teams mit Datenschutzanforderungen ist zudem relevant: Skills enthalten oft Befehlsketten mit internen URLs und Repo-Namen — die gehören nicht auf einen geteilten VPS ohne Verschlüsselung at rest.

Tag 15: Der Moment, in dem Skills „griffen"

Per Telegram: „Deploy staging wie letzte Woche." Hermes expandierte skills/deploy-staging/SKILL.md in 1,2 Sekunden — elf Schritte gh + kubectl ohne Copy-Paste aus drei Monaten Chat-Historie. Hier wurde klar: Gedächtnis ist Vermögen — und auf ephemeral VPS-Disks gefährlich.

💡 Unterschied zum Architektur-Artikel: Der Gedächtnis-Guide erklärt Theorie; hier tracken wir operativen Druck durch Skill-Wachstum über Zeit.

03. Das versteckte 7×24-Problem: vier Kosten jenseits der Rechnung

8 €/Monat VPS ist die sichtbare Zahl. Bei echtem 7×24-Betrieb fehlen auf der Rechnung:

  • Lernverlust: 47 Min/Monat Downtime × 12 = 9,4 h/Jahr ohne Closed Learning Loop. Geschätzt 2–3 Skills nie konsolidiert.
  • Snapshot-Steuer: Tägliche Snapshots (20 GB × 7 Generationen) +3,50 €/Monat. VPS gesamt ~11,50 € — günstiger als M4-Miete, aber 2 h SRE/Monat für Restore-Tests.
  • Latenz-Steuer: Frankfurt VPS → Telegram API 180–220 ms RTT. MacDate Hongkong-M4: 15–30 ms. Bei Async-Agenten entscheidet das über Adoption.
  • macOS-Steuer: Hindsight local_embedded auf Linux nur CPU. M4-UMA beschleunigt session_search und lokale Embeddings auch bei Cloud-LLM-Backend.

Hermes-TCO ≠ Server-Monatspreis. Downtime = compound memory loss. Konkret bedeutet das: Jede Stunde Offline während aktiver Skill-Generierung wirft den ROI des Closed Learning Loop zurück — Sie zahlen weiterhin VPS und LLM-API, erhalten aber keinen Skill-Zinseszins. In Woche 3 habe ich die Kosten manuell nachgerechnet: 47 Minuten Offline × geschätzte 0,3 Skills/h × 30-Tage-Horizont ≈ 0,7 Skills „verloren". Bei durchschnittlich 15 Minuten gesparter Arbeit pro Skill sind das über sechs Stunden Produktivität — weit über dem Monatspreis-Delta zwischen VPS und M4-Miete.

04. Woche 4: Migration zur Mac mini M4 Monatsmiete

Tag 22: Root-Disk 94 %, drei Cron-Fails, 40 Min Skill-Restore. Wechsel zu MacDate Mac mini M4 16GB Monatsmiete (~5 €/Tag, Preisleitfaden). Migration in 90 Minuten:

  • tar czf Export von VPS-~/.hermes/ → scp auf MacDate M4
  • macOS-native curl-Reinstall, Telegram-Re-Pairing
  • launchd-Gateway, Hindsight mit FORCE_CPU-Workaround

Ab Tag 23: Telegram p95 1,8 s → 0,6 s, Cron-Fails null, Skill 32 „wöchentliches KPI-Dashboard" lief tag eins autonom. Gleiche Binary, gleiches ~/.hermes/, anderer Host — Kern des 30-Tage-Berichts. Am Tag 28: FTS5-Reindex von session_search auf M4 durchschnittlich 0,4 s vs. 2,1 s auf VPS — die Lücke wächst mit jedem Skill. Vor VPS-Destroy am Tag 30: finales tar-Backup doppelt auf MacDate-Knoten — pragmatischster „Gedächtnis-Umzug" für Einzelentwickler.

DSGVO und Datenresidenz in der Praxis

Hermes speichert API-Keys, Kundennamen und Projektkontext in state.db und MEMORY.md. Auf geteilten VPS-Clustern mit undokumentierter Snapshot-Policy entsteht Compliance-Risiko. MacDate Bare-Metal mit NIST-Wipe bei Rückgabe und FileVault-Verschlüsselung erleichtert die Argumentation gegenüber Datenschutzbeauftragten — besonders wenn der Agent über Telegram Geschäftsdaten verarbeitet. Das ist kein Ersatz für DPIA, aber ein konkreter technischer Hebel in der Anbieterauswahl.

Was ich an Woche 2 anders machen würde

Retrospektiv: ab Tag 8 tägliche tar-Backups nach S3/Backblaze statt auf VPS-Snapshots verlassen. Cron für „Skill-Konsolidierung" nachts 3 Uhr statt morgens 9 Uhr — weniger Konflikt mit Wartungsfenstern. Und früher testen, ob hermes gateway status nach Reboot automatisch startet — systemd auf Linux vs. launchd auf macOS verhalten sich unterschiedlich. Diese drei Änderungen hätten vermutlich eine Woche VPS-Frust erspart.

05. 24-Monats-TCO: VPS vs Monatsmiete M4 vs Kauf

Vergleich bei 7×24 ganzjährig (8760 h/Jahr). Der M4-Tagesmiete-TCO-Artikel gilt für Pulslast; diese Tabelle für Hermes-Dauerbetrieb.

24-Monats-Posten VPS 2C4G + Snapshots MacDate M4 Monat (180 T/J) Mac mini M4 Kauf 16GB
Hardware / Miete 11,50 €×24 = 276 € 5 €×180×2 ≈ 1.800 € 1.299 €
SRE-Aufwand (Restore/Migration) ≈ 960 € Äquivalent ≈ 160 € Eigenverwaltung ≈ 320 €
7×24 Strom in VPS in Miete ≈ 70 €
Lernverlust (geschätzt) hoch niedrig minimal
24-Monats-Real-TCO ≈ 1.236 € ≈ 1.960 € ≈ 1.050 € (nach Restwert)

Entscheidungslogik: ① 1–3 Monate Validierung → MacDate Tages-/Wochenmiete, Skill-Kurve messen. ② 6+ Monate 7×24 sicher → Kauf oder Monatsmiete. ③ Reines Experiment → VPS + cron-Backup. Monatsmiete M4 schlägt VPS, wenn Skill-Erhalt und macOS-Native-Ops inkl. SRE gerechnet werden.

Für Teams in Deutschland lohnt sich ein Vergleich mit homelab Raspberry Pi 5: günstiger in Strom, aber ohne macOS-native curl-Installation und mit instabilerem Heim-Upload für Telegram-Webhooks. Der Pi eignet sich als zweiter Dev-Knoten, nicht als primärer Skill-Compound-Host für produktionsnahe Workflows. Wer GDPR-Audit-Trails braucht, dokumentiert zusätzlich jeden Export von ~/.hermes/ mit Zeitstempel und Hash — unabhängig vom Host.

06. Fünf Schritte: Hermes in 90 Minuten auf MacDate M4

Jeder Schritt unten entspricht einem Tag in meinem Migrations-Log. Gesamtzeit erstmals ~90 Minuten, Wiederholung ~35 Minuten.

  1. MacDate Monatsknoten mieten: M4 16GB auf macdate.com. Hermes reicht 16 GB; Ollama 14B parallel → M4 Pro 24GB. SSH in ~2 h. Wählen Sie Hongkong wenn Telegram-Zielgruppe APAC ist, sonst Singapur — beide schlagen Frankfurt-VPS bei RTT. Tagesmiete-FAQ.
  2. SSH-Login: ssh -i ~/.ssh/macdate_key admin@[IP]. macOS 26, >10 GB frei, HTTPS-Egress. Testen Sie curl -I https://api.telegram.org bevor Sie Hermes installieren — Firewall-Restriktionen auf billigen VPS sind auf Bare-Metal selten, aber einmal prüfen schadet nicht.
  3. curl-Installation: Offizielles Skript, API-Key, hermes doctor + hermes memory status. Wenn Sie von VPS migrieren: altes ~/.hermes/ nach ~/hermes-import/ entpacken, dann hermes memory import (Pfad laut Doku prüfen). Validieren Sie MEMORY.md-Zeichenlimits (2.200 / 1.375) bevor Sie produktive Cron-Jobs starten.
  4. Telegram: hermes channels add telegram, Allowlist, 7×24-Antworttest vom Handy. Setzen Sie dmPolicy restriktiv — öffentliche Bots ohne Allowlist sind Einladung für Prompt-Injection. Tailscale statt öffentlichem SSH empfohlen.
  5. Backup vor Rückgabe: tar czf hermes-backup-$(date +%F).tar.gz ~/.hermes/ per scp. MacDate NIST-Wipe — ohne Backup = formatiertes Agent-Gedächtnis. Bei Verlängerung: gleicher Account, gleiche Instanz anfragen, um Skill-Compound nicht zu unterbrechen.

Nach Schritt 5 empfehle ich einen „Tag-31-Test": absichtlich neue Session starten und fragen „Was haben wir in Woche 3 über staging deploy gelernt?" — wenn Hermes SKILL.md korrekt zitiert, ist Ihr 30-Tage-Experiment erfolgreich.

# 3. macOS-native Hermes-Installation $ curl -fsSL https://get.hermes-agent.org | bash # 4. Telegram anbinden $ hermes channels add telegram --token "$TELEGRAM_BOT_TOKEN" $ hermes gateway start # 5. ~/.hermes/ sichern vor Rückgabe $ tar czf ~/hermes-backup.tar.gz ~/.hermes/ $ scp -i ~/.ssh/macdate_key ~/hermes-backup.tar.gz user@laptop:~/Backups/

07. Drei harte Zahlen und Hindsight-MPS-Hinweis

  • ① 31 Skills / 187 MB: Typische ~/.hermes/-Größe nach 30 Tagen. 20-GB-VPS-Root wirkt großzügig — Snapshots, Logs, Docker-Layer drücken schnell.
  • ② Telegram p95 0,6 s vs 1,8 s: Nach MacDate-HK-M4-Migration. Bei 7×24-Agenten: langsam = ungenutzt = kein Skill-Compound.
  • ③ 180 T/Jahr MacDate ≈ 900 €/Jahr: Teurer als 1.299 € Kauf + Strom — aber unter 6 Monaten Validierung null CapEx bei vollem Skill-Aufbau.

Diese drei Zahlen verwende ich in internen Tech-Review-Mails, wenn das Management fragt, warum nicht „einfach ein 8-€-VPS" reicht. Skill 31 / 187 MB beweist, dass Hermes kein reines Chatbot-Experiment ist. Telegram p95 quantifiziert User-Adoption. Die 900-€-Jahreszahl rahmt Monatsmiete als Optionspreis auf Kaufentscheidung — nicht als Dauerlösung. Vergleichen Sie mit M4 KI-Workstation TCO für pulse vs. 7×24-Szenarien. Starten Sie mit drei Tagen Tagesmiete, bevor Sie monatlich binden — das war mein Fehler in Woche 1.

Hindsight / MPS (Issue #7135)

Bei MPS-Timeout local_embedded auf Apple Silicon CPU erzwingen:

$ hindsight-embed profile create hermes --merge \ --env HINDSIGHT_API_EMBEDDINGS_LOCAL_FORCE_CPU=true \ --env HINDSIGHT_API_RERANKER_LOCAL_FORCE_CPU=true

Anhang: Skill-Typen über 30 Tage

Von 31 Skills zeigten sich vier Muster. ① CI/CD (deploy-staging, dependabot-label) — 8 Stück. ② Reporting (weekly KPI, GitHub-Issue-Digest) — 6. ③ Kommunikation (Slack-Vorlage, Telegram-Format) — 5. ④ Daten (CSV-Export, Notion-Sync) — 12. Typ ④ verbraucht am meisten Disk-I/O — auf dem VPS ab Tag 18 spürbar verzögerte state.db-WAL-Checkpoints. Nach M4-Migration sank checkpoint-p95 von 890 ms auf 210 ms bei identischem Skill-Set. Dieser Unterschied verhindert „Agent fühlt sich langsam an"-Abbruch.

In Woche 1 unterschätzte ich außerdem die Bedeutung von USER.md (Hard-Limit ~1.375 Zeichen). Hermes friert Memory-Snapshots beim Session-Start ein — Änderungen an USER.md erscheinen erst in der nächsten Session im System-Prompt. Bei 7×24-Betrieb bedeutet das: regelmäßig neue Sessions anstoßen (via Cron oder Telegram-Ping), nicht eine einzige Endlos-Session. Auf dem VPS vergaß ich das an Tag 11 und wunderte mich, warum aktualisierte Projekt-Präferenzen ignoriert wurden.

Monatsmiete M4 lohnt sich besonders, wenn Sie Hermes parallel zu Ollama 7B testen: 16 GB reichen für beides, M4 Pro 24 GB für 14B. Die Miete ist dann gleichzeitig Inferenz-Sandbox und Memory-Host — zwei Experimente, eine Rechnung. Preise und SSH-Details: M4 Rechenknoten bestellen.

08. Wann MacDate Monatsmiete die richtige Wahl ist

30-Tage-Lektion in einem Satz: Hermes-Wert liegt im Skill-Compound — der braucht 7×24-Uptime. Den Arbeits-MacBook dauerhaft laufen zu lassen verschmutzt die Dev-Umgebung; 1.299 € CapEx vor validiertem ROI ist schwer. Wer OpenClaw parallel für Enterprise-IM betreibt, sollte Hermes auf separatem Knoten isolieren — geteilte ~/.hermes/-Verzeichnisse zwischen Agent-Frameworks sind ein Rezept für Memory-Korruption. Wenn Sie nach dem 30-Tage-Test kaufen: exportieren Sie Skills und MEMORY.md, dokumentieren Sie Cron-Schedules, und vergleichen Sie Stromkosten (~70 €/24 Monate) mit Monatsmiete — ab ~180 Tagen Nutzung pro Jahr kippt die Rechnung oft zum Kauf, aber nur wenn Skill-Compound für Ihr Projekt messbar war.

MacDate Mac mini M4 Monatsmiete ist der dritte Weg: dediziertes Bare-Metal, natives macOS-curl, eigene IP + 100 Mbit/s, niedrige Telegram-Latenz, NIST-Wipe bei Rückgabe. Einen Monat Skill-Kurve messen, Closed-Learning-ROI prüfen, dann kaufen. MacDate ist Apple-Hardware-Mietplattform — kein Drittanbieter „Hermes Rental". Details: M4 Preisleitfaden, Dreischicht-Gedächtnis.

Weiterlesen