2026 Hermes Agent mémoire persistante :
architecture 3 couches, Mac mini M4 7×24 vs VPS/Raspberry Pi — location MacDate

Vous voulez un agent IA qui se souvienne de vos préférences, de vos projets et de vos conversations passées — pas un chatbot qui repart de zéro à chaque session. Hermes Agent de Nous Research promet exactement cela. Mais cette promesse tient-elle sans machine dédiée 7×24 ? Ce guide décortique l'architecture mémoire en trois couches, compare VPS, Raspberry Pi et Mac mini M4, et montre comment tester le tout en location journalière chez MacDate.

Hermes Agent mémoire persistante sur Mac mini M4 — visualisation abstraite de racks serveur et réseau

En février 2026, Nous Research a lancé Hermes Agent — un framework open source qui a dépassé 160 000 étoiles GitHub en quelques mois, plus vite que LangChain ou AutoGPT. La promesse centrale : « The agent that grows with you ». Contrairement aux assistants SaaS qui oublient tout à la fermeture de l'onglet, Hermes accumule des connaissances via une architecture mémoire en trois couches, écrit ses propres skills après les tâches complexes, et peut tourner en cron, sur Telegram ou Discord, 24 heures sur 24. Mais la mémoire persistante exige une machine persistante. Ce guide s'adresse aux développeurs, créateurs de contenu et petites équipes qui hésitent entre un VPS Linux bon marché, un Raspberry Pi dans le placard, ou un Mac mini M4 dédié — et qui veulent comprendre comment installer Hermes en une commande curl, sauvegarder ~/.hermes, et valider le tout en location flexible avant d'acheter.

01. Hermes Agent : ce que Nous Research a construit et pourquoi ça compte

Hermes se situe entre un outil CLI et une plateforme de chat. Il exécute des commandes shell, parcourt des fichiers, pilote un navigateur, répond sur Telegram et Discord, et — point crucial — écrit ses propres workflows dans ~/.hermes/skills/ après les tâches difficiles. Toutes les 15 invocations d'outils, il peut faire une pause, réfléchir, et consolider ce qui a fonctionné.

Les modèles sont interchangeables : Claude, GPT-4o, Gemini, ou Llama local via Ollama. La mémoire, elle, reste indépendante du modèle, stockée localement dans ~/.hermes/. Hermes n'envoie aucune télémétrie à Nous Research — vous contrôlez ce qui quitte la machine via vos clés API.

Pour les équipes françaises et européennes soucieuses du RGPD, c'est un argument fort : pas de multi-tenant cloud imposé, pas de tracking d'usage intégré. Vous choisissez où tournent vos données — et avec un Mac mini M4 en location, vous testez sans engagement CapEx.

02. Pourquoi 7×24 n'est pas un luxe mais une condition

Hermes n'est pas qu'un terminal interactif. Trois modes exigent une machine toujours allumée :

  • Cron. Résumés quotidiens, scans de dépôts, veille concurrentielle — si l'hôte dort, le trigger est manqué.
  • Gateways messaging. Telegram, Discord, WhatsApp maintiennent des connexions ouvertes. Un laptop fermé la nuit coupe tout.
  • Accumulation mémoire. Chaque session alimente state.db. Les interruptions fragmentent le contexte ; un hôte dédié accumule en continu.

La pratique communautaire au printemps 2026 est claire : les early adopters achètent ou louent des Mac mini dédiés qui ne font qu'héberger Hermes. Le Mac de travail reste propre ; l'agent est accessible via SSH ou Tailscale.

Règle empirique : dès que vous utilisez plus de deux canaux messaging, des cron jobs ou un provider mémoire externe, le 7×24 devient une exigence — pas une option.

03. Les trois couches mémoire : vue d'ensemble

La documentation officielle Hermes décrit la mémoire comme trois couches coopératives aux profils latence/capacité/coût différents :

Couche Stockage Capacité Latence Usage typique
1 — Mémoire cœur MEMORY.md, USER.md ~1 300 tokens 0 ms (injection prompt) Préférences, faits environnement, conventions
2 — Session Search state.db (SQLite FTS5) Illimitée ~20 ms requête FTS5 « On en avait parlé la semaine dernière ? »
3 — Providers externes Honcho, Mem0, Hindsight… Variable 100–500 ms retrieval Recherche sémantique, graphes, modèle utilisateur

S'ajoutent les skills procéduraux dans ~/.hermes/skills/ — l'agent synthétise les workflows réussis en fichiers Markdown réutilisables. Ce n'est pas une quatrième couche officielle, mais elle complète la couche 1 en capturant le comment, pas seulement le quoi.

En 2026 Q2, Hermes migre progressivement la couche 1 vers un backend SQLite Memory v2 (PR #4722), tout en conservant MEMORY.md/USER.md comme exports de compatibilité. Vos stratégies de backup doivent couvrir fichiers et memory.db.

04. Couche 1 — MEMORY.md et USER.md : mémoire curatée

La couche 1 est injectée dans le system prompt à chaque démarrage de session — comme snapshot figé (optimisation du prefix cache LLM).

  • MEMORY.md (2 200 caractères) : notes de l'agent — OS, structure projet, quirks outils, tâches accomplies.
  • USER.md (1 375 caractères) : profil utilisateur — nom, fuseau, style de communication, niveau technique.

L'agent gère ces fichiers via l'outil memory : add, replace (matching par substring via old_text), remove. Les doublons sont rejetés ; le contenu est scanné contre l'injection de prompt et l'exfiltration de credentials.

Les limites de caractères sont volontairement serrées. Hermes stocke du savoir curaté, pas des transcripts. À 80 % de capacité, l'agent consolide — trois entrées « le projet utilise X » fusionnent en une description compacte.

Pour un déploiement RGPD-friendly, la couche 1 est la zone la plus sensible : préférences utilisateur, noms de projets internes, parfois des données métier pseudonymisées. Sur un Mac mini M4 dédié avec FileVault, tout reste sous votre contrôle — sans sync cloud, tant que vous n'activez pas de provider externe.

05. Couche 2 — Session Search : state.db et FTS5

La couche 2 résout ce que la couche 1 ne peut pas : l'historique illimité. Chaque session CLI et messaging est stockée dans ~/.hermes/state.db. SQLite FTS5 permet une recherche full-text en ~20 ms — sans appel LLM, sans coût token.

L'outil session_search retourne les vrais messages de la base, pas des résumés LLM. L'agent peut scroller avant/arrière dans les sessions trouvées.

  • Couche 1 = « que dois-je toujours savoir ? » — ~1 300 tokens fixes par session.
  • Couche 2 = « qu'avions-nous dit exactement ? » — à la demande, illimité, gratuit.

En 7×24, state.db grossit continuellement. Un Mac mini M4 avec SSD 512 Go et backup régulier est plus réaliste qu'un Raspberry Pi avec carte SD qui s'use sous l'écriture SQLite permanente.

# Inventorier les sessions hermes sessions list # Taille de state.db ls -lh ~/.hermes/state.db # Intégrité FTS5 (si doctor alerte) sqlite3 ~/.hermes/state.db "PRAGMA integrity_check;"

06. Couche 3 — Providers externes et skills procéduraux

Huit plugins provider sont disponibles — Honcho (modélisation dialectique utilisateur), Mem0, Hindsight, Holographic, RetainDB, ByteRover, OpenViking, Supermemory :

hermes memory setup # Choisir et configurer un provider hermes memory status # Vérifier le provider actif

Les providers externes tournent à côté de la couche 1, sans la remplacer. Un seul provider actif à la fois. Pour les équipes EU : vérifiez les DPA et la localisation serveur avant activation en production.

En parallèle, Hermes écrit des SKILL.md dans ~/.hermes/skills/. Après une tâche complexe, l'agent synthétise le workflow réussi. Sur des semaines, un skill s'améliore plusieurs fois — l'agent réécrit et affine de manière autonome. C'est la mémoire procédurale : pas ce que l'utilisateur a dit, mais comment accomplir une tâche de façon fiable.

07. VPS vs Raspberry Pi vs Mac mini M4 : matrice de décision

Hermes tourne officiellement sur Linux, macOS, WSL2 et Termux. Pour un déploiement mémoire persistante 7×24, comparons trois options réalistes :

Critère VPS Linux Raspberry Pi 5 Mac mini M4
Fiabilité 7×24 Élevée (datacenter) Moyenne (SD, coupure) Élevée (SSD, launchd)
Inférence LLM locale Non (APIs cloud) Quasi impossible Oui (Ollama + ANE)
Automatisation navigateur Chrome headless (fragile) Très lent Natif et rapide
RGPD / résidence données Dépend du provider 100 % local Local + FileVault
Télémétrie Monitoring provider VPS Zéro (réseau maison) Zéro (Hermes n'envoie rien)
I/O SQLite (state.db) NVMe adapté Usure carte SD SSD NVMe
CapEx / OpEx 5–30 EUR/mois ~100 EUR + électricité 599 EUR+ ou location jour

Le VPS convient pour usage purement API cloud sans inférence locale — mais vous dépendez de providers US et de datacenters hors UE sauf choix explicite de région EU.

Le Raspberry Pi est tentant mais échoue sous l'écriture SQLite permanente, les tâches navigateur, et l'absence de NVMe. OK pour un week-end d'essai ; pas pour un agent mémoire 7×24 en production.

Le Mac mini M4 combine I/O NVMe, automatisation navigateur native, inférence Llama optionnelle via Ollama, et chiffrement FileVault. Pour les équipes soucieuses de la vie privée, c'est le meilleur compromis — surtout en location journalière pour éviter le CapEx.

08. Installation curl sur macOS et première configuration

L'installateur officiel configure Python 3.11 (via uv), Node.js v22, ripgrep, ffmpeg et le dépôt Hermes :

# Prérequis : git (Xcode CLT ou Homebrew) curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash # Recharger le shell source ~/.zshrc # Premier lancement — setup interactif (clés API, choix modèle) hermes

Alternative v0.14+ : pip install hermes-agent puis hermes postinstall. Sur un Mac mini M4 loué, le chemin curl isole tout sous ~/.hermes/ sans toucher au Python système.

Structure typique après installation :

  • ~/.hermes/hermes-agent/ — source et venv
  • ~/.hermes/memories/MEMORY.md et USER.md — couche 1
  • ~/.hermes/state.db — couche 2 (sessions + FTS5)
  • ~/.hermes/skills/ — skills procéduraux
  • ~/.hermes/config.yaml — routing modèles, limites mémoire, gateways

Pour le 7×24 sur macOS, enregistrez Hermes comme LaunchAgent ou utilisez hermes gateway start. Accédez au Mac loué via Tailscale ou tunnel SSH — n'exposez jamais les ports gateway sur Internet public.

09. Sauvegarder ~/.hermes : backup, migration, restauration

La mémoire persistante vaut ce que vaut votre backup. Un état Hermes complet comprend :

  1. Backup complet : tar -czf hermes-backup-$(date +%Y%m%d).tar.gz -C ~ .hermes
  2. Incrémental : seulement memories/, state.db, skills/, config.yaml — pas tout le venv.
  3. Chiffré : backup GPG ou stockage objet EU chiffré (Hetzner, Scaleway) — jamais en clair sur cloud US.
  4. Avant fin de location : exporter depuis l'instance MacDate, puis effacement sécurisé NIST-800-88.

Migration vers un nouvel hôte :

# Machine source tar -czf hermes-migrate.tar.gz -C ~ .hermes # Machine cible (après curl install) tar -xzf hermes-migrate.tar.gz -C ~ hermes doctor # Vérifier intégrité — incl. memory.db

hermes doctor signale aussi l'état de memory.db (SQLite Memory v2). Exécutez doctor après chaque restauration.

10. RGPD, zéro télémétrie et souveraineté des données

Pour les PME françaises et européennes soumises au RGPD, Hermes sur hardware EU dédié est plus attractif que les assistants SaaS :

  • Traitement on-device. MEMORY.md, USER.md et state.db restent sur le Mac — pas de stockage cloud multi-tenant.
  • Zéro télémétrie Hermes. Pas de tracker d'usage intégré. Vous contrôlez ce qui sort du réseau.
  • DPA uniquement pour APIs cloud. Claude ou GPT-4o exigent un contrat de sous-traitance. Llama local : pas de DPA nécessaire.
  • FileVault + MDM. Les nœuds MacDate supportent FileVault ; les PME peuvent distribuer certificats via Apple Business Manager.
  • Droit à l'effacement. Avant libération d'instance : exporter ~/.hermes, puis effacement sécurisé — documentable pour l'art. 17 RGPD.

Les providers externes (couche 3) sont le piège RGPD le plus fréquent. Honcho et Mem0 peuvent utiliser des backends cloud US. Pour une conformité stricte : couche 1+2 sans provider externe — suffisant pour la plupart des workflows personnels et petites équipes.

11. Plan location 1–3 jours sur Mac mini M4 MacDate

Avant d'investir 599 EUR+ dans un Mac mini M4, validez Hermes dans une fenêtre de location isolée :

  1. Jour 0, soir. Réserver Mac mini M4 (16 Go RAM, 512 Go SSD recommandés) sur macdate.com. Préparer clés SSH et Tailscale.
  2. Jour 1, matin. SSH, curl install, lancer hermes, configurer clé API ou Ollama.
  3. Jour 1, après-midi. Remplir MEMORY.md avec faits projet, tester gateway Telegram, créer premier cron.
  4. Jour 2. Tester Session Search — poser une question dont la réponse n'existe que dans la session J1. Inspecter skills dans ~/.hermes/skills/.
  5. Jour 3. Backup tar de ~/.hermes, hermes doctor, retirer clés SSH, libérer instance.

Trois chiffres citables : state.db grossit typiquement de 50–200 Mo/semaine avec gateway Telegram actif. Une location 1–3 jours suffit pour le cycle d'évaluation complet. Le seuil location vs achat se situe autour de 120–150 jours actifs/an pour un Mac mini M4 de base.

12. Limites honnêtes et appel à l'action MacDate

Hermes Agent n'est pas un remplacement pour l'RPA enterprise ou les plateformes certifiées compliance. Trois limites :

  • Limites caractères couche 1. 2 200 + 1 375 caractères imposent la curation — pas un remplacement de base de connaissances.
  • Dépendance APIs modèle. Sans modèle local, les prompts partent vers des providers US — charge RGPD.
  • Pas de RBAC multi-utilisateur. Hermes est un agent personnel ; le partage équipe exige des instances séparées.

La combinaison propre : Hermes sur un Mac mini M4 loué au jour — isolé du Mac de travail, FileVault, accès Tailscale, backup ~/.hermes exportable. Vous testez l'architecture trois couches, validez cron et gateways, puis décidez de l'achat sans risque CapEx. Consultez aussi le guide ds4 pour l'inférence LLM locale sur Apple Silicon.

Pour aller plus loin