2026 Hermes Agent, 왜 7×24 전용 머신이 필요한가?
3층 지속 메모리·VPS/라즈베리파이/Mac mini M4 임대 의사결정표
Velog에 「Hermes Agent 후기」 글이 늘어나는 2026년 5월, 서울·판교 개발자들이 가장 많이 묻는 질문은 하나입니다. 나만의 AI 에이전트를 노트북 MacBook에 24시간 돌려도 될까요? Nous Research의 3층 메모리(MEMORY.md / Skills / SQLite)는 ChatGPT와 뭐가 다른가요? 월 7,000원 VPS, 집 안의 라즈베리파이 5, MacDate Mac mini M4 연속 임대——어느 쪽이 스마트한 선택일까요? 이 글은 Velog 기술 포스트 형식으로 하드웨어 매트릭스·5단계·3가지 하드 데이터를 정리했습니다.
2026년 5월, Nous Research의 Hermes Agent가 GitHub Star 1만을 넘겼습니다. 한 줄로 요약하면 「세션이 끊겨도 기억이 남는 Agent」입니다. OpenClaw가 「1만 원대 상시 바이너리」를 내세운다면, Hermes는 터미널 CLI와 Telegram·Discord·WhatsApp 사이의 지속 메모리 워크플로우에 집중합니다. Cron 스케줄, 서브에이전트 병렬, local/Docker/SSH/Singularity/Modal 다섯 실행 백엔드, 그리고 3층 메모리로 프로젝트 관례·사용자 취향·과거 대화를 계층 저장합니다. 기억은 디스크에 쓰이고, Cron은 정해진 시각에 깨우고, Webhook은 외부에서 들어옵니다——호스트는 7×24 온라인이어야 합니다. 이 글은 Velog에 실습기를 올리려는 1인 개발자, Telegram Bot으로 업무 자동화하려는 스타트업 CTO, VPS vs Mac을 고민하는 DevOps, 주말만 Agent 실험하는 인디 iOS 개발자를 위합니다.
목차 · TABLE OF CONTENTS
01. Hermes Agent란: 기억이 쌓이는 오픈소스 Agent
Hermes 상태 모델은 네 층: messages(런타임), session(SQLite), memory(파일), config(YAML). 기본 LLM은 Atropos RL로 미세조정된 Hermes-3——tool-call 정확도·장기 태스크 특화. OpenAI/Anthropic/로컬 Ollama 전환 가능.
2026 Agent 삼파전: OpenClaw=초경량 상시+플러그인, Cursor 계열=IDE 내장·기억 없음, Hermes=멀티채널 CLI + 자기개선 메모리. Velog에서 흔한 「매번 프롬프트 복붙 지옥」을 Hermes는 SQLite FTS5 + LLM 요약으로 해소합니다. Telegram에 「지난주 화요일에 고친 race condition 뭐였지?」라고 물으면 session DB에서 로그를 끌어와 답합니다——이게 나만의 AI 에이전트가 주는 체감 차이입니다.
02. 7×24 상시 가동이 필수인 이유
Hermes는 필요할 때만 실행하는 스크립트가 아니라 상시 데몬입니다.
- 자연어 Cron:
jobs.json에 「매주 월요 9시 GitHub PR 요약해 Telegram으로」——스케줄러 상시 필요. - Webhook: Telegram Bot/Discord Gateway는 안정적 ingress 필요. 노트북 슬립=단절.
- Frozen Snapshot:
MEMORY.md변경은 즉시 디스크지만 system prompt 반영은 다음 세션. - 서브에이전트: 부모 프로세스 종료 시 자식 전멸.
- SSH 백엔드: 원격 실행 callback 대기.
「일단 MacBook Pro에서」는 Velog 실패담의 단골 패턴입니다. 슬립, 뚜껑 닫기, Time Machine이 Agent를 침묵시킵니다. 7×24 ≠ 반드시 신규 구매지만 전용 노드는 필수——VPS, Pi, MacDate M4 임대.
03. 3층 메모리: MEMORY.md, Skills, SQLite 세션 검색
1층: 영속 팩트 파일(MEMORY.md + USER.md)
고신호·저지연 확정 기억. MEMORY.md 상한 2,200자(프로젝트 관례·환경 특이점), USER.md 1,375자(타임존·말투·기술 스택). 세션 시작 시 system prompt에 확실히 주입——벡터 검색 확률 변동 없음.
Frozen Snapshot: 실행 중 prompt 불변으로 prefix cache 유지. 런타임이 주기적으로 기억 후보 평가, 중요도 미달은 폐기——use-it-or-lose-it.
2층: 절차형 Skills
skills/에 재사용 워크플로. 트리거, 명령, 검증, 함정. 복잡 문제 해결 후 Skill 자동 합성——자기개선 핵심.
3층: SQLite 세션 검색
전 대화 SQLite + FTS5 인덱스. 「그 API timeout 전에 어떻게 고쳤지?」→ 키워드 검색 + LLM 요약. 장기 운영 시 DB 수 GB——NVMe SSD 필수, Pi microSD 비추.
선택: 외부 메모리 Provider
Honcho, Mem0, LightRAG 등——동시 1개만 활성화 권장.
04. VPS/라즈베리파이/Mac mini M4 선정 매트릭스
| 항목 | VPS($5~20/월) | Raspberry Pi 5(8GB) | Mac mini M4(16/24GB) | MacDate 연속 M4 |
|---|---|---|---|---|
| 7×24 안정성 | ★★★★★ IDC UPS | ★★★ 가정 전원/회선 | ★★★★ 저전력 | ★★★★★ 베어메탈 IDC |
| SQLite I/O | ★★★ 요금제별 | ★★ SD 마모 | ★★★★★ 내장 NVMe | ★★★★★ 동일 |
| 로컬 LLM | ★ CPU만 | ★★ 7B 양자화 한계 | ★★★★ M4 38 TOPS | ★★★★ 동일 |
| macOS / Xcode | ✗ Linux | ✗ Linux | ★★★★★ 네이티브 | ★★★★★ 네이티브 |
| 메모리 | 1~2GB(API) | 8GB 빠듯 | 16GB 여유/24GB 7B | 16~24GB 선택 |
| 24개월 TCO | ₩15만~60만 | ~₩20만 일체 | ~₩89만 구매 | 일할, 90일 미만 유리 |
| 최적 시나리오 | 클라우드 API만 | 실험·IoT | 장기 자가·로컬 LLM | 검증·단기 스프린트 |
빠른 결정: API만·예산 최소→VPS. Ollama+Apple toolchain→M4 구매 or 임대. 기간 미정→MacDate 3~7일 체험이 Velog 검증글 정석.
05. macOS + M4가 Hermes 스위트 스팟인 이유
- launchd:
KeepAlive크래시 자동 복구. - 통합 메모리: 16GB에 Hermes + 7B Ollama + SQLite 공존.
- Keychain: Bot Token 평문 .env 분리.
- 메인 Mac 분리: Agent=임대 M4, 개발=MacBook——Velog 추천 「두 번째 Mac」 패턴.
06. 5단계: MacDate 임대 M4에서 Hermes 구동
Velog에 그대로 옮길 수 있는 실습 순서. 소요 약 3시간.
- 임대·SSH: macdate.com M4 일일→SSH→Homebrew→Python 3.11+.
- Hermes 설치:
pip install hermes-agent,HERMES_HOME=~/hermes-data,config.yamlLLM 설정. - 3층 메모리 초기화:
MEMORY.md(pnpm 사용 등),USER.md(Asia/Seoul, 한국어),skills/. 첫 chat으로 SQLite 생성 확인. - 7×24 상시:
~/Library/LaunchAgents/com.hermes.agent.plistKeepAlive. Telegram Bot +jobs.json「매일 8시 git log 요약」 Cron 테스트. - 검증·반납: 다음날 「어제 말한 package manager?」→ 기억 회상.
HERMES_HOMEtar 백업→MacDate NIST 삭제→반납.
07. 3가지 하드 데이터·1~3일 체험 일정
- 2,200자:
MEMORY.md하드 상한——초과 거부. prompt 팽창 방지 설계값. - < 200ms: 1·2층 세션 시작 주입 지연——RAG 대비 한 자릿수 안정.
- 90일: M4 구매 vs MacDate 연속 임대 TCO 교차점(일 ₩35,000~55,000, 구매 ~₩890,000 가정).
주말 3일 플랜(Velog 실습용):
- Day 0 밤: MacDate 주문 + Telegram Bot Token.
- Day 1 오전: SSH→Hermes→MEMORY/USER→10라운드 대화.
- Day 1 오후: launchd+Cron, 스마트폰 Telegram 외출 테스트.
- Day 2: 새 세션 역사 질문, SQLite 회상. 선택 Ollama 7B.
- Day 3: 백업→삭제→반납. Velog 초안용 로그 확보.
08. 구매 vs 연속 임대 TCO 분기점
- M4 16GB 구매: ~₩890,000 + 전기 ~₩4,000/월→24개월 ~₩986,000.
- MacDate 일일: ₩45,000/일×30일=₩135만/월——스프린트 월만 OpEx 통제.
- 3인 팀: 임대 1대 공유 시 1/3.
M4 연속 임대 TCO, 일일 임대 FAQ 참고.
09. 보안: 메모리 인젝션·데이터 잔류·반납 삭제
- 인젝션: MEMORY 쓰기 전 스캔——신뢰할 수 없는 페이지 직후 쓰기 금지.
- 잔류: session DB에 API 키·고객명. MacDate 물리기+NIST 삭제가 공유 VPS보다 개인정보보호법 「삭제권」에 유리.
- 네트워크: Webhook Tailscale 우선. 0.0.0.0 공개 비추.
10. 한계와 더 스마트한 선택
Hermes는 「건망」을 해결하지만 「어디서 돌릴지」는 별개입니다. 메인 MacBook 7×24 상시는 개발 환경 오염·슬립 불가·SSD 경합을 만듭니다. 최적 조합:
- Agent 노드: MacDate M4——Hermes+Ollama+Cron+Telegram.
- 메인 Mac: SSH/Tailscale 지시만.
- 추론: OpenAI/Anthropic API——노드는 기억·오케스트레이션.
3일 임대로 3층 메모리·Cron 통과 후 구매 판단——2026년 나만의 AI 에이전트를 현실적으로 굴리는 길입니다. 프레임워크는 Hermes, 상시 하드웨어는 macdate.com 물리 Mac.