📋 목차

01 · Hermes Agent 스킬 시스템을 따로 깊게 공부할 이유

2026년 초 Nous Research가 Hermes Agent를 공개한 뒤 두 달 만에 GitHub Star가 16만을 넘으며 AI Agent 분야에서 가장 빠르게 성장하는 오픈소스 중 하나가 됐습니다. 핵심은 더 큰 모델이 아니라 「the agent that grows with you」라는 철학입니다. 사용할수록 Agent가 사용자에게 맞춰지는데, 그 기반은 바로 스킬(Skills) 시스템입니다.

일회성 Prompt와 달리 Hermes 스킬은 표준이 있고, 진화 가능하며, 세션을 넘어 지속되는 절차적 기억입니다. 본문은 기초 설치를 다루지 않습니다(Hermes 설치·배포 가이드 참고). 점진 로딩으로 Token 비용을 제어하는 법, 조건 활성화로 환경을 감지하는 법, Bundles로 복잡한 워크플로를 한 번에 켜는 법, GEPA로 스킬이 스스로 나아지게 하는 법까지 심화 영역으로 바로 들어갑니다.

OpenRouter 주간 사용량에서 Hermes Agent가 4.94T 토큰으로 1위를 기록한 배경에도 스킬 자동화 파이프라인이 있습니다. 스킬을 제대로 설계하면 백그라운드 cron·Telegram Gateway·CI가 같은 SOP를 공유해 팀 전체의 API 청구를 예측 가능하게 만듭니다. 반대로 스킬을 방치하면 매 세션마다 긴 시스템 Prompt를 붙여 넣는 비용만 누적됩니다.

02 · 세 가지 페인포인트: 「Hermes 설치」≠ 「Skills 활용」

Token 비용 통제 실패: 모든 SOP를 시스템 Prompt에 넣으면 매 세션 수천 Token이 소모됩니다. Progressive Disclosure 없이 50개 스킬 전체 본문을 올리면 컨텍스트가 터집니다.
스킬 활성화 부정확: description이 모호하면 관련 없는 상황에서 스킬이 로드되거나, 필요할 때 올바른 스킬을 찾지 못합니다. 조건 활성화가 없으면 무료·유료 도구 전환마다 수동으로 설정을 바꿔야 합니다.
팀 지식 축적·진화 불가: 개인 Prompt는 버전 관리·팀 공유가 어렵고 품질이 정체됩니다. GEPA처럼 실행 궤적에서 SKILL.md를 자동 개선하는 메커니즘이 없으면 «시니어의 머릿속»에만 남습니다.

한국 스타트업·SI 팀에서 흔한 패턴입니다. Slack에 «배포 전 이 명령 세트»를 남기면 검색이 어렵고, Notion 문서는 Agent가 자동으로 열지 않습니다. Skill로 Git에 올리면 PR 리뷰와 함께 «언제·누가·왜 바꿨는지»가 남고, Tap으로 팀 전체가 구독할 수 있습니다.

03 · 핵심 개념: Skills ≠ Prompts, Skills ≠ Memory

차원	일반 Prompt	Memory(기억)	Skills(스킬)
지속성	현재 대화	세션 간 영구	세션 간 영구
로딩 시점	매번 컨텍스트에 포함	세션 시작 시 자동 주입	필요 시 로딩
Token 비용	매번 소모	작고 안정적	활성화 전 0 소모
내용 유형	임의 의도 설명	사용자 선호·사실	절차적 단계
공유 가능성	불편	개인적	Tap으로 커뮤니티 배포

한 줄 요약: Prompt = 포스트잇(이번 대화만); Memory = 메모장(항상 곁에); Skill = SOP 매뉴얼(필요할 때 펼침). Cursor Agent Skill 가이드에서 Skill·Rule·MCP 역할 분리를 다뤘다면, 본문은 Hermes 런타임에 특화된 Bundles·GEPA·Tap까지 확장합니다.

04 · SKILL.md 형식 심층 해설(agentskills.io 개방 표준)

모든 Hermes Skills는 agentskills.io 개방 표준을 따릅니다. Hermes·Claude Code·Cursor 간 이식이 가능합니다.

---
name: my-skill
description: |
  Use when the user needs to [...].
  Handles [...] and [...].
version: 1.0.0
license: MIT
compatibility: Requires git, docker
allowed-tools: Bash(git:*) Read
metadata:
  hermes:
    tags: [devops, automation]
    category: software-development
    related_skills: [github-pr-workflow, test-driven-development]
    requires_toolsets: [terminal]
    fallback_for_toolsets: [web]
---

# My Skill Title

## Overview
## When to Use
## Procedure
## Common Pitfalls
## Verification Checklist

핵심 필드: name은 소문자+하이픈, 64자 이내 필수; description은 1024자 이내 필수, 「Use when...」로 시작 권장 — Level 0 라우팅의 전부입니다; metadata.hermes에 조건 활성화·분류 태그를 둡니다.

스킬 디렉터리 구조(모듈형 설계)

~/.hermes/skills/
└── my-category/
    └── my-skill/
        ├── SKILL.md              # 메인 파일(500줄 이내 권장)
        ├── references/           # API 참고(온디맨드 로딩)
        ├── templates/            # 재사용 템플릿
        └── scripts/              # Agent가 직접 실행할 스크립트

한국 팀이 자주 놓치는 점: Procedure에 bash·fastlane·xcodebuild가 들어가면 macOS 전용 권한·Keychain 검증이 필요합니다. references/에 «macOS 실패 시 Linux fallback» 절을 두면 VPS Gateway와 임대 Mac 양쪽에서 같은 스킬을 시험할 수 있습니다.

05 · Progressive Disclosure 3단계 로딩 메커니즘

Token 제어의 핵심입니다. Hermes는 모든 스킬 본문을 한꺼번에 컨텍스트에 넣지 않습니다.

로딩 단계	내용	트리거	Token 비용
Level 0	name + description	세션 시작마다	전체 스킬 합계 약 ~3K
Level 1	SKILL.md 전체 본문	/skill-name 또는 LLM 판단	파일 길이에 비례
Level 2	references/ scripts/	실행 중 LLM 판단	파일 단위 온디맨드

작성 팁: description에는 «무엇인가»보다 «언제 쓰는가»가 중요합니다. 긴 참고 자료는 references/로 분리하고 메인 파일은 500줄 이내를 유지하세요. 50개 스킬을 운영해도 Level 0만으로 약 3K Token이면 라우팅이 가능합니다 — 시스템 Prompt에 50개 SOP를 넣는 것과 천지 차이입니다.

06 · Skill Bundles: 한 명령으로 완전한 워크플로 실행

Skill Bundles는 Hermes 2026의 강력한 신기능입니다. Bundle은 경량 YAML로 여러 관련 스킬을 묶어 슬래시 명령 하나로 만듭니다. /bundle-name 실행 시 나열된 스킬이 동시에 로드됩니다.

파일 위치: ~/.hermes/skill-bundles/<slug>.yaml

name: backend-dev
description: |
  Full backend feature workflow — code review, TDD, and PR management.
skills:
  - github-code-review
  - test-driven-development
  - github-pr-workflow
instruction: |
  Always write failing tests first before implementation.
  Never push directly to main.

Bundle 우선순위: Bundle과 단일 Skill이 같은 이름이면 Bundle 우선; 나열된 Skill이 미설치면 건너뛰고 오류 없음; Bundle은 시스템 Prompt를 수정하지 않아 Prompt Cache가 무효화되지 않습니다.

CLI 빠른 생성:

hermes bundles create backend-dev \
  --skills github-code-review,test-driven-development,github-pr-workflow \
  --instruction "Always write failing tests first"

심화 시나리오: AI 연구 워크플로(arxiv + deep-research + plan + excalidraw), MLOps 배포 파이프라인(vllm + llama-cpp + github-pr-workflow + systematic-debugging). 한국 팀은 «금요일 릴리스 번들»처럼 사내 규정을 YAML 한 파일로 고정해 신입도 시니어와 같은 절차를 따르게 할 수 있습니다.

07 · 조건 활성화: 환경을 스마트하게 감지

스킬은 현재 세션에서 사용 가능한 도구에 따라 자동으로 표시·숨김됩니다. metadata.hermes 아래에 설정합니다.

필드	동작
`requires_toolsets`	나열한 도구셋이 없으면 스킬 숨김
`requires_tools`	나열한 도구가 없으면 스킬 숨김
`fallback_for_toolsets`	나열한 도구셋이 있으면 숨김(대안 역할)
`fallback_for_tools`	나열한 도구가 있으면 숨김(대안 역할)

대표 시나리오: DuckDuckGo 검색 스킬에 fallback_for_tools: [web_search]를 설정하면, FIRECRAWL_KEY·BRAVE_SEARCH_KEY가 있을 때 유료 web_search가 활성화되고 DuckDuckGo는 자동 숨겨져 Token을 절약합니다. API 장애 시 대안이 자동으로 나타납니다.

08 · Skills Hub와 오픈소스 커뮤니티 생태계

공식 설치 채널:

hermes skills install official/research/arxiv
hermes skills install https://example.com/SKILL.md --name my-skill
hermes skills install github:openai/skills/k8s
hermes skills tap add github:my-org/my-skills

저장소	특징	Stars
ChuckSRQ/awesome-hermes-skills	프로덕션급 모음, Deep Research·MLOps	67+
amanning3390/hermeshub	커뮤니티 레지스트리, Prompt 주입 탐지	166+
kevinnft/ai-agent-skills	191 스킬, Hermes/Claude/Cursor 호환	10+
NousResearch/hermes-agent	공식 권위 소스	160k+

skills-ref validate ./my-skill로 형식 준수를 검증합니다. 스킬 자산은 단일 플랫폼에 묶이지 않아 Tap·Git·Cursor 폴더로 팀 표준을 여러 런타임에 배포할 수 있습니다.

09 · Skill Tap 배포: 팀·커뮤니티 공유

GitHub 저장소를 Tap으로 쓰면 팀 전체·커뮤니티가 스킬 세트를 구독합니다.

my-skills-tap/
├── skills.sh.json
├── mlops/vllm-deploy/SKILL.md
├── research/paper-summarizer/SKILL.md
└── README.md

팀 배포:

hermes skills tap add github:your-org/your-skills-tap
hermes skills tap add github:your-org/private-skills --token $GH_TOKEN
hermes skills tap update
hermes skills tap list

버전 관리 권장: ~/.hermes/skills/를 Git에 넣고 기기 간 git pull && hermes skills reset으로 동기화합니다. 사내 «코딩 규약 Tap»과 «MLOps Tap»을 분리하면 신입 온보딩 시 필요한 Bundle만 구독하게 할 수 있습니다.

10 · Self-Evolving Skills: GEPA + DSPy로 스킬 자동 진화

GEPA(Genetic-Pareto Prompt Evolution)는 2026 ICLR Oral 성과로 hermes-agent-self-evolution에 통합됐습니다. 모델 가중치를 미세조정하지 않고, 실행 궤적을 분석·변형 생성·다목표 파레토 최적화로 SKILL.md 텍스트 자체를 개선합니다. 비용 약 $2–10/회(순수 API, GPU 불필요).

5단계 진화 흐름: ① 실행 궤적 수집(SQLite) → ② 반성적 실패 분석 → ③ 표적 변이(10–20개 SKILL.md 변형) → ④ 다목표 파레토 평가(성공률 × Token 효율 × 속도) → ⑤ 사람이 PR 검토 후 배포.

git clone https://github.com/NousResearch/hermes-agent-self-evolution
export HERMES_AGENT_PATH=~/.hermes
python -m evolution.skills.evolve_skill \
    --skill github-code-review \
    --iterations 10 \
    --eval-source sessiondb

4대 안전 가드레일: 전체 테스트 스위트 100% 통과; Skills ≤ 15KB·도구 설명 ≤ 500자; Prompt 캐시 호환; 의미 보존 검사. 공식 로드맵 Phase 1(SKILL.md)은 구현 완료, Phase 2–5는 도구 설명·시스템 Prompt·도구 구현 코드·완전 자동 루프를 다룹니다.

실험적으로 Claude Code·Gemini CLI 궤적을 함께 넣을 수 있습니다(--eval-source mixed --trace-dirs ~/.claude/traces,~/.hermes/sessions). 한국 팀이 Cursor로 작성한 SKILL.md를 Hermes sessiondb와 합쳐 GEPA에 넣으면 «한국어 Pitfalls» 절이 데이터 기반으로 보강되는 사례가 늘고 있습니다.

11 · Plugin 스킬: Hermes 경계 확장

플러그인은 스킬을 네임스페이스(plugin:skill)로 묶습니다. 기본 skills_list에 나타나지 않고 사용자가 명시 호출할 때만 활성화(Opt-in)됩니다.

skill_view("superpowers:writing-plans")

# plugin.yaml
name: my-hermes-plugin
skills:
  - name: writing-plans
    path: skills/writing-plans/SKILL.md

사내 전용 고위험 스킬(프로덕션 DB 접근·결제 API)을 Plugin으로 분리하면 Level 0 라우팅 노이즈를 줄이고 감사 로그를 명확히 남길 수 있습니다.

12 · 스킬 작성 심화 기법(엔지니어 관점)

description이 활성화 정확도를 결정: 트리거 조건과 제외 시나리오를 명시하세요. 「Helps with code」 같은 모호한 문구는 피합니다.
Pitfalls가 품질 분기점: 구체적 실패 패턴·근인·조치 가능한 수정 단계를 넣습니다(GitHub API rate limit, 대형 diff Token overflow 등).
스크립트화: Procedure에서 scripts/를 참조하고, 실패 시 references/manual-extract.md로 fallback합니다.
크기 제어: 500줄 미만은 SKILL.md에; 500–1000줄은 references 분리; 15KB 초과는 GEPA 제한으로 반드시 분할합니다.
skill_manage: Agent가 skill_manage(action='patch'|'create')로 동적 유지보수 가능; config.yaml에 agent_writes_require_approval: true 권장.

13 · 실전 사례: 기술 블로그 워크플로 Skills

name: blog-workflow
description: Full tech blog writing workflow.
skills:
  - seo-keyword-research
  - outline-generator
  - code-example-validator
  - bilingual-checker
  - publish-to-platform
instruction: |
  Always research SEO keywords before writing.
  Ensure all code examples are tested and runnable.

커스텀 seo-keyword-research 스킬은 작성 전 한·영 키워드 매트릭스(핵심 3–5개 + 롱테일 10–15개)를 출력하고, Dev.to trending·HN 트렌드를 교차 참고합니다. MacDate 다국어 블로그 팀은 이 Bundle로 SKILL.md 초안 → 코드 검증 → SEO 메타 140–160자 자가 점검까지 한 슬래시 명령으로 묶을 수 있습니다.

14 · 자주 묻는 질문 FAQ

Q: Skills와 MCP 차이는?
Skills는 «Agent에게 하는 법을 가르치는» 절차 지식 문서이고, MCP는 «추가 호출 능력을 주는» 도구 인터페이스입니다. 상호 보완 관계입니다.

Q: Skill을 수정했는데 Agent가 구버전을 씁니다?
현재 세션에는 반영되지 않습니다. /reset 또는 설치 시 --now(Prompt Cache 무효화 주의)가 필요합니다.

Q: GEPA로 진화한 스킬은 안전한가요?
4대 가드레일 + 사람의 PR review가 있습니다. 그래도 diff를 한 줄씩 검토하세요.

Q: Claude Code에서 재사용하려면?
SKILL.md를 ~/.claude/skills/에 복사하거나 kevinnft/ai-agent-skills로 멀티 런타임 설치합니다.

Q: 한국어 본문이 Token 효율에 영향을 주나요?
한글은 글자당 약 1–1.5 token으로 영어와 비슷합니다. 다만 description은 영어 또는 한·영 병기를 권장해 LLM 매칭 정확도를 높입니다.

추가 읽을거리: Hermes 공식 문서, Hermes 30일 실측, Hermes 하드웨어 선정.

15 · Mac 임대로 Hermes Skills 격리 시험(5단계)

Linux VPS나 Windows에서도 Hermes Gateway를 돌릴 수 있지만, Apple 생태계 스크립트·Xcode 관련 Skill·Keychain 작업은 실제 macOS가 필요합니다. 버릴 수 있는 임대 Mac에서 Skills·Bundles·GEPA를 시험한 뒤 월 임대 여부를 결정하는 것이 안전합니다.

Apple Silicon 노드 임대: Mac mini M4 이상, Homebrew 포함 macOS, SSH 접속. 요금은 M 시리즈 요금 안내 참고.
Hermes 설치 및 doctor: 공식 스크립트 설치 후 hermes doctor로 Gateway·도구셋 검증.
공식 Skill + 커스텀 Tap: hermes skills install·hermes skills tap add로 Level 0/1 로딩과 Token 소비 확인.
Bundle 작성·워크플로 시험: YAML Bundle로 다중 스킬 동시 로딩이 instruction대로 실행되는지 관찰.
기록 후 해제: 터미널 출력·session 궤적(GEPA용) 저장 후 문제없으면 임대 종료해 과금 방지.

Linux VPS의 Hermes는 경량 Gateway·순수 API 호출에 적합하지만 macOS 전용 Skill·Apple 서명 체인·로컬 Keychain 권한은 검증할 수 없습니다. 개인 노트북 24×7 상시 구동은 발열·전기·메인 머신 오염 리스크가 큽니다. 일 단위 Mac 임대는 프로덕션과 동일한 Apple Silicon 환경을 제공하며, 잘못된 API 설정으로 밤새 청구가 폭주하는 것보다 훨씬 저렴합니다. 장기 상주가 필요하면 Hermes 하드웨어 선정에서 월 임대 vs 자가 구매를 비교하세요.