안녕하세요! 오늘은 Meta AI가 2026년 3월 발표한 HyperAgents에 대해 알아보겠습니다. HyperAgents는 자기 참조(self-referential)와 자기 개선(self-improving) 기능을 통해 AI 에이전트가 자신의 코드를 직접 수정하고 성능을 향상시키는 혁신적인 프레임워크입니다. 특히 Task Agent와 Meta Agent가 서로를 수정(co-modify)하는 구조로, 기존 DGM(Darwin Gödel Machine)을 확장하여 메타인지적 자기 개선을 실현합니다. 논문 리뷰 도메인에서 초기 0.0 점에서 자기 개선 후 0.710 점을 달성하며 완전한 성능 향상을 입증했습니다. 이 글에서는 HyperAgents의 핵심 개념, DGM-H 아키텍처, 지원 도메인, 설치 및 실행 방법, 성능 결과, 안전 주의사항을 상세히 설명하겠습니다. 바로 시작해볼까요?

"이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."
🤖 HyperAgents란 무엇인가요?
HyperAgents는 Meta AI가 2026년 3월 발표한 자기 참조·자기 개선 AI 에이전트 프레임워크입니다. 논문 arXiv 2603.19461로 공개되었으며, GitHub에서 오픈소스로 제공됩니다. 기존 AI 에이전트는 인간이 설계한 인프라(하네스) 내에서 작동했지만, HyperAgents는 이 하네스까지 자신이 수정할 수 있습니다.
즉, 에이전트가 자신의 작업 수행 방식과 개선 생성 방식을 모두 최적화합니다. 이를 통해 모든 계산 가능한 작업(computable task)에 적용 가능한 범용 자기 개선 시스템을 구현했습니다.
메타인지(Metacognition): 자신의 인지 과정을 인식하고 조절하는 능력. HyperAgents에서는 에이전트가 자신의 코드를 "2차 언어"로 간주하고, 이를 수정하여 더 나은 에이전트를 생성합니다.
💡 DGM vs DGM-H 차이점
Sakana AI의 DGM(Darwin Gödel Machine)은 코딩 도메인에서 자기 개선을 가능케 했습니다. 하지만 DGM은 특정 도메인(코딩)에 국한되어 있었습니다. Meta AI의 DGM-H(Hyperagents)은 이를 확장하여 모든 계산 가능한 작업에 적용 가능합니다.

| 특징 | DGM (Sakana AI) | DGM-H (HyperAgents) |
|---|---|---|
| 자기 개선 범위 | 코딩 도메인만 | 모든 계산 가능한 작업 |
| 개선 프로세스 | 고정된 개선 루프 | 개선 프로세스 자체도 개선 |
| 도메인 수 | 1개 (SWE-bench) | 10+ 도메인 |
| Task/Meta Agent | 분리됨 | Co-modify (상호 수정) |
⚙️ DGM-H 아키텍처 구조
DGM-H는 Task Agent와 Meta Agent 두 가지 핵심 구성요소가 서로를 수정(co-modify)하는 구조로 설계되었습니다. 이 구조가 메타인지적 자기 개선을 가능케 합니다.
Task Agent
Task Agent는 실제 작업을 수행하는 에이전트입니다. 코딩, 논문 리뷰, 로봇 보상 설계, 수학 문제 등 다양한 도메인에서 작업을 처리합니다. Task Agent의 코드는 Meta Agent가 수정할 수 있는 대상입니다.
Meta Agent
Meta Agent는 Task Agent의 성능을 평가하고 개선 방안을 제안하는 에이전트입니다. Meta Agent 자체도 수정 가능한 코드로 작성되어, Task Agent가 Meta Agent를 수정할 수도 있습니다. 이 상호 수정(co-modify) 구조가 핵심입니다.
Co-modify 구조: Task Agent가 Meta Agent를 수정하면 개선 프로세스가 더 효율적으로 변합니다. Meta Agent가 Task Agent를 수정하면 작업 성능이 향상됩니다. 이 양방향 수정이 자기 가속(self-accelerating) 개선을 만듭니다.
자기 개선 루프 (Self-Improvement Loop)
DGM-H의 자기 개선 루프는 다음과 같이 작동합니다:
- 작업 수행: Task Agent가 현재 작업을 수행
- 성능 평가: Meta Agent가 작업 결과를 평가
- 개선 제안: Meta Agent가 Task Agent 코드 수정 제안
- 자기 수정: Task Agent가 Meta Agent 코드 수정 가능
- 반복: 수정된 에이전트로 다시 작업 수행
이 루프가 반복되면서 에이전트는 지속적 성능 향상을 경험합니다. 수백 번의 자기 수정 후, 에이전트는 영구 메모리, 성능 추적, 다단계 평가 파이프라인, 도메인 지식 베이스, 모듈형 코드 구조 등을 자체적으로 구축합니다.
🌐 지원 도메인
HyperAgents는 10개 이상의 도메인을 지원합니다. 각 도메인은 generate_loop.py 실행 시 --domains 옵션으로 선택할 수 있습니다.
| 도메인 이름 | 설명 |
|---|---|
search_arena |
웹 검색 및 정보 검색 |
paper_review |
논문 리뷰 및 평점 |
balrog_babyai |
BALROG 텍스트 게임 환경 |
babaisai |
BABA IS AI 게임 |
minihack |
MiniHack 게임 환경 |
nle |
NetHack Learning Environment |
genesis_go2walking |
Genesis 물리 로봇 보행 |
imo_grading |
IMO(국제 수학 올림피아드) 답 평가 |
imo_proof |
IMO 증명 생성 및 평가 |
polyglot |
다국어 소프트웨어 엔지니어링 |
📊 성능 결과
논문(arXiv 2603.19461)에서 DGM-H는 다양한 도메인에서 지속적 성능 향상을 입증했습니다. 특히 논문 리뷰 도메인에서 초기 에이전트가 출력 형식 오류로 0.0 점을 받았지만, 자기 개선 후 0.710 점을 달성했습니다.

Paper Review 도메인 결과
| 단계 | 성능 점수 | 설명 |
|---|---|---|
| 초기 에이전트 | 0.0 | 출력 형식 오류로 평가 불가 |
| 자기 개선 후 | 0.710 (CI: 0.590–0.750) | Test task에서 정상 작동 |
| 개선 비율 | +0.710 | 0에서 0.71로 완전한 개선 |
이 결과는 자기 개선이 작업 수행 능력과 개선 생성 능력을 모두 향상시킴을 보여줍니다. 코딩 능력이 향상되면 자기 개선 능력도 향상되는 양방향 가속이 발생합니다.
🚀 설치 및 실행 방법
HyperAgents는 GitHub에서 오픈소스로 제공됩니다. Docker 컨테이너로 실행하는 것이 안전하고 권장되는 방법입니다. NVIDIA GPU가 있으면 Genesis 도메인에서 물리 시뮬레이션을 활용할 수 있습니다.
1. GitHub 클론
git clone https://github.com/facebookresearch/HyperAgents.git
cd HyperAgents
2. Docker 이미지 빌드 (권장)
💡 Docker 실행이 권장됩니다: HyperAgents는 모델이 생성한 코드를 실행하므로, 격리된 컨테이너에서 실행하는 것이 안전합니다. NVIDIA GPU가 있으면 --gpus all 옵션을 추가하세요.
# GPU 지원 Docker 이미지 빌드 (CUDA 13.0)
docker build -t hyperagents .
# 빌드 확인 (약 16GB)
docker images | grep hyperagents

3. API 키 설정 (.env 파일)
OpenAI, Anthropic, Gemini API 키가 필요합니다. 또한 Alibaba DashScope GLM-5 등 OpenAI-compatible API도 사용 가능합니다.
# .env 파일 생성
# 기본 설정
OPENAI_API_KEY=your_openai_key
ANTHROPIC_API_KEY=your_anthropic_key
GEMINI_API_KEY=your_gemini_key
# Alibaba DashScope GLM-5 사용 시
OPENAI_API_KEY=sk-sp-xxxx
OPENAI_BASE_URL=https://coding-intl.dashscope.aliyuncs.com/v1
4. Docker 컨테이너 실행
# 초기 설정 실행 (paper_review 도메인)
docker run --gpus all --rm --name hyperagents-setup \
-v /var/run/docker.sock:/var/run/docker.sock \
-v $(pwd)/.env:/hyperagents/.env \
-v $(pwd)/outputs:/hyperagents/outputs \
hyperagents bash setup_initial.sh
# Self-improving loop 실행
docker run --gpus all --rm --name hyperagents-generate \
-v /var/run/docker.sock:/var/run/docker.sock \
-v $(pwd)/.env:/hyperagents/.env \
-v $(pwd)/outputs:/hyperagents/outputs \
hyperagents python generate_loop.py --domains paper_review --max_generation 1
⚠️ 실행 시 문제점
Docker-in-Docker 경로 매핑 문제: HyperAgents의 self-improving loop는 내부적으로 새 Docker 컨테이너를 생성하여 코드 수정을 수행합니다. 이 중첩 컨테이너에서 경로 매핑 문제가 발생할 수 있습니다:
- 문제: 외부 컨테이너 내부 경로(
/hyperagents/outputs/...)가 호스트 경로로 변환되지 않아 내부 컨테이너가 빈 폴더를 마운트 - 증상:
fatal: not a git repository: .git에러 (exit code 128) - 해결 방법:
HOST_REPO_PATH환경변수로 호스트 경로 전달 필요
# 경로 매핑 해결 (HOST_REPO_PATH 환경변수 추가)
docker run --gpus all --rm \
-v /var/run/docker.sock:/var/run/docker.sock \
-v $(pwd)/.env:/hyperagents/.env \
-v $(pwd)/outputs:/hyperagents/outputs \
-e HOST_REPO_PATH=/home/username/blog/HyperAgents \
hyperagents python generate_loop.py --domains paper_review
✅ 성공한 실행 결과
setup_initial.sh 실행은 성공적으로 완료됩니다:
# Dataset 준비 결과
TRAIN dataset: Size: 100 (Accept: 50, Reject: 50)
VAL dataset: Size: 100 (Accept: 50, Reject: 50)
TEST dataset: Size: 100 (Accept: 50, Reject: 50)
# 생성된 파일
outputs/initial_paper_review_filtered_100_train_0/predictions.csv
outputs/initial_paper_review_filtered_100_val_0/predictions.csv
outputs/initial_paper_review_filtered_100_test_0/predictions.csv

5. 파일 구조
| 파일/폴더 | 설명 |
|---|---|
agent/ |
Foundation model 코드 |
meta_agent.py |
Meta Agent 구현 |
task_agent.py |
Task Agent 구현 |
generate_loop.py |
진입점 (실행 파일) |
requirements.txt |
Python 패키지 목록 |
⚠️ 안전 주의사항
HyperAgents는 모델 생성 코드를 실행합니다. 이는 강력한 기능이지만, 동시에 안전 위험이 존재합니다.
⚠️ 중요 경고: HyperAgents는 LLM이 생성한 Python 코드를 직접 실행합니다. 이 코드는 파일 시스템 접근, 외부 API 호출, 네트워크 연결 등을 수행할 수 있습니다. 격리된 환경(Docker 컨테이너, 샌드박스)에서 실행하는 것이 필수입니다.
안전 실행 권장사항
- Docker 컨테이너 사용: HyperAgents를 격리된 컨테이너에서 실행
- 네트워크 제한: 외부 API 호출만 허용 (OpenAI, Anthropic, Gemini)
- 파일 시스템 제한: 작업 디렉토리만 접근 허용
- API 키 보안: .env 파일을 .gitignore에 추가
- 실행 로그 모니터링: 에이전트가 수행하는 작업을 실시간 확인
격리 메커니즘 확인
Verdent AI 연구에서 실제 격리 메커니즘의 존재가 중요한 안전 신호라고 강조합니다. "코드를 외부로 보내지 않습니다" 같은 마케팅 주장만으로는 안전을 보장할 수 없습니다. 명시적인 샌드박스, 컨테이너, 권한 제한이 구현되어 있어야 합니다.
🔍 다른 자기 개선 시스템과 비교
HyperAgents는 기존 자기 개선 시스템과 어떻게 차별화되는지 비교해보겠습니다.
| 시스템 | 개발자 | 자기 개선 범위 | 특징 |
|---|---|---|---|
| DGM | Sakana AI (2025) | 코딩만 | Darwinian evolution + Gödel machine |
| ADAS | 다양한 연구 | 제한적 | Automated Design of Agentic Systems |
| Hermes Agent | HyperAgentAI | 작업 개선만 | 32K+ GitHub stars, 자율 AI 에이전트 |
| DGM-H (HyperAgents) | Meta AI (2026) | 모든 계산 작업 | Task/Meta Agent co-modify |
Hacker News 논의에서 Hermes Agent는 작업 개선 루프만 가지고 있고, HyperAgents 같은 자기 개선 개선 루프는 없다고 지적했습니다. 이 차이가 HyperAgents의 핵심 혁신입니다.
🎯 맺음말
지금까지 HyperAgents에 대해 알아보았습니다. HyperAgents는 Meta AI가 발표한 자기 참조·자기 개선 AI 에이전트 프레임워크로, Task Agent와 Meta Agent가 서로를 수정(co-modify)하여 메타인지적 자기 개선을 실현합니다. 특히 DGM-H 아키텍처는 모든 계산 가능한 작업에 적용 가능하며, 논문 리뷰 도메인에서 0.0에서 0.710 점으로 완전한 성능 향상을 입증했습니다.
다만 모델 생성 코드를 직접 실행하므로 Docker 컨테이너 등 격리 환경에서 실행하는 것이 필수입니다. API 키 보안, 네트워크 제한, 파일 시스템 제한 등 안전 조치를 취한 후 사용하세요.
여러분도 한번 HyperAgents를 GitHub에서 클론하여 격리 환경에서 직접 테스트해보시길 추천드리면서 저는 다음 시간에 더 유익한 정보를 가지고 다시 찾아뵙겠습니다. 감사합니다.

📚 참고 문헌 및 출처
- Meta AI Research. (2026). HyperAgents: Self-referential self-improving agents that can optimize for any computable task. arXiv:2603.19461. Retrieved from https://arxiv.org/abs/2603.19461
- Meta AI. (2026). HyperAgents Research Publication. Retrieved from https://ai.meta.com/research/publications/hyperagents/
- GitHub - facebookresearch. (2026). HyperAgents: Self-referential self-improving agents. Retrieved from https://github.com/facebookresearch/HyperAgents
- Mem0. (2026). How Memory Works in HyperAgents?. Retrieved from https://mem0.ai/blog/how-memory-works-in-hyperagents
- Verdent AI. (2026). Meta Hyperagents Explained (2026 Guide). Retrieved from https://www.verdent.ai/guides/meta-hyperagents-ai-coding
- Cobus Greyling. (2026). HyperAgents by Meta: When Agents Engineer Their Own Harness. Retrieved from https://cobusgreyling.medium.com/hyperagents-by-meta-892580e14f5b
'AI 논문 분석' 카테고리의 다른 글
| 🏆 NVIDIA Nemotron-Cascade-2: 활성화 3B 모델로 IMO 금메달 달성 (0) | 2026.03.27 |
|---|---|
| 🗺️Thinking with Map: AI가 사진만으로 구글 지도보다 정확한 위치 찾아내는 법 (0) | 2026.01.14 |
| 🐳DeepSeek Engram: 조건부 메모리로 LLM 성능 극대화하는 법 (0) | 2026.01.13 |
| [DeepSeek-AI] mHC: 하이퍼 커넥션의 한계를 넘어, 초거대 모델의 안정성과 성능을 모두 잡다 (2) | 2026.01.02 |
| 🤖 Live Avatar: 무한 길이 실시간 오디오 기반 아바타 생성 혁신 (0) | 2025.12.11 |