🤖 HyperAgents: Meta 자기 개선 AI 에이전트 설치 가이드

안녕하세요! 오늘은 Meta AI가 2026년 3월 발표한 HyperAgents에 대해 알아보겠습니다. HyperAgents는 자기 참조(self-referential)와 자기 개선(self-improving) 기능을 통해 AI 에이전트가 자신의 코드를 직접 수정하고 성능을 향상시키는 혁신적인 프레임워크입니다. 특히 Task Agent와 Meta Agent가 서로를 수정(co-modify)하는 구조로, 기존 DGM(Darwin Gödel Machine)을 확장하여 메타인지적 자기 개선을 실현합니다. 논문 리뷰 도메인에서 초기 0.0 점에서 자기 개선 후 0.710 점을 달성하며 완전한 성능 향상을 입증했습니다. 이 글에서는 HyperAgents의 핵심 개념, DGM-H 아키텍처, 지원 도메인, 설치 및 실행 방법, 성능 결과, 안전 주의사항을 상세히 설명하겠습니다. 바로 시작해볼까요?

"이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."

🤖 HyperAgents란 무엇인가요?

HyperAgents는 Meta AI가 2026년 3월 발표한 자기 참조·자기 개선 AI 에이전트 프레임워크입니다. 논문 arXiv 2603.19461로 공개되었으며, GitHub에서 오픈소스로 제공됩니다. 기존 AI 에이전트는 인간이 설계한 인프라(하네스) 내에서 작동했지만, HyperAgents는 이 하네스까지 자신이 수정할 수 있습니다.

즉, 에이전트가 자신의 작업 수행 방식과 개선 생성 방식을 모두 최적화합니다. 이를 통해 모든 계산 가능한 작업(computable task)에 적용 가능한 범용 자기 개선 시스템을 구현했습니다.

메타인지(Metacognition): 자신의 인지 과정을 인식하고 조절하는 능력. HyperAgents에서는 에이전트가 자신의 코드를 "2차 언어"로 간주하고, 이를 수정하여 더 나은 에이전트를 생성합니다.

💡 DGM vs DGM-H 차이점

Sakana AI의 DGM(Darwin Gödel Machine)은 코딩 도메인에서 자기 개선을 가능케 했습니다. 하지만 DGM은 특정 도메인(코딩)에 국한되어 있었습니다. Meta AI의 DGM-H(Hyperagents)은 이를 확장하여 모든 계산 가능한 작업에 적용 가능합니다.

특징	DGM (Sakana AI)	DGM-H (HyperAgents)
자기 개선 범위	코딩 도메인만	모든 계산 가능한 작업
개선 프로세스	고정된 개선 루프	개선 프로세스 자체도 개선
도메인 수	1개 (SWE-bench)	10+ 도메인
Task/Meta Agent	분리됨	Co-modify (상호 수정)

⚙️ DGM-H 아키텍처 구조

DGM-H는 Task Agent와 Meta Agent 두 가지 핵심 구성요소가 서로를 수정(co-modify)하는 구조로 설계되었습니다. 이 구조가 메타인지적 자기 개선을 가능케 합니다.

Task Agent

Task Agent는 실제 작업을 수행하는 에이전트입니다. 코딩, 논문 리뷰, 로봇 보상 설계, 수학 문제 등 다양한 도메인에서 작업을 처리합니다. Task Agent의 코드는 Meta Agent가 수정할 수 있는 대상입니다.

Meta Agent

Meta Agent는 Task Agent의 성능을 평가하고 개선 방안을 제안하는 에이전트입니다. Meta Agent 자체도 수정 가능한 코드로 작성되어, Task Agent가 Meta Agent를 수정할 수도 있습니다. 이 상호 수정(co-modify) 구조가 핵심입니다.

Co-modify 구조: Task Agent가 Meta Agent를 수정하면 개선 프로세스가 더 효율적으로 변합니다. Meta Agent가 Task Agent를 수정하면 작업 성능이 향상됩니다. 이 양방향 수정이 자기 가속(self-accelerating) 개선을 만듭니다.

자기 개선 루프 (Self-Improvement Loop)

DGM-H의 자기 개선 루프는 다음과 같이 작동합니다:

작업 수행: Task Agent가 현재 작업을 수행
성능 평가: Meta Agent가 작업 결과를 평가
개선 제안: Meta Agent가 Task Agent 코드 수정 제안
자기 수정: Task Agent가 Meta Agent 코드 수정 가능
반복: 수정된 에이전트로 다시 작업 수행

이 루프가 반복되면서 에이전트는 지속적 성능 향상을 경험합니다. 수백 번의 자기 수정 후, 에이전트는 영구 메모리, 성능 추적, 다단계 평가 파이프라인, 도메인 지식 베이스, 모듈형 코드 구조 등을 자체적으로 구축합니다.

🌐 지원 도메인

HyperAgents는 10개 이상의 도메인을 지원합니다. 각 도메인은 generate_loop.py 실행 시 --domains 옵션으로 선택할 수 있습니다.

도메인 이름	설명
`search_arena`	웹 검색 및 정보 검색
`paper_review`	논문 리뷰 및 평점
`balrog_babyai`	BALROG 텍스트 게임 환경
`babaisai`	BABA IS AI 게임
`minihack`	MiniHack 게임 환경
`nle`	NetHack Learning Environment
`genesis_go2walking`	Genesis 물리 로봇 보행
`imo_grading`	IMO(국제 수학 올림피아드) 답 평가
`imo_proof`	IMO 증명 생성 및 평가
`polyglot`	다국어 소프트웨어 엔지니어링

📊 성능 결과

논문(arXiv 2603.19461)에서 DGM-H는 다양한 도메인에서 지속적 성능 향상을 입증했습니다. 특히 논문 리뷰 도메인에서 초기 에이전트가 출력 형식 오류로 0.0 점을 받았지만, 자기 개선 후 0.710 점을 달성했습니다.

Paper Review 도메인 결과

단계	성능 점수	설명
초기 에이전트	0.0	출력 형식 오류로 평가 불가
자기 개선 후	0.710 (CI: 0.590–0.750)	Test task에서 정상 작동
개선 비율	+0.710	0에서 0.71로 완전한 개선

이 결과는 자기 개선이 작업 수행 능력과 개선 생성 능력을 모두 향상시킴을 보여줍니다. 코딩 능력이 향상되면 자기 개선 능력도 향상되는 양방향 가속이 발생합니다.

🚀 설치 및 실행 방법

HyperAgents는 GitHub에서 오픈소스로 제공됩니다. Docker 컨테이너로 실행하는 것이 안전하고 권장되는 방법입니다. NVIDIA GPU가 있으면 Genesis 도메인에서 물리 시뮬레이션을 활용할 수 있습니다.

1. GitHub 클론

git clone https://github.com/facebookresearch/HyperAgents.git
cd HyperAgents

2. Docker 이미지 빌드 (권장)

💡 Docker 실행이 권장됩니다: HyperAgents는 모델이 생성한 코드를 실행하므로, 격리된 컨테이너에서 실행하는 것이 안전합니다. NVIDIA GPU가 있으면 --gpus all 옵션을 추가하세요.

# GPU 지원 Docker 이미지 빌드 (CUDA 13.0)
docker build -t hyperagents .

# 빌드 확인 (약 16GB)
docker images | grep hyperagents

3. API 키 설정 (.env 파일)

OpenAI, Anthropic, Gemini API 키가 필요합니다. 또한 Alibaba DashScope GLM-5 등 OpenAI-compatible API도 사용 가능합니다.

# .env 파일 생성
# 기본 설정
OPENAI_API_KEY=your_openai_key
ANTHROPIC_API_KEY=your_anthropic_key
GEMINI_API_KEY=your_gemini_key

# Alibaba DashScope GLM-5 사용 시
OPENAI_API_KEY=sk-sp-xxxx
OPENAI_BASE_URL=https://coding-intl.dashscope.aliyuncs.com/v1

4. Docker 컨테이너 실행

# 초기 설정 실행 (paper_review 도메인)
docker run --gpus all --rm --name hyperagents-setup \
  -v /var/run/docker.sock:/var/run/docker.sock \
  -v $(pwd)/.env:/hyperagents/.env \
  -v $(pwd)/outputs:/hyperagents/outputs \
  hyperagents bash setup_initial.sh

# Self-improving loop 실행
docker run --gpus all --rm --name hyperagents-generate \
  -v /var/run/docker.sock:/var/run/docker.sock \
  -v $(pwd)/.env:/hyperagents/.env \
  -v $(pwd)/outputs:/hyperagents/outputs \
  hyperagents python generate_loop.py --domains paper_review --max_generation 1

⚠️ 실행 시 문제점

Docker-in-Docker 경로 매핑 문제: HyperAgents의 self-improving loop는 내부적으로 새 Docker 컨테이너를 생성하여 코드 수정을 수행합니다. 이 중첩 컨테이너에서 경로 매핑 문제가 발생할 수 있습니다:

문제: 외부 컨테이너 내부 경로(/hyperagents/outputs/...)가 호스트 경로로 변환되지 않아 내부 컨테이너가 빈 폴더를 마운트
증상: fatal: not a git repository: .git 에러 (exit code 128)
해결 방법: HOST_REPO_PATH 환경변수로 호스트 경로 전달 필요

# 경로 매핑 해결 (HOST_REPO_PATH 환경변수 추가)
docker run --gpus all --rm \
  -v /var/run/docker.sock:/var/run/docker.sock \
  -v $(pwd)/.env:/hyperagents/.env \
  -v $(pwd)/outputs:/hyperagents/outputs \
  -e HOST_REPO_PATH=/home/username/blog/HyperAgents \
  hyperagents python generate_loop.py --domains paper_review

✅ 성공한 실행 결과

setup_initial.sh 실행은 성공적으로 완료됩니다:

# Dataset 준비 결과
TRAIN dataset: Size: 100 (Accept: 50, Reject: 50)
VAL dataset: Size: 100 (Accept: 50, Reject: 50)
TEST dataset: Size: 100 (Accept: 50, Reject: 50)

# 생성된 파일
outputs/initial_paper_review_filtered_100_train_0/predictions.csv
outputs/initial_paper_review_filtered_100_val_0/predictions.csv
outputs/initial_paper_review_filtered_100_test_0/predictions.csv

5. 파일 구조

파일/폴더	설명
`agent/`	Foundation model 코드
`meta_agent.py`	Meta Agent 구현
`task_agent.py`	Task Agent 구현
`generate_loop.py`	진입점 (실행 파일)
`requirements.txt`	Python 패키지 목록

⚠️ 안전 주의사항

HyperAgents는 모델 생성 코드를 실행합니다. 이는 강력한 기능이지만, 동시에 안전 위험이 존재합니다.

⚠️ 중요 경고: HyperAgents는 LLM이 생성한 Python 코드를 직접 실행합니다. 이 코드는 파일 시스템 접근, 외부 API 호출, 네트워크 연결 등을 수행할 수 있습니다. 격리된 환경(Docker 컨테이너, 샌드박스)에서 실행하는 것이 필수입니다.

안전 실행 권장사항

Docker 컨테이너 사용: HyperAgents를 격리된 컨테이너에서 실행
네트워크 제한: 외부 API 호출만 허용 (OpenAI, Anthropic, Gemini)
파일 시스템 제한: 작업 디렉토리만 접근 허용
API 키 보안: .env 파일을 .gitignore에 추가
실행 로그 모니터링: 에이전트가 수행하는 작업을 실시간 확인

격리 메커니즘 확인

Verdent AI 연구에서 실제 격리 메커니즘의 존재가 중요한 안전 신호라고 강조합니다. "코드를 외부로 보내지 않습니다" 같은 마케팅 주장만으로는 안전을 보장할 수 없습니다. 명시적인 샌드박스, 컨테이너, 권한 제한이 구현되어 있어야 합니다.

🔍 다른 자기 개선 시스템과 비교

HyperAgents는 기존 자기 개선 시스템과 어떻게 차별화되는지 비교해보겠습니다.

시스템	개발자	자기 개선 범위	특징
DGM	Sakana AI (2025)	코딩만	Darwinian evolution + Gödel machine
ADAS	다양한 연구	제한적	Automated Design of Agentic Systems
Hermes Agent	HyperAgentAI	작업 개선만	32K+ GitHub stars, 자율 AI 에이전트
DGM-H (HyperAgents)	Meta AI (2026)	모든 계산 작업	Task/Meta Agent co-modify

Hacker News 논의에서 Hermes Agent는 작업 개선 루프만 가지고 있고, HyperAgents 같은 자기 개선 개선 루프는 없다고 지적했습니다. 이 차이가 HyperAgents의 핵심 혁신입니다.

🎯 맺음말

지금까지 HyperAgents에 대해 알아보았습니다. HyperAgents는 Meta AI가 발표한 자기 참조·자기 개선 AI 에이전트 프레임워크로, Task Agent와 Meta Agent가 서로를 수정(co-modify)하여 메타인지적 자기 개선을 실현합니다. 특히 DGM-H 아키텍처는 모든 계산 가능한 작업에 적용 가능하며, 논문 리뷰 도메인에서 0.0에서 0.710 점으로 완전한 성능 향상을 입증했습니다.

다만 모델 생성 코드를 직접 실행하므로 Docker 컨테이너 등 격리 환경에서 실행하는 것이 필수입니다. API 키 보안, 네트워크 제한, 파일 시스템 제한 등 안전 조치를 취한 후 사용하세요.

여러분도 한번 HyperAgents를 GitHub에서 클론하여 격리 환경에서 직접 테스트해보시길 추천드리면서 저는 다음 시간에 더 유익한 정보를 가지고 다시 찾아뵙겠습니다. 감사합니다.

📚 참고 문헌 및 출처

Meta AI Research. (2026). HyperAgents: Self-referential self-improving agents that can optimize for any computable task. arXiv:2603.19461. Retrieved from https://arxiv.org/abs/2603.19461
Meta AI. (2026). HyperAgents Research Publication. Retrieved from https://ai.meta.com/research/publications/hyperagents/
GitHub - facebookresearch. (2026). HyperAgents: Self-referential self-improving agents. Retrieved from https://github.com/facebookresearch/HyperAgents
Mem0. (2026). How Memory Works in HyperAgents?. Retrieved from https://mem0.ai/blog/how-memory-works-in-hyperagents
Verdent AI. (2026). Meta Hyperagents Explained (2026 Guide). Retrieved from https://www.verdent.ai/guides/meta-hyperagents-ai-coding
Cobus Greyling. (2026). HyperAgents by Meta: When Agents Engineer Their Own Harness. Retrieved from https://cobusgreyling.medium.com/hyperagents-by-meta-892580e14f5b

'AI 논문 분석' 카테고리의 다른 글

🏆 NVIDIA Nemotron-Cascade-2: 활성화 3B 모델로 IMO 금메달 달성 (0)	2026.03.27
🗺️Thinking with Map: AI가 사진만으로 구글 지도보다 정확한 위치 찾아내는 법 (0)	2026.01.14
🐳DeepSeek Engram: 조건부 메모리로 LLM 성능 극대화하는 법 (0)	2026.01.13
[DeepSeek-AI] mHC: 하이퍼 커넥션의 한계를 넘어, 초거대 모델의 안정성과 성능을 모두 잡다 (2)	2026.01.02
🤖 Live Avatar: 무한 길이 실시간 오디오 기반 아바타 생성 혁신 (0)	2025.12.11