본문 바로가기
AI 논문 분석

🤖 HyperAgents: Meta 자기 개선 AI 에이전트 설치 가이드

by James AI Explorer 2026. 4. 13.
    728x90

    안녕하세요! 오늘은 Meta AI가 2026년 3월 발표한 HyperAgents에 대해 알아보겠습니다. HyperAgents는 자기 참조(self-referential)자기 개선(self-improving) 기능을 통해 AI 에이전트가 자신의 코드를 직접 수정하고 성능을 향상시키는 혁신적인 프레임워크입니다. 특히 Task Agent와 Meta Agent가 서로를 수정(co-modify)하는 구조로, 기존 DGM(Darwin Gödel Machine)을 확장하여 메타인지적 자기 개선을 실현합니다. 논문 리뷰 도메인에서 초기 0.0 점에서 자기 개선 후 0.710 점을 달성하며 완전한 성능 향상을 입증했습니다. 이 글에서는 HyperAgents의 핵심 개념, DGM-H 아키텍처, 지원 도메인, 설치 및 실행 방법, 성능 결과, 안전 주의사항을 상세히 설명하겠습니다. 바로 시작해볼까요?

    "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."

     

    🤖 HyperAgents란 무엇인가요?

    HyperAgents는 Meta AI가 2026년 3월 발표한 자기 참조·자기 개선 AI 에이전트 프레임워크입니다. 논문 arXiv 2603.19461로 공개되었으며, GitHub에서 오픈소스로 제공됩니다. 기존 AI 에이전트는 인간이 설계한 인프라(하네스) 내에서 작동했지만, HyperAgents는 이 하네스까지 자신이 수정할 수 있습니다.

    즉, 에이전트가 자신의 작업 수행 방식개선 생성 방식을 모두 최적화합니다. 이를 통해 모든 계산 가능한 작업(computable task)에 적용 가능한 범용 자기 개선 시스템을 구현했습니다.

    메타인지(Metacognition): 자신의 인지 과정을 인식하고 조절하는 능력. HyperAgents에서는 에이전트가 자신의 코드를 "2차 언어"로 간주하고, 이를 수정하여 더 나은 에이전트를 생성합니다.

    💡 DGM vs DGM-H 차이점

    Sakana AI의 DGM(Darwin Gödel Machine)은 코딩 도메인에서 자기 개선을 가능케 했습니다. 하지만 DGM은 특정 도메인(코딩)에 국한되어 있었습니다. Meta AI의 DGM-H(Hyperagents)은 이를 확장하여 모든 계산 가능한 작업에 적용 가능합니다.

    DGM vs DGM-H 차이점

    특징 DGM (Sakana AI) DGM-H (HyperAgents)
    자기 개선 범위 코딩 도메인만 모든 계산 가능한 작업
    개선 프로세스 고정된 개선 루프 개선 프로세스 자체도 개선
    도메인 수 1개 (SWE-bench) 10+ 도메인
    Task/Meta Agent 분리됨 Co-modify (상호 수정)

    ⚙️ DGM-H 아키텍처 구조

    DGM-H는 Task AgentMeta Agent 두 가지 핵심 구성요소가 서로를 수정(co-modify)하는 구조로 설계되었습니다. 이 구조가 메타인지적 자기 개선을 가능케 합니다.

    Task Agent

    Task Agent는 실제 작업을 수행하는 에이전트입니다. 코딩, 논문 리뷰, 로봇 보상 설계, 수학 문제 등 다양한 도메인에서 작업을 처리합니다. Task Agent의 코드는 Meta Agent가 수정할 수 있는 대상입니다.

    Meta Agent

    Meta Agent는 Task Agent의 성능을 평가하고 개선 방안을 제안하는 에이전트입니다. Meta Agent 자체도 수정 가능한 코드로 작성되어, Task Agent가 Meta Agent를 수정할 수도 있습니다. 이 상호 수정(co-modify) 구조가 핵심입니다.

    Co-modify 구조: Task Agent가 Meta Agent를 수정하면 개선 프로세스가 더 효율적으로 변합니다. Meta Agent가 Task Agent를 수정하면 작업 성능이 향상됩니다. 이 양방향 수정이 자기 가속(self-accelerating) 개선을 만듭니다.

    자기 개선 루프 (Self-Improvement Loop)

    DGM-H의 자기 개선 루프는 다음과 같이 작동합니다:

    1. 작업 수행: Task Agent가 현재 작업을 수행
    2. 성능 평가: Meta Agent가 작업 결과를 평가
    3. 개선 제안: Meta Agent가 Task Agent 코드 수정 제안
    4. 자기 수정: Task Agent가 Meta Agent 코드 수정 가능
    5. 반복: 수정된 에이전트로 다시 작업 수행

    이 루프가 반복되면서 에이전트는 지속적 성능 향상을 경험합니다. 수백 번의 자기 수정 후, 에이전트는 영구 메모리, 성능 추적, 다단계 평가 파이프라인, 도메인 지식 베이스, 모듈형 코드 구조 등을 자체적으로 구축합니다.

     

    🌐 지원 도메인

    HyperAgents는 10개 이상의 도메인을 지원합니다. 각 도메인은 generate_loop.py 실행 시 --domains 옵션으로 선택할 수 있습니다.

    도메인 이름 설명
    search_arena 웹 검색 및 정보 검색
    paper_review 논문 리뷰 및 평점
    balrog_babyai BALROG 텍스트 게임 환경
    babaisai BABA IS AI 게임
    minihack MiniHack 게임 환경
    nle NetHack Learning Environment
    genesis_go2walking Genesis 물리 로봇 보행
    imo_grading IMO(국제 수학 올림피아드) 답 평가
    imo_proof IMO 증명 생성 및 평가
    polyglot 다국어 소프트웨어 엔지니어링

    📊 성능 결과

    논문(arXiv 2603.19461)에서 DGM-H는 다양한 도메인에서 지속적 성능 향상을 입증했습니다. 특히 논문 리뷰 도메인에서 초기 에이전트가 출력 형식 오류로 0.0 점을 받았지만, 자기 개선 후 0.710 점을 달성했습니다.

    Paper Review 도메인 결과

    단계 성능 점수 설명
    초기 에이전트 0.0 출력 형식 오류로 평가 불가
    자기 개선 후 0.710 (CI: 0.590–0.750) Test task에서 정상 작동
    개선 비율 +0.710 0에서 0.71로 완전한 개선

    이 결과는 자기 개선이 작업 수행 능력개선 생성 능력을 모두 향상시킴을 보여줍니다. 코딩 능력이 향상되면 자기 개선 능력도 향상되는 양방향 가속이 발생합니다.

    🚀 설치 및 실행 방법

    HyperAgents는 GitHub에서 오픈소스로 제공됩니다. Docker 컨테이너로 실행하는 것이 안전하고 권장되는 방법입니다. NVIDIA GPU가 있으면 Genesis 도메인에서 물리 시뮬레이션을 활용할 수 있습니다.

    1. GitHub 클론

    git clone https://github.com/facebookresearch/HyperAgents.git
    cd HyperAgents
     

    2. Docker 이미지 빌드 (권장)

    💡 Docker 실행이 권장됩니다: HyperAgents는 모델이 생성한 코드를 실행하므로, 격리된 컨테이너에서 실행하는 것이 안전합니다. NVIDIA GPU가 있으면 --gpus all 옵션을 추가하세요.

    # GPU 지원 Docker 이미지 빌드 (CUDA 13.0)
    docker build -t hyperagents .
    
    # 빌드 확인 (약 16GB)
    docker images | grep hyperagents
     

    3. API 키 설정 (.env 파일)

    OpenAI, Anthropic, Gemini API 키가 필요합니다. 또한 Alibaba DashScope GLM-5 등 OpenAI-compatible API도 사용 가능합니다.

    # .env 파일 생성
    # 기본 설정
    OPENAI_API_KEY=your_openai_key
    ANTHROPIC_API_KEY=your_anthropic_key
    GEMINI_API_KEY=your_gemini_key
    
    # Alibaba DashScope GLM-5 사용 시
    OPENAI_API_KEY=sk-sp-xxxx
    OPENAI_BASE_URL=https://coding-intl.dashscope.aliyuncs.com/v1
     

    4. Docker 컨테이너 실행

    # 초기 설정 실행 (paper_review 도메인)
    docker run --gpus all --rm --name hyperagents-setup \
      -v /var/run/docker.sock:/var/run/docker.sock \
      -v $(pwd)/.env:/hyperagents/.env \
      -v $(pwd)/outputs:/hyperagents/outputs \
      hyperagents bash setup_initial.sh
    
    # Self-improving loop 실행
    docker run --gpus all --rm --name hyperagents-generate \
      -v /var/run/docker.sock:/var/run/docker.sock \
      -v $(pwd)/.env:/hyperagents/.env \
      -v $(pwd)/outputs:/hyperagents/outputs \
      hyperagents python generate_loop.py --domains paper_review --max_generation 1
     

    ⚠️ 실행 시 문제점

    Docker-in-Docker 경로 매핑 문제: HyperAgents의 self-improving loop는 내부적으로 새 Docker 컨테이너를 생성하여 코드 수정을 수행합니다. 이 중첩 컨테이너에서 경로 매핑 문제가 발생할 수 있습니다:

    • 문제: 외부 컨테이너 내부 경로(/hyperagents/outputs/...)가 호스트 경로로 변환되지 않아 내부 컨테이너가 빈 폴더를 마운트
    • 증상: fatal: not a git repository: .git 에러 (exit code 128)
    • 해결 방법: HOST_REPO_PATH 환경변수로 호스트 경로 전달 필요
    # 경로 매핑 해결 (HOST_REPO_PATH 환경변수 추가)
    docker run --gpus all --rm \
      -v /var/run/docker.sock:/var/run/docker.sock \
      -v $(pwd)/.env:/hyperagents/.env \
      -v $(pwd)/outputs:/hyperagents/outputs \
      -e HOST_REPO_PATH=/home/username/blog/HyperAgents \
      hyperagents python generate_loop.py --domains paper_review
     

    ✅ 성공한 실행 결과

    setup_initial.sh 실행은 성공적으로 완료됩니다:

    # Dataset 준비 결과
    TRAIN dataset: Size: 100 (Accept: 50, Reject: 50)
    VAL dataset: Size: 100 (Accept: 50, Reject: 50)
    TEST dataset: Size: 100 (Accept: 50, Reject: 50)
    
    # 생성된 파일
    outputs/initial_paper_review_filtered_100_train_0/predictions.csv
    outputs/initial_paper_review_filtered_100_val_0/predictions.csv
    outputs/initial_paper_review_filtered_100_test_0/predictions.csv
     

    5. 파일 구조

    파일/폴더 설명
    agent/ Foundation model 코드
    meta_agent.py Meta Agent 구현
    task_agent.py Task Agent 구현
    generate_loop.py 진입점 (실행 파일)
    requirements.txt Python 패키지 목록

    ⚠️ 안전 주의사항

    HyperAgents는 모델 생성 코드를 실행합니다. 이는 강력한 기능이지만, 동시에 안전 위험이 존재합니다.

    ⚠️ 중요 경고: HyperAgents는 LLM이 생성한 Python 코드를 직접 실행합니다. 이 코드는 파일 시스템 접근, 외부 API 호출, 네트워크 연결 등을 수행할 수 있습니다. 격리된 환경(Docker 컨테이너, 샌드박스)에서 실행하는 것이 필수입니다.

    안전 실행 권장사항

    1. Docker 컨테이너 사용: HyperAgents를 격리된 컨테이너에서 실행
    2. 네트워크 제한: 외부 API 호출만 허용 (OpenAI, Anthropic, Gemini)
    3. 파일 시스템 제한: 작업 디렉토리만 접근 허용
    4. API 키 보안: .env 파일을 .gitignore에 추가
    5. 실행 로그 모니터링: 에이전트가 수행하는 작업을 실시간 확인

    격리 메커니즘 확인

    Verdent AI 연구에서 실제 격리 메커니즘의 존재가 중요한 안전 신호라고 강조합니다. "코드를 외부로 보내지 않습니다" 같은 마케팅 주장만으로는 안전을 보장할 수 없습니다. 명시적인 샌드박스, 컨테이너, 권한 제한이 구현되어 있어야 합니다.

    🔍 다른 자기 개선 시스템과 비교

    HyperAgents는 기존 자기 개선 시스템과 어떻게 차별화되는지 비교해보겠습니다.

    시스템 개발자 자기 개선 범위 특징
    DGM Sakana AI (2025) 코딩만 Darwinian evolution + Gödel machine
    ADAS 다양한 연구 제한적 Automated Design of Agentic Systems
    Hermes Agent HyperAgentAI 작업 개선만 32K+ GitHub stars, 자율 AI 에이전트
    DGM-H (HyperAgents) Meta AI (2026) 모든 계산 작업 Task/Meta Agent co-modify

    Hacker News 논의에서 Hermes Agent는 작업 개선 루프만 가지고 있고, HyperAgents 같은 자기 개선 개선 루프는 없다고 지적했습니다. 이 차이가 HyperAgents의 핵심 혁신입니다.

    🎯 맺음말

    지금까지 HyperAgents에 대해 알아보았습니다. HyperAgents는 Meta AI가 발표한 자기 참조·자기 개선 AI 에이전트 프레임워크로, Task Agent와 Meta Agent가 서로를 수정(co-modify)하여 메타인지적 자기 개선을 실현합니다. 특히 DGM-H 아키텍처는 모든 계산 가능한 작업에 적용 가능하며, 논문 리뷰 도메인에서 0.0에서 0.710 점으로 완전한 성능 향상을 입증했습니다.

    다만 모델 생성 코드를 직접 실행하므로 Docker 컨테이너 등 격리 환경에서 실행하는 것이 필수입니다. API 키 보안, 네트워크 제한, 파일 시스템 제한 등 안전 조치를 취한 후 사용하세요.

     

    여러분도 한번 HyperAgents를 GitHub에서 클론하여 격리 환경에서 직접 테스트해보시길 추천드리면서 저는 다음 시간에 더 유익한 정보를 가지고 다시 찾아뵙겠습니다. 감사합니다.

    https://fornewchallenge.tistory.com/

     

     


    📚 참고 문헌 및 출처

    728x90