본문 바로가기
AI 도구

오픈소스 AI 엔지니어 Devika 체험: 계획-검색-코딩 자동화 성공!

by James AI Explorer 2024. 3. 24.

목차

    728x90

    안녕하세요! 오늘은 Devika라는 AI 소프트웨어 엔지니어를 만나보겠습니다. Devika는 오픈소스 AI 소프트웨어 엔진으로, 고수준의 인간 지시를 이해하고 단계별로 실행 가능한 작업으로 분해하여 관련 정보를 조사하고 코드를 생성하는 능력을 갖추고 있습니다. 이 블로그에서는 Devika의 개요와 주요 기능을 알아보고 Devika에게 스네이크 게임개발정보검색 및 요약 작업을 요청해 보겠습니다. 

    DEVIKA: 오픈소스 AI 소프트웨어 엔지니어에게 코딩 작업 시키기

    "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."

    Devika 개요 및 주요 기능

    Devika는 최근 공개된 Cognition AI의 Devin을 모델로 하였으며, Devin의 대안을 제공하고 SWE-bench 벤치마크에서 Devin과 동일한 점수를 달성하는 목표를 가지고 있습니다. Devika는 사용자의 요청에 따라 주어진 목표를 달성하기 위해 단계별 작업계획을 수립하고 언어 모델을 활용하여 코드를 생성합니다. Devika의 주요 기능은 다음과 같습니다.

    • 인간 지시 이해: 사용자가 제공한 고수준의 목표 또는 작업 설명을 이해하고 실행 가능한 단계로 분해합니다.
    • 정보 조사: 웹을 통해 관련 정보를 조사하고 필요한 데이터를 수집합니다. 이를 통해 프로젝트에 필요한 정보를 효율적으로 확보할 수 있습니다.
    • 코드 생성: Devika는 주어진 목표에 대해 필요한 코드를 생성합니다. 이를 위해 최신 언어 모델과 알고리즘을 사용하여 코드를 자동으로 작성합니다.
    • 진행 모니터링: 작업을 실행하는 동안 진행을 모니터링하고 필요에 따라 수정하거나 추가 지침을 요청합니다.
    • 프로젝트 관리: Devika는 프로젝트 파일을 관리하고 상태를 추적하여 사용자가 작업을 효율적으로 관리할 수 있도록 지원합니다.
    • 상호 작용 인터페이스: Devika는 사용자와의 상호 작용을 위한 웹 기반 채팅 인터페이스를 제공하여 사용자가 필요한 정보를 요청하거나 작업을 지시할 수 있습니다.

    Devika는 뛰어난 AI 기술과 높은 자동화 수준을 통해 개발 작업을 간소화하고 효율적으로 진행할 수 있도록 지원합니다.

    https://github.com/stitionai/devika

     

    GitHub - stitionai/devika: Devika is an Agentic AI Software Engineer that can understand high-level human instructions, break th

    Devika is an Agentic AI Software Engineer that can understand high-level human instructions, break them down into steps, research relevant information, and write code to achieve the given objective...

    github.com

    Devika의 구성 요소는 다음과 같습니다:

    • 사용자 인터페이스 (User Interface): Devika와 상호 작용하고, 프로젝트 파일을 볼 수 있으며, 에이전트 상태를 모니터링할 수 있는 웹 기반 채팅 인터페이스입니다.
    • 에이전트 코어 (Agent Core): AI 계획, 추론 및 실행 프로세스를 조정하는 중앙 구성 요소입니다. 다양한 하위 에이전트와 모듈과 통신하여 작업을 수행합니다.
    • 대형 언어 모델 (Large Language Models): Devika는 Claude, GPT-4 및 로컬 LLM(Ollama를 통해)과 같은 최첨단 언어 모델을 활용하여 자연어 이해, 생성 및 추론을 수행합니다.
    • 계획 및 추론 엔진 (Planning and Reasoning Engine): 고수준 목표를 실행 가능한 단계로 분해하고 현재 컨텍스트를 기반으로 결정을 내리는 고급 AI 계획 및 추론 알고리즘을 구현합니다.
    • 연구 모듈 (Research Module): 키워드 추출 및 웹 탐색 능력을 활용하여 필요한 정보를 수집하는 데 사용됩니다.
    • 코드 작성 모듈 (Code Writing Module): 계획, 연구 결과 및 사용자 요구 사항에 따라 코드를 생성합니다. 여러 프로그래밍 언어를 지원합니다.
    • 브라우저 상호 작용 모듈 (Browser Interaction Module): Playwright를 통해 웹 페이지를 동적으로 조작하고 데이터를 수집하여 고급 웹 스크래핑 및 자동화 작업을 수행할 수 있습니다.

    Devika는 사용자 요청을 이해하고 실행 가능한 작업으로 분해하여 작업을 수행하는 강력한 인공 지능 시스템을 구축하는 데 중점을 둡니다.

    반응형

    환경설정 및 의존성 설치

    이 블로그에서 사용한 예제코드의 실행환경은 Windows 11 Pro(23H2),  파이썬 버전 3.11, 코드 에디터는 비주얼 스튜디오 코드(이하 VSC)이며, VSC를 실행하여 "WSL에 연결"을 통해 Windows Subsystem for Linux(WSL)을 사용하여 Linux 환경에 액세스 하도록 구성합니다.

    npm과 node.js 설치

    먼저 Devika설치를 위해 npm과 node.js를 설치합니다. npmNode Package Manager의 약자로, JavaScript 프로그래밍 언어를 사용하는 프로젝트에서 패키지를 설치하고 관리하는 도구입니다. npm을 사용하면 JavaScript 프로젝트에 필요한 다양한 패키지를 손쉽게 설치하고 관리할 수 있습니다. Node.js는 JavaScript를 사용하여 서버 측 코드를 작성하고 실행할 수 있도록 해주는 환경을 제공하여 웹 서버 개발을 간단하게 만들어 줍니다. Node.js는 많은 패키지 및 라이브러리가 있어서 서버 측 로직을 개발할 때 유용하게 사용됩니다.

     

    WSL(Windows Subsystem for Linux)을 사용하는 경우에는 Linux용 Node.js를 설치해야 합니다. 다음은 Node.js와 npm을 WSL에서 설치하는 명령어입니다. npm만 별도로 설치할 때는 "npm install -g npm@latest" 명령어를 사용합니다. 

    curl -fsSL https://deb.nodesource.com/setup_20.x | sudo -E bash -
    sudo apt-get install -y nodejs
    npm install -g npm@latest

     

    설치가 완료되면 "npm --version"과 "node --version"명령어로 정상적으로 버전이 표시되는지 확인한 후, "whereis" 명령어로  Node.js와 npm이 설치된 경로를 각각 확인합니다. 이 두 경로를 시스템에서 인식하도록 하기 위해 "nano ~/.bashrc" 명령어를 실행하여 nano 텍스트 편집기로 bashrc 파일을 수정합니다. bashrc 파일은 Bash 쉘의 설정 파일로, 사용자가 Bash 쉘을 실행할 때마다 실행되는 스크립트입니다. "export PATH="/home/사용자이름/nodejs/node-v21.7.1-linux-x64/bin:/usr/local/bin/npm/bin:$PATH"의 형식으로 Node.js와 npm이 설치된 경로를 bashrc 파일 마지막 부분에 추가해 주고, ctrl-X, 변경확인 y를 누르고 빠져나온 후, "source ~/.bashrc" 명령어를 실행하여 변경사항을 반영해 줍니다. 

    npm --version
    node --version
    whereis node
    whereis npm
    nano ~/.bashrc
    export PATH="/home/사용자이름/nodejs/node-v21.7.1-linux-x64/bin:/usr/local/bin/npm/bin:$PATH"
    source ~/.bashrc

    Node.js와 npm이 설치된 경로 추가 화면

    레포지토리 복제 및 의존성 설치

    다음은 깃허브 레포지토리 복제 및 의존성 설치 단계입니다. 아래 코드에 따라 순서대로 설치합니다. 

    ollama serve
    git clone https://github.com/stitionai/devika.git
    cd devika/
    python3.11 -m venv myenv
    source myenv/bin/activate
    pip install -r requirements.txt
    cd ui/
    bun install
    • 로컬 언어 모델 사용을 위해서는 ollama를 설치하고 "ollama serve" 명령어로 서비스를 구동합니다. 
    • "curl -fsSL https://bun.sh/install | bash" 명령어로 JavaScript runtime, bun을 설치합니다. 
    • "git clone" 명령어를 통해 레포지토리를 복제합니다. 
    • devika 디렉토리로 이동해서 가상환경을 만들고 활성화합니다. 
    • "pip install -r requirements.txt" 명령으로 의존성을 설치합니다.
    • ui 디렉토리로 이동하여 "bun install" 명령으로 JavaScript 프로젝트의 종속성을 설치합니다. 

    https://bun.sh/

     

    Bun — A fast all-in-one JavaScript runtime

    Bun implements the Web-standard APIs you know and love, including fetch, ReadableStream, Request, Response, WebSocket, and FormData.

    bun.sh

    깃허브 레포지토리 복제 및 의존성 설치
    JavaScript runtime, bun 설치
    bun 설치확인

    API KEY 발급 및 설정

    다음은 API KEY 발급 및 설정단계입니다. 먼저 빙 검색을 위한 API 발급입니다. 아래 링크에 접속해서 빙 검색 리소스 만들기 화면을 통해 구독 정보를 입력하고 키를 발급합니다. Azure 구독 신청단계에서 신용카드 정보를 입력하지만 청구되지 않으니 안심하셔도 됩니다. 

    https://www.microsoft.com/en-us/bing/apis/bing-web-search-api

    빙 검색 리소스 만들기 화면
    빙 검색 리소스 생성 완료 화면

    위 화면과 같이 빙 검색 리소스 생성이 완료되면 좌측 메뉴 중 키 및 엔드포인트를 클릭해서 API Key를 복사합니다. 

    빙 검색 API Key 발급화면

    빙 검색 API Key 발급이 완료되면 클로드3의 API Key를 발급받습니다. 클로드3의 API Key 발급방법은 아래 표시된 이전 포스트를 참조하시면 됩니다. 

    2024.03.06 - [대규모 언어모델] - 클로드(Claude) 3: GPT-4와 제미나이를 뛰어넘은 언어 모델의 등장!

     

    클로드(Claude) 3: GPT-4와 제미나이를 뛰어넘은 언어 모델의 등장!

    안녕하세요! 오늘은 3월 4일 발표된 앤트로픽의 최신 대형 언어 모델 클로드(Claude) 3에 대해서 알아보겠습니다. 이번에 발표된 클로드 3 모델 패밀리는 Haiku, Sonnet 및 Opus라는 세 가지 최신 모델로

    fornewchallenge.tistory.com

     

    API Key 발급이 모두 끝나면 Devika 디렉토리에 있는 config.toml을 VSC에서 열어서 API Key 값을 입력해 주고, API ENDPOINTS 값도 아래 화면을 참고해서 입력해 줍니다. 

    config.toml 수정

    "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."

    프로그램 실행

    다음은 서버 측 백 엔드(Backend)와 사용자 측 프론트 엔드(Frontend) 프로그램을 실행하는 단계입니다. 다음과 같이 명령어를 입력하여 프로그램을 실행하고, 백 엔드 프로그램을 종료하지 말고 유지한 채로 프론트 엔드 프로그램을 실행합니다. 

    • 백 엔드 프로그램 실행 명령어 : python3 devika.py
    • 프론트 엔드 프로그램 실행 명령어 :  bun run dev

    프론트 엔드 명령 실행 시 에러가 발생하는 경우, 다음과 같이 "npm install vite --save-dev" 명령어로 프로젝트의 개발 의존성 웹개발 빌드도구인 Vite를 다시 설치해야 할 수 있습니다. 

    웹개발 빌드도구 Vite 설치 화면
    백 엔드 프로그램 실행
    프론트 엔드 프로그램 실행

    프론트 엔드 프로그램이 실행되면 다음 화면과 같이 http://127.0.0.1:3000/ 주소에서 웹브라우저가 열리면서 Devika를 만나실 수 있습니다. 화면의 좌측은 사용자와 Devika의 대화창이 배치되어있고, 우측은 웹 브라우저터미널이 배치되어 있습니다. 좌측 상단은 프로젝트명 생성 메뉴가 있고, 우측 상단에는 언어 모델 선택 메뉴가 있습니다. 

    Devika 초기 화면

    스네이크 게임 작성예제

    이제 Devika에게 코딩을 시켜볼 차례입니다. 스네이크 게임 작성을 시키기 위해서 "Create a snake game using python"을 좌측 아래쪽 프롬프트에 입력합니다. 그러면 Devika는 아래 화면과 같이 게임을 만들기 위한 실행계획을 응답합니다. 

    스네이크 게임 개발 실행계획을 응답하는 Devika

    단계별 실행계획을 응답한 후, Devika는 오른쪽 화면의 브라우저 창을 통해 관련 웹 사이트를 자동으로 탐색합니다. 

    게임 개발관련 웹 사이트를 탐색하는 Devika

    실행이 완료되면 Devika 디렉토리 밑에 projects 디렉토리에 프로젝트 명과 같은 디렉토리 밑으로 main.pyREADME.md, requirements.txt 파일이 생성됩니다. README.md 파일을 읽어보면 어떻게 결과물을 확인할 수 있는지 방법이 나와있으며, 대부분 "pip install -r requirements.txt"를 실행 후 main.py를 실행하도록 설명이 되어 있습니다. 

    프로젝트 실행 후 생성된 결과물과 디렉토리 구조

     

    README.md 파일
    README.md 파일

    저의 경우 main.py를 실행하였으나, 아래 화면에서 방향키를 누르면 스네이크가 없어지는 현상이 있어서 ChatGPT와 Poe를 통해 코드를 1~2회 수정하여 게임을 완성할 수 있었습니다. 

    스네이크 게임 실행화면
    스네이크 게임 실행화면
    스네이크 게임 실행화면

    제가 요청한 내용에 대해 Devika가 스스로 실행계획을 작성하고, 관련된 웹 사이트를 탐색하고, 코드를 제시하는 모습은 놀라운 체험이었습니다. 비록 게임 실행이 완전하지는 않았지만 새로운 방향성과 가능성을 느낄 수 있었습니다. 

    "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."

    인터넷 검색 및 요약 예제

    다음은 인터넷 검색 및 요약 예제를 실행해 보겠습니다. 저는 아래 화면과 같이 피규어 01에 대한 정보를 검색해서 요약해 달라고 하였습니다. Devika는 단계별 실행계획을 응답한 후, 관련 웹사이트를 자동으로 탐색하여 정보를 수집하였습니다. 하지만 실행완료 후 Devika가 제시한 응답은 구글 검색 API 방식이 아닌 웹 스크래핑 방식 코드를 응답하여 결과를 출력할 수는 없었습니다. 코드 수정을 다시 요청하였지만 추가로 진행되지는 않았습니다. 

    인터넷 검색 및 요약을 실행하는 Devika

    맺음말

    이 블로그에서는 오픈소스 AI 소프트웨어 엔지니어 Devika를 소개하고, 스네이크 게임 개발 및 정보 검색/요약 작업을 시켜보았습니다. Devika는 고수준의 인간 지시를 이해하고 실행 가능한 작업으로 분해하여 관련 정보를 조사하고 코드를 생성하는 능력을 갖추고 있습니다. 

     

    Devika의 인터넷 검색결과 수집 코딩방식이나, 사용자와의 자연스러운 상호 작용 부분은 좀 더 개선이 필요하지만, Devika는 앞으로 더 많은 기능을 추가하고 성능을 개선하여 사용자에게 더 유용한 도구가 될 것으로 기대됩니다. 여러분도 스스로 인터넷을 탐색하고 코드를 작성하는 AI 엔지니어, Devika를 체험해보시면 좋을 것 같습니다.

     

    오늘 내용은 여기까지입니다. 저는 그럼 다음 시간에 더 유익한 정보를 가지고 다시 찾아뵙겠습니다. 감사합니다. 

     

    https://fornewchallenge.tistory.com/

    2024.02.01 - [AI 논문 분석] - 코드생성 AI AlphaCodium: 프롬프트 엔지니어링에서 플로우 엔지니어링으로

     

    코드생성 AI AlphaCodium: 프롬프트 엔지니어링에서 플로우 엔지니어링으로

    안녕하세요! 오늘은 최근 화제가 되고 있는 코드 생성 AI AlphaCodium에 대해서 알아보겠습니다. AlphaCodium은 코드 생성 작업을 위한 흐름 기반 방법론으로, 문제에 대한 자연어 이해와 코드 생성을

    fornewchallenge.tistory.com

     

    반응형