본문 바로가기
AI 뉴스 리뷰

피규어(Figure) 01: 인간 같은 휴머노이드 로봇의 미래

by James AI Explorer 2024. 3. 15.
    728x90

    안녕하세요! 오늘은 오픈AI의 동영상 생성 AI Sora에 이은 또 하나의 혁신적인 AI, 피규어 01 로봇에 대해서 알아보겠습니다. 피규어 01은 OpenAI와 캘리포니아의 스타트업 회사 피규어 AI와의 파트너십을 통해 만들어진 인공지능 휴머노이드 로봇입니다. 이 블로그에서는 피규어 01 로봇의 개요, 기술적인 특성과 작동원리, DEMO 영상에 대해서 알아보겠습니다. 

    피규어(Figure) 01: 인간 같은 휴머노이드 로봇의 미래

    https://www.aitimes.com/news/articleView.html?idxno=157964

     

    피규어 AI, 인간과 대화하며 작업하는 휴머노이드 공개..."SF가 현실로" - AI타임스

    인공지능(AI) 로봇 스타트업 피규어 AI가 오픈AI와 협력해 만든 휴머노이드 로봇 영상을 공개했다. 사람의 질문과 요청을 정확히 이해하고 답변하며 자발적으로 움직이는 모습에 \"충격적\"이라는

    www.aitimes.com

    "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."

    피규어 01 로봇 개요

    피규어 01은 오픈AI의  ChatGPT 비전 및 스피치-투-스피치(Speech-to-Speech)  기술을 사용한 대화형 휴머노이드 로봇입니다. 이 로봇은 인간과의 상호작용을 위해 개발되었으며, 오픈AI의 인공지능 기술을 통해 시각적 판단과 언어 이해 능력을 갖추고 있습니다. 휴머노이드(Humanoid)란 사람과 비슷한 형태와 특성을 갖춘 인공적인 것을 가리키는 용어로써, 휴머노이드 로봇은 주로 인간의 환경에서 작업을 수행하거나 사람과 상호 작용하기 위해 설계되며, 서비스 및 도움 기능을 수행하기 위해 사용됩니다.

     

    피규 01은 오픈AI가 6억 7,500만 달러를 투자한 것으로 알려진 캘리포니아의 기술 스타트업 회사, 피규어 AI에 의해서 만들어졌으며, 피규어 AI사는 오픈AI와의 파트너십을 통해 인공지능 및 로봇 공학 분야에서의 지식과 경험을 바탕으로 휴머노이드 로봇의 개발 및 상용화를 추진하고 있습니다. 피규어 01 로봇의 주요 사양은 다음과 같습니다:

    • 높이: 1.7 미터 (5 피트 6 인치)
    • 무게: 60 킬로그램 (132 파운드)
    • 최대 운반 무게: 약 20 킬로그램 (44 파운드)
    • 작동 시간: 약 5 시간
    • 최고 속도: 약 1.2 미터/초 (2.7 mph)

    이 로봇은 사람의 신체를 모방하여 설계되었으며, 문을 열고 도구를 사용할 수 있는 손, 효율적으로 이동하고 계단을 오를 수 있는 팔과 다리를 갖추고 있습니다. 또한 상자와 같은 물건을 운반할 수 있습니다.

    728x90

    동작원리 및 DEMO 영상

    피규어 01은 주로 오픈AI의 기술을 기반으로 시각 및 언어 이해 능력을 갖추고 있으며, 주변 환경을 인식하고 인간과의 상호작용을 수행할 수 있습니다. 피규어 01의 동작 원리는 크게 다음과 같습니다.

    • 시각적 인식: 피규어 01은 자체 내장된 카메라를 통해 주변 환경을 관찰하고 인식합니다. 이를 통해 물체, 사람, 장면 등을 식별하고 이해합니다.
    • 언어 이해: 피규어 01은 오픈AI의 언어 모델을 사용하여 인간의 음성 명령을 이해하고 처리합니다. 이 모델은 자연어 처리 기술을 기반으로 하며, 피규어 01이 음성 명령을 텍스트로 변환하여 처리합니다.
    • 상호작용 및 응답: 피규어 01은 인식된 정보와 이해한 음성 명령을 기반으로 인간과의 상호작용을 수행합니다. 이를 통해 일상적인 작업을 수행하거나 인간의 질문에 응답합니다.
    • 자율적인 행동: 피규어 01은 일부 작업을 자율적으로 수행할 수 있습니다. 예를 들어, 주변 환경을 인식하고 상황에 맞게 행동을 결정할 수 있습니다.

    피규어 AI의 엔지니어인 Corey Lynch은 X에 올린 포스트에서, "우리는 로봇 카메라에서 이미지를 받아들이고, 내장 마이크에서 캡처한 음성으로부터 텍스트를 받아들여 오픈AI가 훈련한 대형 멀티 모달 모델에게 제공합니다. 이 모델은 언어 응답을 만들기 위해 대화의 전체 기록을 처리하고, 이는 사람에게 텍스트-투-스피치(Text-to-Speech)로 다시 전달됩니다."라고 말했습니다. 다음은 피규어 01 로봇의 최신 DEMO 동영상입니다. 

    피규어 01 로봇의  최신 DEMO 동영상

     

    위 동영상에서 보면 피규어 01 휴머노이드 로봇은 ChatGPT 비전을 통해 주변에 있는 물체를 정확하게 인식할 수 있는 능력을 가지고 있으며, 테이블 위에 놓인 빨간 사과를 정확하게 식별할 수 있습니다. 엔지니어가 배고프다고 하고 먹을 것을 요청하면, 피규어 01은 사과가 음식이라는 것을 알고 당신에게 제공할 수 있습니다. 이는 피규어 01이 물체를 인식하는 것뿐만 아니라 그것들의 우리 일상생활에서의 사용도 이해한다는 것을 보여줍니다. 다음은 동영상에서 엔지니어와 피규어 01 로봇이 나눈 대화입니다. 

    • Human : Hey, figure one, what do you see right now?
    • Figure 01 : I see a red apple on a plate in the center of the table, a drying rack with cups and a plate and you standing nearby with your hand on the table.
    • Human : Great. Can I have something to eat?
    • Figure 01 : Sure thing.
    • Human : Great, Can you explain why you did what you just did while you pick up this trash?
    • Figure 01 : On it, So I gave you the Apple because it's the only uh edible item I could provide you with from the table.
    • Human : Great, so based on the scene right now, where do you think the dishes in front of you go next?
    • Figure 01 : The dishes on the table like that plate and cup are likely to go into the drying rack next.
    • Human : Great, Can you put them there?
    • Figure 01 : Of course
    • Human : All right so how do you think you did?
    • Figure 01 : I, I think I did pretty well the apple found its new owner the trash is gone and the tableware is right where it belongs.
    • Human : I agree, thanks figure one
    • Figure 01 : you're welcome if there's anything else you need help with just let me know

    "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."

    • 사람 : "안녕, 피규어 01, 지금 무엇을 보고 있니?"
    • 피규어 01: "저는 지금 테이블 가운데에 접시 위에 붉은 사과, 컵과 접시가 있는 건조대, 그리고 당신이 테이블 가까이 서 있고 손을 테이블 위에 올려놓은 것을 보고 있어요."
    • 사람 : "좋아. 뭔가 먹을 수 있을까?"
    • 피규어 01: "물론이죠."
    • 사람 : "좋아, 방금 한 일에 대해 설명해 줄 수 있을까? 그리고 이 쓰레기를 치우는 동안 말이야."
    • 피규어 01: "알겠습니다. 그래서 저는 당신에게 사과를 주었는데요, 테이블 위에서 제가 제공할 수 있는 유일한 식품이기 때문입니다."
    • 사람 : "좋아, 그럼 현재 상황을 바탕으로, 당신이 앞에 있는 그릇들이 다음에 어디로 가야 할지 어떻게 생각해?"
    • 피규어 01: "테이블 위에 있는 접시와 컵 같은 그릇은 다음에 건조대로 들어갈 것 같아요."
    • 사람 : "좋아, 거기에 넣을 수 있겠니?"
    • 피규어 01: "물론이죠."
    • 사람 : "그래, 자네가 어떻게 한 것 같니?"
    • 피규어 01: "저, 저는 꽤 잘했다고 생각해요. 사과는 새 주인을 찾았고, 쓰레기는 없어졌으며, 테이블 용품은 바로 제자리에 있어요."
    • 사람 : "동의해, 피규어 01. 고맙다."
    • 피규어 01: "별말씀을요. 더 도울 일이 있으면 언제든지 말씀해 주세요."

    피규어 01 휴머노이드 로봇은 ChatGPT 비전 및 스피치-투-스피치 기술 이외에도, 환경에 대한 추론 능력이 크게 향상되었습니다. 현재 상황을 기반으로 다음에 무엇이 일어날지 예측할 수 있습니다. 예를 들어, 설거지를 한 후에는 그릇이 건조대에 놓일 것으로 예측합니다. 이러한 미래 예측 및 계획 능력은 AI가 우리의 안내 없이도 스스로 행동할 수 있는 첫걸음으로 피규어 01은 그릇을 건조대에 넣어야 한다고 판단하고, 그것을 스스로 처리합니다. 이것은 AI가 더욱 자립적으로 행동하고 주도적일 수 있다는 것을 보여줍니다.

     

    사람이 피규어 01에게 사과를 주면서도 쓰레기를 줍는 이유를 설명하도록 요청했을 때 로봇은 쓰레기 항목을 인식하고 쓰레기통에 넣으면서 사과를 전달한 이유를 대화식으로 제시하는 다중 작업 능력을 보여주었습니다. 작업을 마친 후에, 피규어 01은 목표를 잘 달성했는지 여부를 스스로 판단합니다. 이러한 자가평가는 AI가 자신의 행동에서 학습하고 시간이 지남에 따라 더 나아질 수 있도록 하는데 중요한 요소입니다.

     

    피규어 AI의 창립자 Adcock은 피규어 01이 "엔드-투-엔드 신경망(end-to-end neural networks)"를 사용했다고 말했는데, 이는 원격 조작자가 화면 밖에서 로봇을 제어하지 않았다는 것을 의미하며, 동영상의 모든 것은 피규어 01과 시각 언어 모델(Visual Language Model, VLM) 프로그래밍에 의해 수행되었다고 합니다. 동영상에서 보듯이 피규어 01은 사람과의 대화에서 약간의 지연을 보여줍니다. 

     

    맺음말

    피규어 01은 향후 인간과 로봇 사이의 상호작용에서 중요한 역할을 할 것으로 예상되며, 이러한 기술의 발전은 많은 산업에서 혁신을 가져올 것으로 기대됩니다. 예를 들면, 제조업에서는 피규어 01과 같은 휴머노이드 로봇이 반복적이고 일상적인 작업을 처리하고, 사람들이 더 창조적이고 가치 있는 작업을 수행할 수 있도록 도와줄 수 있으며, 의료, 공학, 교육 등의 분야에서도 활용될 수 있을것입니다.

     

    피규어 01은 현재로서는 단순히 로봇의 한 종류로 보일 수 있지만, 이러한 첨단 기술이 우리의 삶을 혁신시키고, 새로운 가능성을 지속적으로열어준다면, 한 10년 후에는 지금의 인공지능 스피커처럼 가정마다 피규어 01과 같은 휴머노이드 로봇을 하나씩 가지고 있게 되지 않을까요?

     

    오늘 내용은 여기까지입니다. 저는 그럼 다음 시간에 더 유익한 정보를 가지고 다시 찾아뵙겠습니다. 감사합니다. 

     

    "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."

     

    2024.01.08 - [AI 논문 분석] - Mobile ALOHA: 저렴한 전신 원격운전 양손 조작 학습 로봇

     

    Mobile ALOHA: 저렴한 전신 원격운전 양손 조작 학습 로봇

    안녕하세요! 오늘은 저렴한 비용으로 전신(Whole-Body) 원격운전을 통해 인간의 복잡한 동작을 학습하여 스스로 양손 조작이 가능한 움직이는 로봇, Mobile ALOHA를 만나보겠습니다. 가사, 요리, 인간-

    fornewchallenge.tistory.com

    728x90