AI OpenFree

Posted on May 30

로봇 두 대가 말 없이 협업? 피규어 AI 암묵적 협업 기술의 비밀

#robotcollaboration #figureai #humanoidrobot #implicitcollaboratio

로봇 두 대가 말 한마디 없이 방을 정리했다, 그런데 진짜 질문은 '어떻게'가 아니다

협업의 정의가 바뀌고 있다. 인간끼리도 아니고, 인간과 로봇도 아니라, 로봇과 로봇 사이에서.

TL;DR: 피규어 AI의 휴머노이드 두 대가 언어 없이 2분 만에 침실 정리에 성공했다. 기술 자체보다 흥미로운 것은, 이 '눈치'가 어떻게 만들어졌는가이다. 로봇 협업이 인간 협업의 방식을 모방한 게 아니라, 아예 다른 방식으로 진화하고 있다는 신호다.

로봇 산업에는 잘 알려지지 않은 규칙이 하나 있다.

로봇을 한 대 잘 만드는 것보다, 두 대가 함께 작동하게 만드는 것이 기하급수적으로 어렵다는 것. 보스턴 다이내믹스는 수십 년 동안 혼자 뛰고, 혼자 문을 열고, 혼자 계단을 오르는 로봇을 만들어왔다. 테슬라의 옵티머스는 혼자 부품을 집고, 혼자 배터리를 나른다. 그런데 피규어 AI는 올해 다른 질문을 던졌다. "두 대가 서로 말을 하지 않아도, 협력할 수 있을까?"

그리고 최근 그 답이 나왔다. 2분이었다.

먼저, '눈치'라는 단어를 다시 생각해야 한다

우리가 일상에서 쓰는 '눈치'는 상당히 복잡한 인지 활동이다. 상대방의 행동을 보면서, 다음 행동을 예측하고, 내 행동을 조율하고, 충돌을 피하고, 빈틈을 채우는 것. 인간은 이걸 언어 없이, 심지어 시선 교환만으로 해낸다. 오랜 시간을 함께한 팀에서, 숙련된 주방의 요리사들 사이에서, 그리고 가족 사이에서.

그런데 이 능력은 학습된 것이지, 타고난 것이 아니다. 아이들은 눈치가 없다. 신입 직원도 눈치가 없다. 수백 번의 상호작용과 실수와 교정을 거쳐야 비로소 '눈치'가 생긴다.

피규어 AI의 휴머노이드 두 대는 이 과정을 어떻게 압축했을까. 보도에 따르면 이들은 사전에 언어 명령이나 역할 분담 지시 없이, 상대 로봇의 행동을 실시간으로 인식하고 자신의 다음 동작을 결정했다. 공간을 나눠 쓰고, 같은 물건에 손을 뻗지 않고, 한쪽이 멈추면 다른 쪽이 채웠다. 이것을 연구자들은 '암묵적 협업(implicit collaboration)'이라고 부른다.

쉽게 말하면, 로봇이 눈치를 배웠다는 뜻이다.

두 대가 함께 움직인다는 것의 기술적 의미

단일 로봇의 작동 원리는 비교적 단순하게 설명할 수 있다. 센서가 환경을 인식하고, 모델이 행동을 결정하고, 액추에이터가 실행한다. 루프가 하나다.

두 대가 함께 움직이는 순간, 루프가 두 개가 아니라 세 개가 된다. 로봇 A의 루프, 로봇 B의 루프, 그리고 A와 B가 서로를 환경으로 인식하면서 생기는 상호작용 루프. 이 세 번째 루프가 문제다. A의 행동이 B의 환경을 바꾸고, 그 변화가 다시 B의 행동을 바꾸고, 그 행동이 또 A의 환경을 바꾼다. 루프가 루프를 먹는 구조다.

이것을 중앙에서 통제하는 방식은 예전부터 존재했다. 공장 자동화에서 쓰이는 PLC(프로그래머블 로직 컨트롤러) 방식이 대표적이다. A는 1번 작업, B는 2번 작업, 충돌 시 A가 우선 — 이런 식으로 모든 경우의 수를 미리 프로그래밍한다. 정해진 공간, 정해진 물건, 정해진 순서. 공장에서는 작동한다. 일상에서는 작동하지 않는다.

침실은 공장이 아니다. 물건의 위치가 매번 다르고, 침대 정리와 바닥 정리가 동시에 일어나야 할 수도 있고, 하나가 예상치 못한 물건을 발견하면 계획 전체가 바뀐다. 규칙 기반의 중앙 통제로는 불가능하다.

피규어 AI가 선택한 방향은 분산 의사결정이었다. 각 로봇이 독립적으로 환경을 인식하고, 상대 로봇의 현재 상태를 하나의 입력값으로 받아들이면서, 스스로 다음 행동을 결정하는 방식이다. 중앙 관제탑이 없다. 각자가 판단하되, 서로를 인식한다. 이것이 인간의 눈치와 구조적으로 가장 유사한 접근이다.

2분이라는 숫자가 중요한 이유

2분. 이 숫자를 처음 들으면 "겨우 2분?"이라고 생각할 수 있다. 그런데 맥락을 알면 반응이 바뀐다.

로봇이 단독으로 침실을 정리하는 데 걸리는 시간과 비교해보자. 현재 가장 발전한 단일 휴머노이드 로봇들의 가사 작업 수행 속도는, 같은 작업을 인간이 하는 것보다 보통 3배에서 10배 느리다. 동작이 느린 것도 있지만, 판단하고 멈추고 재시도하는 과정이 반복되기 때문이다.

두 대가 협력했을 때 2분이 나왔다는 것은, 적어도 이 특정 과제에서는 협업으로 인한 속도 저하가 없었다는 의미다. 보통 협업에는 조율 비용이 따른다. 인간도 두 사람이 함께 일하면 한 사람이 혼자 하는 것보다 두 배 빠르지 않다. 의사소통하고, 역할을 나누고, 상대를 기다리는 시간이 생긴다. 두 대의 로봇이 이 조율 비용을 거의 제로에 가깝게 줄였다면, 그것 자체가 기술적 성취다.

물론 한계도 있다. 2분은 특정 조건, 특정 공간, 특정 물건 배치에서 나온 결과다. 일반화된 가정환경에서 동일한 성능이 나온다는 보증은 아직 없다. 그리고 이 실험이 얼마나 많은 사전 훈련과 환경 세팅을 전제했는지는 공개되지 않았다.

하지만 방향은 분명하다.

거인들이 이미 이 레이스에 올라타 있다

피규어 AI가 이 결과를 발표한 타이밍은 우연이 아니다.

테슬라는 옵티머스를 자사 기가팩토리에 투입해 실제 작업을 수행하게 하고 있다. 단일 로봇의 실증이다. 보스턴 다이내믹스는 아틀라스의 상업화 버전을 개발 중이다. 역시 단일 로봇이 중심이다. 아마존은 자사 물류창고에서 휴머노이드 실험을 진행 중이지만, 공개된 영상 대부분은 로봇 한 대가 특정 작업을 반복하는 장면이다.

다중 로봇 협업을 정면에서 다루는 곳은 상대적으로 적다. 피규어 AI는 이 틈새를 노렸다. 단일 로봇 성능 경쟁에서 한 발 비껴서, "두 대가 함께"라는 다른 질문을 먼저 풀기 시작한 것이다.

이 전략은 흥미롭다. 가장 비싼 게임, 즉 하드웨어 성능 경쟁에서 이기려면 엔비디아 GPU를 58조 원어치 사들이는 엔비디아만큼의 자본이 필요하다. 하지만 "어떻게 협업하게 할 것인가"라는 소프트웨어와 알고리즘의 게임에서는 다른 방정식이 성립한다. 작은 회사가 먼저 답을 낼 수 있는 게임이다.

그런데, 이 '눈치'는 어디에서 쓰일까

기술이 인상적이어도, 쓸 곳이 없으면 의미가 약하다.

다중 휴머노이드 협업의 첫 번째 시장은 아마도 공장이 아닐 것이다. 공장은 이미 수십 년 전부터 산업용 로봇 암이 협력하는 환경이 구축되어 있고, 구조화된 환경에서는 기존 방식이 더 효율적이다. 굳이 사람처럼 생긴 로봇이 필요하지 않다.

더 유력한 첫 번째 무대는 돌봄 환경이다. 고령화가 가장 빠르게 진행 중인 한국과 일본에서는, 노인 돌봄 인력 부족이 이미 임계점에 가까워지고 있다. 한 명의 노인을 돕는 데 두 대의 로봇이 협력해야 하는 상황은, 식사 보조와 이동 보조가 동시에 필요할 때 정확히 발생한다. 한 대가 부축하는 동안 다른 한 대가 식판을 치우는 것. 말 없이, 자연스럽게.

두 번째 무대는 재난 대응이다. 무너진 건물 안에서 두 대의 로봇이 협력해 생존자를 찾는 장면은 SF처럼 들리지만, 기술의 방향은 그쪽을 향하고 있다. 통신이 불안정한 환경에서 중앙 통제 없이 독립적으로 협력할 수 있는 능력이 여기서 결정적이다.

세 번째는 가장 가까운 미래인데, 역설적으로 가장 어려운 환경이다. 바로 일반 가정이다. 침실 정리 실험이 보여주는 것은 가정 환경이 얼마나 비구조적인가이다. 물건은 제자리에 없고, 공간은 매번 다르고, 예외 상황이 규칙보다 많다. 피규어 AI의 2분 실험이 이 맥락에서 의미를 갖는 이유다.

그리고 한 번, 솔직하게 봐야 할 것

이 기술이 만드는 미래가 마냥 장밋빛은 아니다.

두 대의 로봇이 눈치껏 협력할 수 있다면, 열 대도 가능하다. 열 대가 가능하면 백 대도 이론상 막을 이유가 없다. 그리고 인간이 그 협업의 고리에서 빠지는 순간, 우리는 새로운 질문에 직면한다. 그 협업이 무언가 잘못된 방향으로 수렴할 때, 누가 어떻게 개입하는가.

단일 로봇의 오작동은 로봇 한 대를 멈추면 된다. 분산된 다중 로봇의 협업 오류는 다르다. 각각은 올바르게 작동하는데, 협업의 결과물이 잘못된 경우가 생길 수 있다. 마치 각자는 규칙을 지키는데 교통 체증이 생기는 것처럼, 개별 단위의 합리성이 시스템 전체의 비합리성을 만들어내는 창발적 오류다.

피규어 AI가 이 문제를 어떻게 다루고 있는지는 아직 공개되지 않았다. 다만 이 질문을 빨리 직면한 팀이 더 오래 살아남는다는 것은, 이미 소프트웨어 업계에서 충분히 증명된 명제다.

비드래프트가 이 기술을 어떻게 보는가

비드래프트는 현재 인공사회 시뮬레이션 플랫폼인 NationalOS를 개발하고 있다. 수많은 에이전트가 동시에 상호작용하면서 사회적 패턴을 만들어내는 시스템이다. 구조적으로 다중 로봇 협업과 닮아 있다. 개별 에이전트의 행동 규칙이 단순해도, 집합적 상호작용에서는 예측하지 못한 결과가 나온다.

그래서 피규어 AI의 이번 발표가 우리에게 흥미로운 이유는 단순히 "로봇이 2분 만에 방을 정리했다"는 사실이 아니다. 분산된 에이전트들이 중앙 조율 없이 일관된 목표를 향해 협력할 수 있다는 증거가 물리적 세계에서 나왔다는 점이다. 시뮬레이션에서 가능하다고 알고 있던 것이, 현실의 무게와 마찰 속에서도 작동한다는 것.

이 작은 증거 하나가, 우리가 만들고 있는 것들을 다르게 보이게 한다.

로봇이 눈치를 배웠다. 그리고 더 중요한 질문이 남았다

결국 이 이야기는 2분에 관한 것이 아니다.

로봇이 눈치를 갖게 된다는 것은, 지금까지 기계에 없었던 어떤 것이 생긴다는 뜻이다. 지시 없이 맥락을 읽는 능력. 상대의 다음 행동을 예상하고 자신을 조율하는 능력. 인간은 이것을 오랜 진화와 사회화의 산물로 얻었다. 로봇은 훈련 데이터와 알고리즘으로 압축한다.

그리고 그 압축의 결과가 일상의 침실에서 시연됐다.

거인들이 단일 로봇 성능 경쟁에 수조 원을 쏟아붓는 동안, 한 팀은 다른 질문을 먼저 풀었다. "혼자 잘하는 것"이 아니라 "함께 잘하는 것". 이 두 문장 사이의 거리가, 앞으로 로봇 산업의 지형을 나누게 될지도 모른다.

눈치 없이 방을 정리하던 로봇이, 이제 눈치를 배웠다. 그것으로 만들어질 풍경치고는, 꽤 복잡한 이야기가 될 것 같다.

더 많은 AI 인사이트는 비드래프트에서 확인하세요.

자주 묻는 질문

Q. 피규어 AI의 이번 실험이 기존 로봇 협업 기술과 다른 점은 무엇인가요?
A. 기존 공장 자동화는 중앙 시스템이 각 로봇의 역할을 미리 지정하는 방식입니다. 피규어 AI의 접근은 각 로봇이 상대의 행동을 실시간 입력값으로 받아 독립적으로 판단하는 분산 방식으로, 정해지지 않은 환경에서도 협력이 가능하도록 설계되어 있습니다. 이것이 일반 가정 환경 적용 가능성을 높이는 핵심 차이입니다.

Q. 다중 로봇 협업이 실제로 상용화되려면 얼마나 더 걸릴까요?
A. 제조·물류 같은 구조화된 환경에서의 응용은 비교적 가까운 미래에 가능할 것으로 업계는 보고 있습니다. 반면 일반 가정처럼 비구조적이고 예외 상황이 많은 환경은 상당한 추가 개발이 필요합니다. 2분의 침실 정리 실험은 방향을 보여주지만, 모든 가정에서의 일반화는 별개의 문제입니다.

Q. 피규어 AI는 어떤 회사인가요?
A. 피규어 AI(Figure AI)는 미국의 휴머노이드 로봇 스타트업으로, 인간형 로봇 개발에 집중하고 있습니다. BMW, 마이크로소프트, 오픈AI 등으로부터 투자를 받은 것으로 알려져 있으며, 인간의 동작을 모방하는 범용 로봇 개발을 목표로 합니다.

Q. 다중 로봇이 협력할 때 안전 문제는 없나요?
A. 분산 협업 로봇의 안전은 단일 로봇보다 훨씬 복잡한 문제입니다. 각 로봇이 개별적으로 정상 작동하더라도, 협업 과정에서 창발적 오류가 발생할 수 있습니다. 이를 감지하고 개입하는 모니터링 시스템 설계가 상용화의 핵심 과제 중 하나로 꼽힙니다.