피규어 AI가 '말'을 빼고, '눈치'만 남겼다 — 그런데 그게 왜 더 무섭냐면
로봇 두 대가 2분 만에 침실을 정리했다. 지시는 없었다. 대화도 없었다. 그런데 서로 부딪히지 않았다.
TL;DR: 피규어 AI의 휴머노이드 두 대가 명시적 지시 없이 '눈치'만으로 침실 정리를 2분 내에 완료했다. 이것이 단순한 로봇 기술의 시연이 아닌 이유는, 이 협업 방식이 인간이 AI를 통제하는 방식 자체를 바꾸는 출발점이기 때문이다. 명령어 없는 협업의 시대가 열렸을 때, '지시'라는 인간의 특권은 어디로 가는가.
로봇 업계에는 잘 알려지지 않은 규칙이 하나 있다.
로봇이 복잡해질수록, 인간이 내려야 하는 명령도 복잡해진다는 것이다. 산업용 로봇 팔 하나를 정밀하게 움직이려면 수십 개의 파라미터를 설정해야 한다. 창고 자동화 시스템을 구축한 기업들은 로봇이 더 스마트해질수록 관리 인력이 오히려 늘어난다는 역설을 조용히 경험하고 있다. 보스턴 다이내믹스의 아틀라스는 화려한 점프와 공중제비를 선보이지만, 그 뒤편에서 동작 하나하나를 설계하는 엔지니어 팀은 여전히 바쁘다.
그런데 피규어 AI가 2026년 5월에 공개한 영상은 그 규칙을 조용히 깨버렸다.
로봇 두 대. 명시적 지시 없음. 2분. 정리된 침실.
먼저, 왜 '2분'이 아니라 '눈치'가 핵심인가
언론은 이 사건을 "2분 만에 침실 정리"라는 속도의 문제로 보도했다. 그러나 이 이야기에서 진짜 중요한 숫자는 2가 아니다. 0이다.
인간의 개입이 0이었다는 것.
로봇 한 대가 침실을 정리하는 것은 이미 여러 팀이 시연했다. 사전에 설계된 경로, 정해진 물건 위치, 스크립트화된 동작 순서 — 이런 전제 아래 로봇은 꽤 오래전부터 물건을 집고 옮길 수 있었다. 그러나 두 대가 함께 같은 공간에 들어갔을 때 문제는 완전히 달라진다. 서로의 동선이 겹친다. 같은 물건을 동시에 집으려 한다. 한 대가 이동하는 순간, 다른 한 대의 경로 계산이 틀어진다.
이것이 로봇 협업의 오래된 숙제였다. 해결책은 보통 두 가지였다. 첫 번째는 중앙 컨트롤러가 두 로봇 모두에게 명령을 분배하는 방식 — 사실상 로봇이 스스로 협력하는 게 아니라, 위에서 내려오는 지시를 각자 수행하는 것이다. 두 번째는 물리적 분리 — 한 대는 왼쪽, 다른 한 대는 오른쪽이라는 식으로 애초에 겹치지 않게 구역을 나눠버리는 것이다. 영리하지 않다. 유연하지도 않다.
피규어 AI가 시연한 것은 세 번째 방식이다. 두 로봇이 서로를 관찰하고, 상대의 다음 행동을 예측하고, 자신의 행동을 실시간으로 조정했다. 지시가 없었다는 것은, 이 협력이 '설계된 협력'이 아니라 '즉흥적 협력'이었다는 뜻이다. 인간이 팀을 이뤄 일할 때 하는 바로 그것 — 눈치 — 를 두 기계가 해낸 것이다.
'눈치'를 기계에 넣는 게 얼마나 어려운 일인가
눈치는 인간이 사회적 진화를 거쳐 발달시킨 고도의 인지 능력이다. 상대의 의도를 언어 없이 파악하고, 자신의 행동을 그에 맞게 수정하는 것. 한국어에 '눈치'라는 단어가 존재한다는 것 자체가 이 능력이 얼마나 문화적으로 중요하게 여겨졌는지를 보여준다.
기계에게 눈치를 가르치려는 시도는 오래됐다. 멀티 에이전트 시스템이라는 분야 전체가 이 문제를 수십 년째 붙잡고 있다. 게임 이론, 강화학습, 분산 알고리즘 — 수많은 도구가 동원됐다. 그러나 결과는 항상 비슷했다. 통제된 환경, 단순한 규칙, 제한된 변수 안에서만 작동했다.
침실은 통제된 환경이 아니다. 침대, 베개, 옷, 책, 충전기, 이름 모를 잡동사니들 — 이 모든 것이 불규칙하게 놓여 있다. 어떤 물건이 어디 있어야 하는지 로봇에게 미리 알려준 것도 아니다. 물건의 '제자리'를 판단하는 것 자체가 이미 컨텍스트 이해의 문제다.
그 환경에서 두 대가 2분 안에 작업을 완료했다면, 이것은 단순한 모터 제어나 경로 계획의 문제가 아니다. 각 로봇이 상황을 이해하고, 상대의 상태를 인식하고, 우선순위를 스스로 정하고, 충돌 없이 행동을 완료했다는 뜻이다. 이 모든 것이 명시적 지시 없이.
거인들은 이 문제를 어떻게 풀어왔나
보스턴 다이내믹스는 오랫동안 단독 로봇의 완성도에 집중했다. 스팟, 아틀라스 — 이 로봇들은 혼자서 놀라운 일을 해낸다. 그러나 여러 대가 함께 복잡한 작업을 수행하는 시연은 아직 제한적이다. 협업보다는 개별 퍼포먼스에 방점이 찍혀 있다.
테슬라의 옵티머스는 테슬라 공장 내부에서 제한된 작업을 수행하는 영상을 공개해왔다. 일론 머스크는 수백만 대의 옵티머스가 공장과 가정에서 일하는 미래를 이야기하지만, 아직 공개된 것은 통제된 환경 안의 단독 작업이 대부분이다. 협업, 특히 비지시적 협업에 대한 시연은 찾기 어렵다.
아마존은 물류 창고에서 수천 대의 로봇을 운용한다. 그러나 이 시스템은 눈치로 작동하지 않는다. 중앙 시스템이 각 로봇의 위치를 실시간으로 파악하고, 경로를 계산하고, 충돌을 방지한다. 로봇들은 서로를 인식하지 않는다. 그저 위에서 내려오는 명령을 수행할 뿐이다. 규모는 인상적이지만, 각 로봇은 여전히 '개별 실행자'다.
피규어 AI가 시연한 것이 다른 이유는 여기에 있다. 중앙 컨트롤러 없이, 두 로봇이 서로를 인식하며 작업을 나눴다. 작은 회사가 거인들이 아직 보여주지 못한 방식으로 문제를 풀었다.
그런데 이 실험이 가진 한계를 말해야 한다
이 시연이 가진 한계를 분명히 짚어야 한다.
침실 정리라는 작업은 상대적으로 낮은 정밀도를 요구한다. 물건을 대략적인 위치에 놓는 것으로 '정리됨'의 기준을 충족할 수 있다. 외과 수술이나 반도체 조립처럼 밀리미터 단위의 정확성이 요구되는 작업에서 이 눈치 기반 협업이 같은 수준으로 작동할지는 아직 알 수 없다.
또한 이 시연은 피규어 AI가 설계한 환경에서 이루어졌다. 완전히 낯선 공간, 완전히 예측 불가능한 변수들 앞에서 같은 성능이 나올지는 독립적인 검증이 필요하다. 회사가 공개하는 시연 영상은 언제나 최선의 조건에서 최선의 결과를 보여준다. 실제 배포 환경은 늘 더 복잡하고 더 지저분하다.
그리고 이것은 특정 조건에서의 시연 결과이지, 양산 가능하고 안정적으로 반복 가능한 기술이라는 뜻은 아직 아니다. 이 점을 흐릿하게 두고 넘어가는 것은 공정하지 않다.
'비지시적 협업'이 열어놓는 질문
그럼에도 이 시연이 중요한 이유는, 기술의 완성도 때문이 아니라 그것이 제기하는 질문 때문이다.
지금까지 AI와 로봇을 다루는 인간의 역할은 명확했다. 지시하는 자. 목표를 설정하고, 경로를 정의하고, 예외를 처리하는 자. 기계는 그 지시를 받아 실행하는 존재였다. 이 관계가 흔들리기 시작하면, 인간의 역할은 어디로 이동하는가.
에이전트 코딩의 세계에서도 비슷한 질문이 나오고 있다. 그렉 브록먼이 최근 언급한 것처럼, 개발 프로세스에서 에이전트가 차지하는 비중이 80%에 달한다는 보고는 단순히 효율의 문제가 아니다. 코드를 쓰는 행위가 더 이상 개발자의 전유물이 아니게 됐을 때, '개발자'라는 역할의 본질이 지시에서 감독으로 이동한다는 뜻이다.
피규어 AI의 침실 정리 로봇도 같은 방향을 가리킨다. 로봇이 지시 없이 협업할 수 있게 되면, 인간의 역할은 '무엇을 하라'에서 '무엇을 하지 말라'로 이동할 수 있다. 목표를 설정하고 결과를 평가하는 것. 경계를 그리고 가치를 판단하는 것. 이것은 더 고차원적인 역할이기도 하지만, 동시에 더 추상적이고 더 불안한 역할이기도 하다.
'눈치'가 두 대에서 열 대가 되면 어떤 세계인가
지금 피규어 AI가 시연한 것은 두 대다. 그런데 이 기술의 논리적 확장을 생각해보면 숫자가 달라진다.
두 대의 로봇이 지시 없이 방 하나를 정리할 수 있다면, 다섯 대는 아파트 한 채를 정리할 수 있다. 열 대는 사무실을, 백 대는 공장을 정리할 수 있다. 그리고 이 수백 대의 로봇이 여전히 지시 없이, 서로의 눈치를 보며 작업을 나누고 완료할 수 있다면, 이것은 더 이상 로봇 공학의 이야기가 아니다. 조직의 이야기다.
인간 조직이 수십 년간 풀지 못한 문제가 있다. 규모가 커질수록 소통이 느려지고, 지시가 왜곡되고, 조율 비용이 증가한다는 것. 이것이 관료제의 기원이고, 프로젝트 관리 방법론이 끊임없이 진화하는 이유다. 그런데 눈치로 협업하는 로봇 군집이 이 문제를 다른 방식으로 우회할 수 있다면, 이것은 조직 이론 교과서를 다시 쓰는 수준의 이야기가 된다.
물론 지금 당장은 과장이다. 두 대의 침실 정리에서 수백 대의 공장 운영까지는 기술적으로 엄청난 거리가 있다. 그러나 방향은 분명히 그쪽이다.
피규어 AI라는 회사에 대해 알아야 할 것
피규어 AI는 2022년에 설립된 회사다. 창업자 브렛 애드콕은 이전에 노동자 파견 플랫폼 베스티지(Vettery)를 아데코에 매각했고, 그 다음에는 에어 택시 스타트업 아처(Archer Aviation)를 설립했다. 로봇 공학 전문가가 아닌 연쇄 창업자가 휴머노이드 로봇이라는 극도로 기술 집약적인 분야에 뛰어든 것이다.
이 배경이 오히려 피규어 AI의 접근 방식을 설명해준다. 기술의 완성도보다 시장 투입 시점을 먼저 생각하는 스타트업 논리. '완벽한 로봇을 만들고 나서 팔겠다'가 아니라, '팔 수 있는 수준의 로봇을 빠르게 만들고, 현장 피드백으로 개선하겠다'는 방식. 이것은 기존 로봇 기업들, 특히 수십 년의 연구 역사를 가진 보스턴 다이내믹스나 혼다 ASIMO 계보와는 근본적으로 다른 DNA다.
거인들이 완성도를 향해 천천히 가는 동안, 작은 회사가 완성되지 않은 것을 들고 시장에 먼저 나타나는 것 — 이것이 AI 업계 전반에서 반복되는 패턴이다. 오픈AI가 그랬고, 앤트로픽이 그랬다. 그리고 지금 피규어 AI가 그 패턴을 로봇 분야에서 재현하고 있다.
이 시연이 비드래프트가 주목하는 이유
비드래프트는 Pre-AGI 연구를 핵심으로 삼는 스타트업이다. 그 관점에서 피규어 AI의 침실 정리 시연은 흥미롭다.
AGI에 가장 가까운 지능의 특징 중 하나는 '명시적 지시 없이 맥락을 파악하고 행동하는 능력'이다. 언어 모델이 이 방향으로 진화해왔다면, 로봇도 같은 방향으로 진화하고 있다. 두 흐름이 만나는 지점 — 맥락을 이해하는 AI 두뇌와, 물리적으로 행동할 수 있는 몸체가 결합하는 지점 — 에서 우리가 '에이전트'라고 부르는 존재의 의미가 완전히 달라질 것이다.
지금 에이전트 코딩에서 일어나는 일과 피규어 AI의 침실 정리에서 일어나는 일은 같은 이야기의 두 버전이다. 하나는 디지털 공간에서, 하나는 물리적 공간에서 — 지시에 의존하던 기계가 눈치를 배우기 시작했다.
지시가 사라진 자리에 무엇이 남는가.
피규어 AI가 공개한 2분짜리 영상에서 가장 긴 침묵은, 두 로봇이 아무 말 없이 서로를 피해가는 그 순간이었다. 로봇 두 대가 눈치로 방을 정리한 이야기치고는, 꽤 불편한 질문을 남기는 시연이었다.
더 많은 AI 인사이트는 비드래프트에서 확인하세요.
자주 묻는 질문
Q. 피규어 AI의 로봇이 '눈치'로 협업한다는 게 정확히 어떤 의미인가요?
A. 두 로봇이 중앙 컨트롤러의 명령 없이, 서로의 위치와 동작을 실시간으로 인식하며 스스로 역할을 나누고 충돌 없이 작업을 완료했다는 것을 의미합니다. 사람이 팀으로 일할 때처럼 말 없이 상대의 다음 행동을 예측하고 자신의 행동을 조정하는 방식입니다.
Q. 이 기술이 실용화되기까지 어떤 과제가 남아 있나요?
A. 시연은 피규어 AI가 설계한 통제 환경에서 이루어졌습니다. 완전히 낯선 공간, 예측 불가능한 변수, 높은 정밀도가 요구되는 작업에서도 같은 성능이 나오는지는 독립적인 검증이 필요합니다. 또한 두 대에서 수십 대로 규모를 확장했을 때 협업의 안정성이 유지되는지도 아직 확인되지 않았습니다.
Q. 피규어 AI는 어떤 회사인가요?
A. 2022년 연쇄 창업자 브렛 애드콕이 설립한 휴머노이드 로봇 스타트업입니다. 로봇 공학 전문가 출신이 아닌 창업자가 이끌며, 기술 완성도보다 시장 투입 속도를 우선하는 스타트업 방식으로 기존 로봇 기업들과 다른 접근을 취하고 있습니다.
Q. 이것이 AGI 연구와 어떤 관련이 있나요?
A. '명시적 지시 없이 맥락을 이해하고 행동하는 능력'은 AGI의 핵심 특징 중 하나로 꼽힙니다. 언어 모델이 디지털 공간에서 이 방향으로 진화해온 것처럼, 로봇도 물리적 공간에서 같은 방향으로 진화하고 있습니다. 두 흐름이 결합하는 지점에서 '에이전트'의 의미가 근본적으로 달라질 것이라는 전망이 나오고 있습니다.
Top comments (0)