Rihpig

Posted on Apr 2 • Originally published at apidog.com

Holo3: 최고의 컴퓨터 사용 모델?

요약 (TL;DR)

2026년 3월 31일, H Company는 Holo3를 출시했습니다. Holo3는 전문가 혼합(mixture-of-experts) 모델로, 선도적인 데스크톱 컴퓨터 사용 벤치마크인 OSWorld-Verified에서 역대 최고 점수인 78.85%를 기록했습니다. 이 모델은 GPT-5.4와 Opus 4.6을 훨씬 저렴한 비용으로 능가합니다. API는 현재 활성화되어 있으며, 35B 변형 모델은 Apache 2.0 라이선스 하에 HuggingFace에서 공개 가중치로 제공됩니다.

Apidog를 지금 체험해보세요

대부분의 개발자가 해결하지 못한 컴퓨터 사용 격차

API 자동화와 CI/CD 파이프라인을 구축해도, 아직 API가 없는 레거시 엔터프라이즈 소프트웨어, REST 이전의 데스크톱 앱, 그리고 여러 UI를 넘나드는 복잡한 워크플로우는 자동화가 어렵습니다.

기존 RPA 도구(UiPath, Automation Anywhere)는 UI 변경에 매우 취약한 화면 좌표 스크립트에 의존하며, 결국 수동 작업으로 돌아가는 경우가 많습니다.

컴퓨터 사용 AI는 이 한계를 극복합니다. 스크린샷을 기반으로 클릭, 입력, 스크롤 등 액션을 지시할 수 있어 API가 없는 GUI 환경도 자동화할 수 있습니다. 2026년 3월, H Company가 공개한 Holo3는 이 영역에서 가장 강력한 공개 모델입니다.

💡 데스크톱 소프트웨어 자동화 워크플로우나 테스트 파이프라인을 구축 중이라면, Holo3 API 구조를 파악하는 것이 중요합니다. Apidog와 함께라면 API 설계/테스트 후 Holo3 호출을 워크플로우에 쉽게 연결할 수 있습니다.

Holo3란 무엇인가요?

Holo3는 컴퓨터 사용 모델입니다. 데스크톱 또는 브라우저의 스크린샷과 작업 지시를 입력하면, 해당 화면에서 실행할 액션(클릭, 입력, 스크롤 등)을 응답합니다. 결과를 받아 반복적으로 실행하며, 최종적으로 작업을 완료합니다.

H Company는 두 가지 변형 모델을 제공합니다:

Holo3-122B-A10B — 122B 파라미터, 10B 활성. API 전용으로 제공되며, 벤치마크 최고 성능을 기록했습니다.
Holo3-35B-A3B — 35B 파라미터, 3B 활성. Apache 2.0 라이선스로 공개 가중치 제공, 무료 등급 API 지원, 자체 호스팅 가능.

MoE(전문가 혼합) 아키텍처는 토큰당 일부 파라미터만 활성화해, 실행 비용을 크게 줄입니다. H Company는 Holo3-122B-A10B가 GPT-5.4 및 Opus 4.6 대비 작업당 비용이 더 낮다고 밝히고 있습니다.

OSWorld-Verified: 벤치마크가 실제로 측정하는 것

OSWorld-Verified는 AI 컴퓨터 사용 평가를 위한 업계 표준 벤치마크입니다. 단순 출력 평가가 아니라, 실제 컴퓨터에서 작업을 실행하여 결과를 검증합니다.

벤치마크 작업 예시:

단일 앱 작업 (파일 열기, 양식 작성 등)
교차 앱 워크플로우 (PDF 값 추출 후 이메일 전송 등)
여러 시스템을 오가며 컨텍스트를 유지하는 장기 시퀀스

Holo3-122B-A10B는 OSWorld-Verified에서 78.85%의 기록을 세웠습니다. 참고로 기존 SOTA 모델(Anthropic, OpenAI)은 60~65%대였습니다.

특히 다중 앱 작업 등 복잡한 시나리오에서 Holo3가 기존 모델 대비 높은 정확도를 보입니다.

Holo3 훈련 방식: 에이전틱 학습 플라이휠

대부분의 컴퓨터 사용 모델은 정적인 시연 데이터로 훈련됩니다. H Company는 에이전틱 학습 플라이휠이라는 연속 훈련 루프를 도입했습니다:

합성 내비게이션 데이터: 사람이 지시한 시나리오 예제로 데이터 생성
도메인 외 증강: UI 엣지 케이스, 비정상 상태 등 데이터 다양성 증대
큐레이션된 강화학습: RL 파이프라인에서 직접 작업 완료율을 극대화하는 데이터만 필터링 사용

훈련 데이터는 합성 환경 팩토리에서 생성됩니다. 이 환경은 에이전트가 실제 비즈니스 워크플로우를 경험할 수 있도록 시나리오별 웹앱/엔터프라이즈 앱을 자동 생성합니다.

이 방식 덕분에 Holo3는 같은 파라미터 규모의 다른 모델(Qwen3.5 등)보다 실제 작업에서 더 뛰어난 성능을 보입니다.

Holo3 API 호출 방법

Holo3 API는 "스크린샷 → 액션 → 반복" 패턴을 따릅니다. 실제 연동을 위한 절차는 다음과 같습니다.

1. 인증 설정

# H Company Inference API base URL
https://api.hcompany.ai/v1

# Header
Authorization: Bearer YOUR_API_KEY
Content-Type: application/json

API 키 발급 후, 무료 등급으로 Holo3-35B-A3B 사용 가능.

2. 작업과 함께 스크린샷 전송

import base64
import httpx
import pyautogui

# 스크린샷 캡처
screenshot = pyautogui.screenshot()
screenshot.save("/tmp/screen.png")

with open("/tmp/screen.png", "rb") as f:
    image_b64 = base64.b64encode(f.read()).decode()

response = httpx.post(
    "https://api.hcompany.ai/v1/computer-use",
    headers={"Authorization": "Bearer YOUR_API_KEY"},
    json={
        "model": "holo3-122b-a10b",
        "task": "Open the invoice folder and find the most recent PDF",
        "screenshot": image_b64,
        "screen_width": 1920,
        "screen_height": 1080
    }
)

action = response.json()
print(action)

3. 액션 파싱 및 실행

API는 다음과 같이 구조화된 액션을 반환합니다.

{
  "action_type": "click",
  "coordinate": [245, 380],
  "reasoning": "The invoice folder icon is visible at this position"
}

지원 액션: click, double_click, right_click, type, key, scroll, screenshot_request, task_complete 등.

4. 완료될 때까지 반복

def run_computer_use_task(task: str, max_steps: int = 20):
    for step in range(max_steps):
        screenshot = capture_screen()
        response = call_holo3_api(task, screenshot)
        action = response["action"]

        if action["action_type"] == "task_complete":
            print(f"Done in {step + 1} steps")
            return response["result"]

        execute_action(action)

    raise TimeoutError("Task not completed within step limit")

Apidog로 Holo3 API 호출 테스트하기

Holo3 API 통합 후, 프로덕션 자동화를 위해 반드시 안정성을 검증해야 합니다. Apidog는 이런 테스트에 최적화되어 있습니다.

엔드포인트 추가:

Apidog에서 https://api.hcompany.ai/v1/computer-use를 HTTP 요청으로 생성, API 키는 환경 변수로 관리하세요.

요청 유효성 검사:

Apidog의 테스트 어설션(assertions) 기능을 활용하면 응답 구조를 자동 검증할 수 있습니다.

// Apidog post-response script 예시
pm.test("Action type is valid", () => {
    const validActions = ["click", "type", "key", "scroll", "task_complete", "screenshot_request"];
    pm.expect(validActions).to.include(pm.response.json().action.action_type);
});

pm.test("Coordinates are within screen bounds", () => {
    const action = pm.response.json().action;
    if (action.coordinate) {
        pm.expect(action.coordinate[0]).to.be.within(0, 1920);
        pm.expect(action.coordinate[1]).to.be.within(0, 1080);
    }
});

API 목(Mock) 사용:

Apidog의 Smart Mock을 통해 실제 API 호출 없이 현실적인 Holo3 응답을 생성해, 통합 테스트나 프론트엔드 개발을 병렬로 진행할 수 있습니다.

테스트 시나리오 작성:

여러 Holo3 요청을 연결해 복잡한 멀티스텝 작업 루프를 시뮬레이션, 실제 배포 전에 시퀀스의 일관성과 안정성을 검증하세요.

Holo3 vs Claude Computer Use vs OpenAI Operator 비교

	Holo3-122B	Holo3-35B	Claude Computer Use	OpenAI Operator
OSWorld-Verified	78.85%	~55% (예상)	~65%	~62%
API 접근	예	예 (무료 등급)	예	예
공개 가중치	아니요	예 (Apache 2.0)	아니요	아니요
자체 호스팅	아니요	예	아니요	아니요
GPT-5.4 대비 비용	더 낮음	훨씬 낮음	비슷함	GPT-5.4 가격
적합 용도	프로덕션 엔터프라이즈	개발/테스트/오픈소스	Anthropic 생태계	OpenAI 생태계

실무 선택 팁:

Holo3-122B: 복잡 다중 앱 워크플로우, 높은 신뢰성/정확성 필요 시
Holo3-35B: 개발·테스트·오픈소스·자체 호스팅 필요 시
Claude Computer Use: Anthropic API 중심 스택
OpenAI Operator: GPT-5.4 및 OpenAI 단일 공급망 선호 시

엔터프라이즈 사용 사례

Holo3는 API 기반 자동화가 불가한 워크플로우도 지원합니다.

레거시 시스템 데이터 입력: REST API 없는 2000년대 ERP/CRM UI에 데이터 입출력 자동화
교차 플랫폼 조정: PDF→스프레드시트→대시보드 등 복수 앱 시퀀스 자동화
웹앱 회귀 테스트: 취약한 셀레늄 스크립트 대신 Holo3로 자연어 기반 테스트 자동화
경쟁 정보 분석: 스크래핑 방지 웹사이트에서 구조적 데이터 추출

H Company 벤치마크에 따르면, Holo3는 전자상거래/비즈니스/협업/다중 앱 등 다양한 엔터프라이즈 시나리오에서 강력한 성능을 보입니다. 특히 다중 앱 워크플로우에서 경쟁 대비 확실한 우위를 입증했습니다.

다음 단계: 적응형 에이전시

H Company는 적응형 에이전시(Adaptive Agency)라는 차세대 방향성을 명확히 제시하고 있습니다. 이는 기존에 본 적 없는 맞춤형 엔터프라이즈 소프트웨어를 실시간으로 탐색·학습해 작업을 수행하는 모델입니다.

현재의 모델들은 제한된 환경에서만 훈련되어, 미지의 내부 툴에서는 성공률이 낮습니다. 적응형 에이전시는 초회 접촉 시 소프트웨어 구조를 추론하고, 사전 학습 없이 업무를 실행하는 것을 목표로 합니다.

이 단계가 구현된다면, 엔터프라이즈 컴퓨터 사용 AI의 마지막 한계가 제거될 것입니다.

결론

Holo3는 데스크톱 컴퓨터 사용 자동화에서 새로운 기준을 세웠습니다. OSWorld-Verified 78.85%라는 압도적 성능, 복잡한 다중 앱 루프에서의 안정성, 그리고 Holo3-35B-A3B의 무료·오픈소스 가중치 제공으로 개발자 접근성도 높아졌습니다.

통합 패턴은 단순합니다: 스크린샷 → POST 요청 → 액션 실행 → 반복. Apidog는 응답 검증, 목(mock) 데이터, 통합 테스트 시나리오 등 실제 배포 전 신뢰성을 높일 수 있는 모든 기능을 제공합니다.

데스크톱 GUI 자동화가 필요하다면, Apidog를 무료로 사용해보고 Holo3 연동을 사전에 검증해보세요.

자주 묻는 질문 (FAQ)

Holo3는 무엇인가요?

Holo3는 H Company의 컴퓨터 사용 AI 모델로, 스크린샷을 입력으로 받아 데스크톱 또는 브라우저에서 작업을 완료하기 위한 액션(클릭, 키 입력, 스크롤)을 반환합니다. OSWorld-Verified 벤치마크에서 78.85%를 기록하며, 해당 분야 최고 점수입니다.

Holo3는 오픈 소스인가요?

Holo3-35B-A3B는 Apache 2.0 라이선스로 HuggingFace에서 공개 가중치 제공, 자체 호스팅이 가능합니다. 122B 모델은 API 전용입니다. 두 모델 모두 API 무료 등급으로 사용 가능합니다.

OSWorld 벤치마크는 어떻게 작동하나요?

OSWorld는 AI가 실제 컴퓨터에서 웹 내비게이션, 파일 관리, 교차 앱 워크플로우 등 실제 작업을 수행하도록 테스트합니다. 성공 여부는 작업 후 시스템 상태로 검증하며, 단순 출력 평가가 아닙니다.

Holo3와 Claude Computer Use의 차이는?

Holo3-122B는 OSWorld-Verified에서 78.85%로 Claude Computer Use(약 65%) 대비 높으며, 작업당 비용도 더 저렴합니다. Anthropic API 기반 팀에는 Claude도 강력한 선택지입니다.

Holo3를 로컬에서 실행할 수 있나요?

네. Holo3-35B-A3B는 Apache 2.0 라이선스 가중치로 HuggingFace에서 다운로드 후 자체 호스팅이 가능합니다. 122B 모델은 API만 지원합니다.

컴퓨터 사용 API의 주요 활용 사례는?

레거시 시스템 자동화, 교차 앱 데이터 워크플로우, 일반 언어 기반 웹앱 회귀 테스트, 경쟁 정보 스크래핑 등 사람이 수동 처리하던 데스크톱 작업 대체가 가능합니다.

Holo3 API 통합 테스트 방법은?

Apidog에서 엔드포인트를 등록하고, 응답 어설션을 설정하고, 개발 중엔 API 목(mock) 기능을 활용하세요. 여러 요청을 시나리오로 연결해 실제 배포 전 통합 오류를 사전에 발견할 수 있습니다.

Holo3 로드맵의 "적응형 에이전시"란?

H Company는 미지의 엔터프라이즈 소프트웨어를 실시간 탐색·학습해, 사전 훈련 데이터 없이 UI 구조를 이해하고 작업을 실행하는 모델 개발에 집중하고 있습니다. 이는 맞춤형 엔터프라이즈 배포의 마지막 한계를 제거할 것입니다.

DEV Community