Rihpig

Posted on Apr 23 • Originally published at apidog.com

Hy3 미리보기 API 무료로 사용하는 방법

텐센트가 2026년 4월 22일 Hy3 프리뷰를 오픈 소스로 공개하였고, OpenRouter는 하루 만에 이를 완전 무료 엔드포인트로 등록했습니다. 신용카드, 토큰 측정, 체험 기간 제한 없이, 지금 바로 텐센트 Yuanbao 앱과 CodeBuddy 비서에 적용된 2950억(295B) 매개변수 MoE 모델을 무료로 호출할 수 있습니다.

지금 Apidog를 체험해보세요

이 가이드는 OpenRouter, Hugging Face Space, 그리고 순수 Hy3 저장소를 활용하여 Hy3 프리뷰 API를 무료로 사용하는 실전 방법을 다룹니다. 특히 Hy3만의 추론 모드 활용법, Apidog에서 코드 없이 API를 테스트하는 구체적 방법까지 단계별로 안내합니다.

첫 응답을 가장 빠르게 얻고 싶다면 "단계별: OpenRouter에서 Hy3 프리뷰를 무료로 호출하기" 섹션으로 바로 이동하세요.

요약

Hy3 프리뷰는 OpenRouter에서 무료입니다. 모델 ID tencent/hy3-preview:free로 $0 입출력 요금으로 제공됩니다.
전문가 혼합(Mixture-of-Experts) 모델입니다: 총 2950억(295B) 매개변수, 210억(21B) 활성, 상위 8개 라우팅을 사용하는 192개 전문가, 256K 토큰 컨텍스트 창 제공.
세 가지 추론 모드 내장: 빠른 답변용 no_think, 에이전트/코딩용 low 및 high.
오픈 가중치임에도 벤치마크가 강력: SWE-bench Verified 74.4, Terminal-Bench 2.0 54.4, GPQA Diamond 87.2, MMLU 87.42.
세 가지 무료 실행 경로: OpenRouter 무료 티어, Hugging Face Hy3-preview Space, 오픈 가중치로 로컬 추론.
Hy3는 OpenAI Chat Completions 스키마를 사용하므로 Apidog에서 OpenRouter 엔드포인트를 바로 사용할 수 있습니다.

Hy3 프리뷰란 무엇인가요?

Hy3 프리뷰는 텐센트 훈위안(Hunyuan) 파운데이션 모델 팀의 첫 주력 모델입니다. 이 팀은 텐센트의 추론 스택 강화를 위해 전 OpenAI 연구원 야오 순위(Yao Shunyu)가 이끌고 있습니다. DeepSeek, Alibaba, Zhipu의 오픈 가중치 모델 출시에 대응하는, 텐센트 역사상 가장 강력한 모델입니다.

공식 모델 카드의 주요 스펙:

아키텍처: Mixture-of-Experts, 80개 레이어 + 1 MTP 레이어, 64개 grouped-query attention 헤드.
매개변수: 2950억(295B) 총, 210억(21B) 활성.
전문가: 토큰당 상위 8개 라우팅, 192개 전문가.
컨텍스트: 256K 토큰 (OpenRouter 기준 262,144개).
토크나이저: 120,832개 항목, BF16 정밀도.
라이선스: 텐센트 Hy 커뮤니티 라이선스(상업적 사용 허용).

기존 200B대 MoE와의 차별점은 에이전트 학습에 최적화된 RL 인프라입니다. SWE-bench, Terminal-Bench, WildClawBench 등에서 코드 및 셸 작업 성능은 비공개 최상위 모델에 근접합니다.

Hy3 프리뷰를 무료로 사용하는 세 가지 방법

아래 표를 참고해 목적에 맞는 경로를 선택하세요.

경로	내용	무료 여부?	적합한 경우
OpenRouter `tencent/hy3-preview:free`	호스팅된 OpenAI 호환 API	예, 입출력 $0	에이전트, 스크립트, 백엔드 기능
Hugging Face Space	브라우저 채팅 데모	예	빠른 프롬프트 테스트, 간단 검증
자체 호스팅 (vLLM/SGLang)	오픈 가중치를 직접 실행	무료(하드웨어 필요)	대량 처리, 개인 정보 보호

대부분의 개발자는 OpenRouter 경로가 가장 빠릅니다. 가입부터 API 호출까지 최소 경로이며, 무료 티어의 속도 제한도 프로토타입 제작에는 충분히 넉넉합니다.

단계별: OpenRouter에서 Hy3 프리뷰를 무료로 호출하기

아래 단계대로 진행하면 tencent/hy3-preview:free 모델을 바로 사용할 수 있습니다.

OpenRouter 계정 생성: openrouter.ai에서 이메일로 간단히 가입하세요. 무료 모델에는 결제 정보가 필요 없습니다.
API 키 생성: OpenRouter 대시보드 > "Keys"에서 새 API 키를 만들고 환경 변수로 저장하세요. 예시: export OPENROUTER_API_KEY=sk-or-...
Hy3 프리뷰 모델 페이지 확인: Hy3 프리뷰 무료 목록에서 "Free" 배너가 있는지 확인하세요. 실시간 사용 통계도 확인 가능합니다.

첫 요청 보내기: OpenRouter는 OpenAI Chat Completions와 동일한 스키마를 사용하므로, 모든 OpenAI SDK에서 바로 사용할 수 있습니다.

curl https://openrouter.ai/api/v1/chat/completions \
  -H "Authorization: Bearer $OPENROUTER_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "tencent/hy3-preview:free",
    "messages": [
      {"role": "user", "content": "Explain the MoE routing decision inside a top-8 of 192 setup in 3 sentences."}
    ],
    "temperature": 0.9,
    "top_p": 1.0
  }'

추론 모드 활용: Hy3에서는 reasoning 파라미터로 effort 값을 low 또는 high로 지정해 체인 오브 쏘트(Chain-of-Thought) 추론을 활성화할 수 있습니다. 아래는 예시입니다.

{
  "model": "tencent/hy3-preview:free",
  "messages": [
    {"role": "user", "content": "Plan, then write a Bash script that rotates daily log files older than 30 days into a dated archive folder."}
  ],
  "reasoning": {"effort": "high"}
}

반복 사용: 이전 컨텍스트를 최대한 활용하려면 동일한 스레드로 요청을 이어가세요. Hy3의 256K 창은 대부분의 코드베이스도 한 번에 처리할 수 있습니다.

이 흐름으로 바로 고품질 응답을 받을 수 있습니다. OpenRouter 무료 티어 성능은 유료 서비스와 동일하며, Hugging Face에 공개된 모델과 완전히 동일합니다.

무료, 유료, 자체 호스팅: 다른 점

기능	OpenRouter 무료	OpenRouter 유료 (비무료 엔드포인트)	자체 호스팅 (vLLM/SGLang)
토큰당 비용	$0	제공업체별	전기/하드웨어 비용
추론 모드	`no_think`, `low`, `high`	동일	동일
컨텍스트 길이	256K	256K	256K (메모리 한도 내)
처리량	공유 풀, 우선순위 하락 가능	전용	클러스터 용량만큼
속도 제한	OpenRouter 무료 티어 한도	제공업체별	없음
데이터 보존	OpenRouter 정책 적용	제공업체별	사용자 하드웨어
추론 토큰 가시성	`reasoning_details` 제공	제공	제공

무료 티어는 프로토타입, 벤치마크, 저트래픽 에이전트에 적합합니다. 고부하, 낮은 지연 시간이 필요하면 유료 혹은 자체 호스팅이 필요합니다.

Hy3를 더 잘 활용하기 위한 프롬프트 및 매개변수 팁

온도 조절: 기본값은 temperature=0.9, top_p=1.0. 구조화된 출력에는 0.3, 창의적 작업에는 0.9를 추천합니다.
일상 채팅: no_think 모드를 사용하세요. 계획, 다단계 코드, 수학 문제에만 low/high를 사용하세요.
시스템 프롬프트에 도구 이름 명시: Hy3는 hy_v3 파서로 도구 호출에 특화되어 훈련되었습니다. 시스템 프롬프트에 각 도구의 역할을 명확히 적으세요.
코드 요약 대신 전체 붙여넣기: 256K 컨텍스트로 전체 파일을 붙여넣고, 그 위에서 질문하세요.
여러 파일 일괄 편집: 여러 파일을 한 메시지에서 처리하면 SWE-bench 점수처럼 일관된 편집이 가능합니다.
에이전트 작업은 두 단계로: "계획 초안 → 확인 후 실행" 패턴이 원샷 프롬프트보다 결과가 더 일관됩니다.

배포 전 알아두어야 할 제한 사항

무료 티어 속도 제한은 로드에 따라 유동적입니다. 피크 시 429 오류 발생 가능. 지수 백오프로 재시도 로직을 구현하세요.
reasoning_details는 무료 티어에서는 무료, 유료 경로에서는 토큰으로 청구됩니다. effort: "high"를 무분별하게 남용하지 마세요.
Hy 커뮤니티 라이선스는 Apache 2.0이 아닙니다. 전체 라이선스를 반드시 확인하세요.
도구 호출은 올바른 파서가 필요합니다. vLLM/SGLang에서 --tool-call-parser hy_v3 (SGLang: hunyuan)을 반드시 지정하세요.
중국어, 영어에 최적화되어 있습니다. 기타 언어는 지원되나 품질이 다소 떨어질 수 있습니다.
일부 추론 벤치마크에서는 미국 빅테크 주력 모델에 뒤처집니다. 고난도 추론이 핵심이면 참고하세요.

개발자 고속 경로: Hy3 프리뷰 + Apidog

실제 반복 작업에서는 시각적 API 클라이언트가 생산성을 높입니다. Apidog를 활용해 Hy3 프리뷰를 빠르게 테스트하세요.

Apidog에서 새 프로젝트 생성 후, OpenAI Chat Completions OpenAPI 스펙을 가져옵니다. OpenRouter도 동일 스키마로 동작합니다.
기본 URL을 https://openrouter.ai/api/v1로, OPENROUTER_API_KEY를 환경 변수로 추가합니다.
/chat/completions 엔드포인트에 tencent/hy3-preview:free 모델을 지정한 요청을 생성하세요.
다양한 추론 모드 비교를 위해 요청을 포크(복제)하여 no_think, low, high를 각각 테스트하세요.
프롬프트 템플릿을 저장하면, 에이전트 프롬프트/도구 스키마/사용자 입력을 환경별로 재사용할 수 있습니다.

Postman에서 마이그레이션하려면 2026년 Postman 없는 API 테스트 가이드를 참고하세요. VS Code 내에서 Apidog 워크플로우를 쓰고 싶다면 VS Code 내 Apidog 활용법을 확인하세요.

한도에 도달했을 때의 무료 대안

Hugging Face Space: Hy3-preview Space는 브라우저 채팅 데모로 무료 사용 가능합니다.
다른 무료 중국 오픈 가중치 모델: Alibaba의 Qwen 3.5 Omni는 강력한 멀티모달 출력과 무료 티어를 제공합니다. Qwen 3.5 Omni 발표, 사용 가이드 참고. Zhipu GLM 5V Turbo도 무료 티어 제공: GLM 5V Turbo API 가이드 참고.

이 대안들은 Hy3의 SWE-bench/Terminal-Bench 성능을 따라가진 못하지만, 다국어/멀티모달/채팅 등 다양한 무료 실험에 적합합니다. 프로덕션 벤치마크는 Apidog를 다운로드해 모델별로 컬렉션을 만들어 병렬 테스트하는 것이 가장 빠릅니다.

vLLM으로 Hy3 프리뷰 자체 호스팅

로컬 GPU가 있다면 vLLM으로 직접 호스팅도 가능합니다. vLLM 명령어 예시:

vllm serve tencent/Hy3-preview \
  --tensor-parallel-size 8 \
  --speculative-config.method mtp \
  --speculative-config.num_speculative_tokens 1 \
  --tool-call-parser hy_v3 \
  --reasoning-parser hy_v3 \
  --enable-auto-tool-choice \
  --served-model-name hy3-preview

SGLang에서는 --tool-call-parser hunyuan 및 --reasoning-parser hunyuan을 사용하세요.
서버가 http://localhost:8000/v1에서 구동되면, OpenAI SDK에서 기본 URL/키만 바꿔 바로 연동할 수 있습니다. 공식 가중치는 BF16에서 H100급 GPU 8개가 필요합니다. 양자화 버전은 커뮤니티에서 곧 등장할 예정입니다.

자주 묻는 질문

Hy3 프리뷰는 무료인가요?
예. OpenRouter에서 tencent/hy3-preview:free를 입출력 $0로 제공합니다. 추론 토큰도 무료이나, 속도 제한이 있습니다. 실시간 상태를 체크하세요.

Hy3 프리뷰는 DeepSeek V3, Qwen 3과 비교해 어떤가요?
Hy3의 SWE-bench Verified(74.4), Terminal-Bench 2.0(54.4)은 중국 오픈 모델 중 최상위권입니다. 에이전트/도구 사용에서 특히 강점이 있습니다. 채팅 성능은 Qwen 3, DeepSeek V3도 경쟁력 있습니다.

Hy3의 추론 모드는?
no_think (기본값), low, high 세 가지가 있습니다. OpenRouter의 reasoning 파라미터나, 직접 호출 시 chat_template_kwargs={"reasoning_effort": "high"}로 지정할 수 있습니다.

상업적 사용이 가능한가요?
예, 텐센트 Hy 커뮤니티 라이선스에 따라 상업적 사용이 가능합니다. 단, 귀속 및 정책 준수 필수. 전체 약관을 꼭 읽어보세요.

무료 티어 컨텍스트 길이는?
256K 토큰 지원. OpenRouter는 262,144 토큰을 안내합니다. 중간 규모 코드베이스도 충분히 넣을 수 있습니다.

코딩 없이 Hy3 프리뷰 테스트 방법은?
브라우저는 Hugging Face Space, API 클라이언트는 Apidog를 활용하세요. OpenAPI 스키마, URL, 키, 모델 이름만 입력하면 바로 테스트 가능합니다.

DEV Community