DEV Community

Cover image for GPT-5.5 가격: API, Codex, ChatGPT 비용 상세 분석 (2026년 4월)
Rihpig
Rihpig

Posted on • Originally published at apidog.com

GPT-5.5 가격: API, Codex, ChatGPT 비용 상세 분석 (2026년 4월)

OpenAI는 2026년 4월 23일 GPT-5.5 출시와 함께 GPT-5 계열의 토큰당 가격을 두 배로 인상했습니다. 입력 토큰은 백만 개당 $2.50에서 $5.00로, 출력 토큰은 백만 개당 $15.00에서 $30.00로 변경되었습니다. Pro 요금($30 / $180)은 변동이 없습니다. 실사용 비용은 세부 워크로드에 따라 달라집니다.

지금 Apidog을 사용해보세요

이 글에서는 OpenAI의 모든 요금제(API 표준, 배치, 플렉스, 우선순위), Pro 요금, Codex 플랜별 제한, 그리고 실제 워크로드별 비용 계산 절차를 구현 중심으로 안내합니다.

모델 개요는 GPT-5.5란 무엇인가, 개발자 가이드는 GPT-5.5 API 사용 방법를 참고하세요.

요약 (TL;DR)

유형 입력 / M 출력 / M
GPT-5.5 표준 API $5.00 $30.00
GPT-5.5 Pro API $30.00 $180.00
GPT-5.5 배치 (50% 할인) $2.50 $15.00
GPT-5.5 플렉스 (50% 할인) $2.50 $15.00
GPT-5.5 우선순위 (2.5배) $12.50 $75.00
GPT-5.4 표준 API $2.50 $15.00
GPT-5.4-mini API $0.25 $2.00

주요 효과: GPT-5.5는 토큰당 GPT-5.4보다 2배 비싸나, OpenAI 기준 토큰 효율성 증가로 약 20% 높은 인텔리전스 지수(Intelligence-Index)를 기대할 수 있습니다.

주요 수치

  • GPT-5.5: 입력 $5.00/M, 출력 $30.00/M
  • GPT-5.5 Pro: 입력 $30.00/M, 출력 $180.00/M
  • 컨텍스트 윈도우: 모두 1M 토큰. 추론 토큰도 포함됨.

최신 정보는 OpenAI API 가격 페이지에서 확인하세요.

배치, 플렉스 및 우선순위

배치 API

  • 배치 엔드포인트로 요청하면 표준 가격의 50%에 처리(입력 $2.50/M, 출력 $15.00/M).
  • 처리 시간: 24시간 미만.
  • 적용 예시: 데이터셋 야간 평가, 백필, 대규모 오프라인 워크로드.

플렉스 처리

  • 플렉스 역시 50% 할인. 대기 시간은 가변적(몇 초~수 분).
  • 대기 시간 허용이 가능하면서 실시간성도 필요한 워크로드에 적용.

우선순위 처리

  • 표준의 2.5배(입력 $12.50/M, 출력 $75.00/M).
  • 최대 처리량, 속도 제한 증가, 거의 제로 대기 시간.
  • 라이브 사용자 경험 등 지연이 핵심인 서비스에 최적.

사고 모드 비용 계산

  • 사고(Thinking) 모드는 reasoning.effort 값에 따라 요청당 사용하는 토큰량이 증가.
  • 승수(multiplier)는 다음과 같이 적용:
    노력 수준 출력 토큰 승수 사용 시점
    low (기본) 1배 일반 호출
    medium 1.3–2배 다단계 코딩, 구조화 생성
    high 2–4배 심층 연구, 정확성 요구
    xhigh 3–8배 에이전트 루프, 고밀도 계획

예시: xhigh 호출로 2만 추론 토큰 소모 시, 출력 토큰 비용 외 추론에만 $0.60(백만 토큰당 $30) 발생.

개별 요청 기준이 아니라 워크로드 전체 기준으로 예산을 설계하세요.

코덱스 요금

  • Codex 접근은 토큰당 요금이 아니라 ChatGPT 플랜 요금에 포함.
  • 2026년 4월 23일 기준:
    플랜 코덱스 접근 GPT-5.5 참고
    무료 예 (제한) 주간 제한
    Go 예 (제한) 무료 제한의 2배
    Plus ($20 / 월) 표준 제한
    Pro ($200 / 월) 예 + 사고 + Pro 최고 한도
    Business 시트 기반
    Enterprise / Edu 맞춤형 계약

터미널 코딩 중심 워크플로우라면 Plus/Pro 플랜이 가장 경제적입니다. 하루 수십만 토큰 이상이면 월 정액이 배치 요금보다 저렴합니다. 무료 경로 가이드 참고.

비교: GPT-5.5 vs 다른 라인업

GPT-5.5 요금 지불 시점과 GPT-5.4/5.4-mini 유지 시점은 워크로드별 출력 비중에 따라 다릅니다.

모델 입력 / M 출력 / M 출력 토큰 1천개당 비용
GPT-5.4-mini $0.25 $2.00 $0.0020
GPT-5.4 $2.50 $15.00 $0.0150
GPT-5.5 $5.00 $30.00 $0.0300
GPT-5.5 Pro $30.00 $180.00 $0.1800

의사결정 기준 예시:

  • 고볼륨/저위험(분류, 요약, 간단 채팅): GPT-5.4-mini
  • 품질 충족 일반 트래픽: GPT-5.4
  • 어려운 코딩, 다단계 에이전트, 연구 체인: GPT-5.5
  • 정확성 필수, 오류 검증 어려움: GPT-5.5 Pro

실제 예시: 코딩 에이전트 작업당 비용

GPT-5.5의 reasoning.effort: "medium" 기준 일반 에이전트 코딩 작업:

  • 입력 토큰(컨텍스트 + 프롬프트): 약 15,000
  • 출력 토큰(코드+설명): 약 3,000
  • 추론 토큰(중간 노력): 약 6,000

비용 계산 예시:

  • 입력: 15K × $5.00 / 1M = $0.075
  • 출력: (3K+6K) × $30.00 / 1M = $0.27
  • 총계: $0.345 / 작업

GPT-5.4 동일 워크로드:

  • 입력: 15K × $2.50 / 1M = $0.0375
  • 출력: 9K × $15.00 / 1M = $0.135
  • 총계: $0.1725 / 작업

GPT-5.5는 동일한 추론 노력에서 2배 비용. 단, 작업 성공률(SWE-bench 등)이 증가해 재작업 횟수가 줄면 전체 비용은 오히려 감소할 수 있습니다.

첫날부터 구축할 가치가 있는 비용 제어

비용을 효과적으로 관리하는 다섯 가지 실전 팁:

  • max_output_tokens 한도 엄수: 모든 호출에 적용. 2,000 미만으로 기본값 설정 권장.
  • 엄격한 JSON 스키마: 잘못된 출력은 재시도/재청구. 출력 검증 로직 필수.
  • 난이도별 모델 라우팅: 쉬운 요청은 mini, 어려운 요청은 5.5로 분기. 간단한 라우터 구현이 비용 절감에 효과적.
  • 오프라인 작업은 무조건 배치 사용: 평가/백필/야간보고 등은 항상 50% 할인 적용.
  • usage.reasoning_tokens 추적 및 경고: 높은 노력 수준에서 발생하는 예기치 못한 청구 방지.

아래는 기본 라우팅 예시 코드(Python):

def select_model(prompt):
    if len(prompt) < 100 or "요약" in prompt:
        return "gpt-5.4-mini"
    elif "분석" in prompt or "코드 생성" in prompt:
        return "gpt-5.5"
    else:
        return "gpt-5.4"
Enter fullscreen mode Exit fullscreen mode

플랜별 월별 예상 비용

플랜 월별 가격 가장 적합한 경우
무료 $0 코덱스 체험, 사전 검증
Go $4 / 월 가벼운 사용, 학생
Plus $20 / 월 매일 코덱스/ChatGPT 활용하는 개발자
Pro $200 / 월 사고/Pro 기능이 필요한 파워 유저
Business $25 / 시트 / 월 팀 단위, 공유 작업 공간
Enterprise / Edu 맞춤형 SLA 기반 계약

API 기준 월 4백만 출력 토큰 이상이면, Pro 플랜+Codex CLI 조합이 종량제 API 대비 더 저렴합니다(40만 컨텍스트 윈도우 내 워크로드 기준).

주목해야 할 가격 변동 신호

  • GPT-5.5 API GA 시점: 경쟁 모델(Claude Mythos, Gemini 3.5 등) 출시 시 가격 하락 가능성.
  • Pro 모델 가격 변동: 출시 후 3~6개월 내 Pro 가격 인하 사례 다수. 단, 가격 인하/고정 모두 예측 불가.

자주 묻는 질문

  • 캐싱이 입력 비용을 줄이나요? 네. 캐시된 입력 토큰은 표준 요금 일부로 청구. 재사용 가능한 프롬프트/스키마/컨텍스트는 필히 캐시. OpenAI 가격 페이지 참고.
  • 볼륨 할인이 있나요? 공식 할인 없음. 엔터프라이즈 계약은 협상 가능. 연간 7자리($1M+) 이상이면 영업팀 문의.
  • 사고(Thinking) 모드는 별도 추가 요금 있나요? 추가 요금 없음. 더 많은 토큰 사용으로 인한 비용 증가만 존재.
  • Codex CLI 사용량은 API 사용량과 별도 청구되나요? API 키 로그인 시 종량제 청구, ChatGPT 로그인 시 플랜 요금 적용.
  • 가장 저렴하게 GPT-5.5 체험하려면? 무료/Go 플랜 + Codex CLI 조합. 모든 무료 옵션은 무료 경로 가이드 참고.

Top comments (0)