OpenAI는 2026년 4월 23일 GPT-5.5 출시와 함께 GPT-5 계열의 토큰당 가격을 두 배로 인상했습니다. 입력 토큰은 백만 개당 $2.50에서 $5.00로, 출력 토큰은 백만 개당 $15.00에서 $30.00로 변경되었습니다. Pro 요금($30 / $180)은 변동이 없습니다. 실사용 비용은 세부 워크로드에 따라 달라집니다.
이 글에서는 OpenAI의 모든 요금제(API 표준, 배치, 플렉스, 우선순위), Pro 요금, Codex 플랜별 제한, 그리고 실제 워크로드별 비용 계산 절차를 구현 중심으로 안내합니다.
모델 개요는 GPT-5.5란 무엇인가, 개발자 가이드는 GPT-5.5 API 사용 방법를 참고하세요.
요약 (TL;DR)
| 유형 | 입력 / M | 출력 / M |
|---|---|---|
| GPT-5.5 표준 API | $5.00 | $30.00 |
| GPT-5.5 Pro API | $30.00 | $180.00 |
| GPT-5.5 배치 (50% 할인) | $2.50 | $15.00 |
| GPT-5.5 플렉스 (50% 할인) | $2.50 | $15.00 |
| GPT-5.5 우선순위 (2.5배) | $12.50 | $75.00 |
| GPT-5.4 표준 API | $2.50 | $15.00 |
| GPT-5.4-mini API | $0.25 | $2.00 |
주요 효과: GPT-5.5는 토큰당 GPT-5.4보다 2배 비싸나, OpenAI 기준 토큰 효율성 증가로 약 20% 높은 인텔리전스 지수(Intelligence-Index)를 기대할 수 있습니다.
주요 수치
- GPT-5.5: 입력 $5.00/M, 출력 $30.00/M
- GPT-5.5 Pro: 입력 $30.00/M, 출력 $180.00/M
- 컨텍스트 윈도우: 모두 1M 토큰. 추론 토큰도 포함됨.
최신 정보는 OpenAI API 가격 페이지에서 확인하세요.
배치, 플렉스 및 우선순위
배치 API
- 배치 엔드포인트로 요청하면 표준 가격의 50%에 처리(입력 $2.50/M, 출력 $15.00/M).
- 처리 시간: 24시간 미만.
- 적용 예시: 데이터셋 야간 평가, 백필, 대규모 오프라인 워크로드.
플렉스 처리
- 플렉스 역시 50% 할인. 대기 시간은 가변적(몇 초~수 분).
- 대기 시간 허용이 가능하면서 실시간성도 필요한 워크로드에 적용.
우선순위 처리
- 표준의 2.5배(입력 $12.50/M, 출력 $75.00/M).
- 최대 처리량, 속도 제한 증가, 거의 제로 대기 시간.
- 라이브 사용자 경험 등 지연이 핵심인 서비스에 최적.
사고 모드 비용 계산
- 사고(Thinking) 모드는
reasoning.effort값에 따라 요청당 사용하는 토큰량이 증가. - 승수(multiplier)는 다음과 같이 적용:
노력 수준 출력 토큰 승수 사용 시점 low(기본)1배 일반 호출 medium1.3–2배 다단계 코딩, 구조화 생성 high2–4배 심층 연구, 정확성 요구 xhigh3–8배 에이전트 루프, 고밀도 계획
예시: xhigh 호출로 2만 추론 토큰 소모 시, 출력 토큰 비용 외 추론에만 $0.60(백만 토큰당 $30) 발생.
개별 요청 기준이 아니라 워크로드 전체 기준으로 예산을 설계하세요.
코덱스 요금
- Codex 접근은 토큰당 요금이 아니라 ChatGPT 플랜 요금에 포함.
- 2026년 4월 23일 기준:
플랜 코덱스 접근 GPT-5.5 참고 무료 예 (제한) 예 주간 제한 Go 예 (제한) 예 무료 제한의 2배 Plus ($20 / 월) 예 예 표준 제한 Pro ($200 / 월) 예 예 + 사고 + Pro 최고 한도 Business 예 예 시트 기반 Enterprise / Edu 맞춤형 예 계약
터미널 코딩 중심 워크플로우라면 Plus/Pro 플랜이 가장 경제적입니다. 하루 수십만 토큰 이상이면 월 정액이 배치 요금보다 저렴합니다. 무료 경로 가이드 참고.
비교: GPT-5.5 vs 다른 라인업
GPT-5.5 요금 지불 시점과 GPT-5.4/5.4-mini 유지 시점은 워크로드별 출력 비중에 따라 다릅니다.
| 모델 | 입력 / M | 출력 / M | 출력 토큰 1천개당 비용 |
|---|---|---|---|
| GPT-5.4-mini | $0.25 | $2.00 | $0.0020 |
| GPT-5.4 | $2.50 | $15.00 | $0.0150 |
| GPT-5.5 | $5.00 | $30.00 | $0.0300 |
| GPT-5.5 Pro | $30.00 | $180.00 | $0.1800 |
의사결정 기준 예시:
- 고볼륨/저위험(분류, 요약, 간단 채팅): GPT-5.4-mini
- 품질 충족 일반 트래픽: GPT-5.4
- 어려운 코딩, 다단계 에이전트, 연구 체인: GPT-5.5
- 정확성 필수, 오류 검증 어려움: GPT-5.5 Pro
실제 예시: 코딩 에이전트 작업당 비용
GPT-5.5의 reasoning.effort: "medium" 기준 일반 에이전트 코딩 작업:
- 입력 토큰(컨텍스트 + 프롬프트): 약 15,000
- 출력 토큰(코드+설명): 약 3,000
- 추론 토큰(중간 노력): 약 6,000
비용 계산 예시:
- 입력: 15K × $5.00 / 1M = $0.075
- 출력: (3K+6K) × $30.00 / 1M = $0.27
- 총계: $0.345 / 작업
GPT-5.4 동일 워크로드:
- 입력: 15K × $2.50 / 1M = $0.0375
- 출력: 9K × $15.00 / 1M = $0.135
- 총계: $0.1725 / 작업
GPT-5.5는 동일한 추론 노력에서 2배 비용. 단, 작업 성공률(SWE-bench 등)이 증가해 재작업 횟수가 줄면 전체 비용은 오히려 감소할 수 있습니다.
첫날부터 구축할 가치가 있는 비용 제어
비용을 효과적으로 관리하는 다섯 가지 실전 팁:
-
max_output_tokens한도 엄수: 모든 호출에 적용. 2,000 미만으로 기본값 설정 권장. - 엄격한 JSON 스키마: 잘못된 출력은 재시도/재청구. 출력 검증 로직 필수.
- 난이도별 모델 라우팅: 쉬운 요청은 mini, 어려운 요청은 5.5로 분기. 간단한 라우터 구현이 비용 절감에 효과적.
- 오프라인 작업은 무조건 배치 사용: 평가/백필/야간보고 등은 항상 50% 할인 적용.
-
usage.reasoning_tokens추적 및 경고: 높은 노력 수준에서 발생하는 예기치 못한 청구 방지.
아래는 기본 라우팅 예시 코드(Python):
def select_model(prompt):
if len(prompt) < 100 or "요약" in prompt:
return "gpt-5.4-mini"
elif "분석" in prompt or "코드 생성" in prompt:
return "gpt-5.5"
else:
return "gpt-5.4"
플랜별 월별 예상 비용
| 플랜 | 월별 가격 | 가장 적합한 경우 |
|---|---|---|
| 무료 | $0 | 코덱스 체험, 사전 검증 |
| Go | $4 / 월 | 가벼운 사용, 학생 |
| Plus | $20 / 월 | 매일 코덱스/ChatGPT 활용하는 개발자 |
| Pro | $200 / 월 | 사고/Pro 기능이 필요한 파워 유저 |
| Business | $25 / 시트 / 월 | 팀 단위, 공유 작업 공간 |
| Enterprise / Edu | 맞춤형 | SLA 기반 계약 |
API 기준 월 4백만 출력 토큰 이상이면, Pro 플랜+Codex CLI 조합이 종량제 API 대비 더 저렴합니다(40만 컨텍스트 윈도우 내 워크로드 기준).
주목해야 할 가격 변동 신호
- GPT-5.5 API GA 시점: 경쟁 모델(Claude Mythos, Gemini 3.5 등) 출시 시 가격 하락 가능성.
- Pro 모델 가격 변동: 출시 후 3~6개월 내 Pro 가격 인하 사례 다수. 단, 가격 인하/고정 모두 예측 불가.
자주 묻는 질문
- 캐싱이 입력 비용을 줄이나요? 네. 캐시된 입력 토큰은 표준 요금 일부로 청구. 재사용 가능한 프롬프트/스키마/컨텍스트는 필히 캐시. OpenAI 가격 페이지 참고.
- 볼륨 할인이 있나요? 공식 할인 없음. 엔터프라이즈 계약은 협상 가능. 연간 7자리($1M+) 이상이면 영업팀 문의.
- 사고(Thinking) 모드는 별도 추가 요금 있나요? 추가 요금 없음. 더 많은 토큰 사용으로 인한 비용 증가만 존재.
- Codex CLI 사용량은 API 사용량과 별도 청구되나요? API 키 로그인 시 종량제 청구, ChatGPT 로그인 시 플랜 요금 적용.
- 가장 저렴하게 GPT-5.5 체험하려면? 무료/Go 플랜 + Codex CLI 조합. 모든 무료 옵션은 무료 경로 가이드 참고.
Top comments (0)