Claude Fable 5의 API 가격은 백만 입력 토큰당 $10, 백만 출력 토큰당 $50입니다. 프로덕션 적용 전에는 입력/출력 토큰 비율, 구독 요금제 포함 기간, 사용 크레딧 전환 시점, 프롬프트 캐싱과 배치 API 같은 비용 절감 옵션까지 함께 계산해야 합니다. 이 글에서는 Claude Fable 5 비용을 실제 워크로드 기준으로 계산하고, 개발 중 토큰 사용량을 확인하는 방법까지 정리합니다.
요약
Claude Fable 5는 API 기준으로 다음 요율이 적용됩니다.
- 입력 토큰: 백만 토큰당 $10
- 출력 토큰: 백만 토큰당 $50
- 2026년 6월 9일 ~ 6월 22일: Pro, Max, Team, 좌석 기반 Enterprise 요금제에 무료 포함
- 2026년 6월 23일 이후: 동일한 $10/$50 토큰 요율로 사용 크레딧에서 차감
즉, 실제 비용은 다음 공식으로 계산합니다.
비용 = (입력 토큰 / 1,000,000) * 10 + (출력 토큰 / 1,000,000) * 50
Claude Fable 5 가격 요약
| 토큰 유형 | 백만 토큰당 가격 | 1K 토큰당 가격 | 참고 |
|---|---|---|---|
| 입력 | $10.00 | $0.01 | 프롬프트, 시스템 메시지, 컨텍스트, 도구 정의 |
| 출력 | $50.00 | $0.05 | 모델 답변, 추론, 도구 호출 인수 |
API 모델 ID는 다음과 같습니다.
claude-fable-5
출력 토큰은 입력 토큰보다 5배 비쌉니다. 따라서 비용 최적화의 핵심은 “입력도 줄이되, 특히 출력 길이를 통제하는 것”입니다.
현재 요금은 Anthropic 가격 페이지와 모델 및 가격 문서에서 확인할 수 있습니다.
API 사용 시 비용 계산 방식
Anthropic API는 입력 토큰과 출력 토큰을 분리해서 청구합니다.
입력 토큰에는 다음이 포함됩니다.
- 사용자 프롬프트
- 시스템 메시지
- 이전 대화 기록
- 검색된 문서
- 도구 정의 JSON
- 코드 컨텍스트
출력 토큰에는 다음이 포함됩니다.
- 모델이 생성한 답변
- 모델이 작성한 도구 호출 인수
- 모델 생성 과정에서 포함되는 출력성 토큰
예를 들어 입력 2,000토큰, 출력 600토큰을 사용한 요청은 다음처럼 계산합니다.
입력 비용 = 2,000 / 1,000,000 * $10 = $0.02
출력 비용 = 600 / 1,000,000 * $50 = $0.03
총 비용 = $0.05
요청당 고정 요금은 없습니다. 전체 청구액은 모든 API 호출의 입력 토큰 비용과 출력 토큰 비용의 합계입니다.
Anthropic은 Fable 5를 “Claude Mythos Preview 가격의 절반 이하”라고 설명합니다. 제한된 자매 모델인 Claude Mythos 5도 동일한 $10 입력 / $50 출력 요율을 사용하므로, 두 모델 간 전환만으로 토큰당 비용이 달라지지는 않습니다.
모델 자체의 기능적 배경이 필요하다면 Claude Fable 5란 무엇인가를 참고하세요.
요금제 포함 여부와 사용 크레딧
API 가격과 Claude 구독 요금제 내 사용 정책은 별도로 봐야 합니다.
2026년 6월 9일 ~ 6월 22일
이 기간에는 Claude Fable 5가 다음 요금제에 추가 비용 없이 포함됩니다.
- Pro
- Max
- Team
- 좌석 기반 Enterprise
즉, 해당 기간에는 모델을 사용해도 측정된 사용 크레딧에서 차감되지 않습니다.
2026년 6월 23일 이후
2026년 6월 23일부터는 Fable 5가 위 요금제의 포함 모델 목록에서 제외됩니다.
이후 Pro, Max, Team, 좌석 기반 Enterprise에서 Fable 5를 사용하면 사용 크레딧이 차감됩니다. 이때 적용되는 요율은 API와 동일합니다.
입력: 백만 토큰당 $10
출력: 백만 토큰당 $50
Anthropic은 용량이 허용되면 일부 표준 요금제 접근을 복원할 계획이라고 밝혔지만, 현재 기준으로는 6월 23일 이후 사용량을 크레딧 기반으로 계산해야 합니다.
소비 기반 Enterprise 요금제는 처음부터 사용량 기반 과금이므로 포함 기간 여부와 무관하게 Fable 5를 사용할 수 있습니다.
접근 방법 전체가 필요하다면 Claude Fable 5에 접근하는 방법을 참고하세요.
실제 워크로드별 비용 예시
비용 계산 공식은 항상 동일합니다.
(입력 토큰 / 1,000,000) * $10 + (출력 토큰 / 1,000,000) * $50
아래 예시를 기준으로 자신의 서비스 트래픽에 대입하면 됩니다.
예시 1: 고객 지원 챗봇 1턴
가정:
- 입력 토큰: 1,500
- 출력 토큰: 500
계산:
입력 비용 = 1,500 / 1,000,000 * $10 = $0.015
출력 비용 = 500 / 1,000,000 * $50 = $0.025
총 비용 = $0.04
턴당 약 4센트입니다.
하루 1,000턴이면 다음과 같습니다.
$0.04 * 1,000 = $40 / day
월 30일 기준으로는 약 $1,200입니다.
챗봇 워크로드는 호출당 비용이 작아 보여도, 트래픽이 늘면 빠르게 누적됩니다.
예시 2: 코드 생성 요청
가정:
- 입력 토큰: 8,000
- 출력 토큰: 3,000
계산:
입력 비용 = 8,000 / 1,000,000 * $10 = $0.08
출력 비용 = 3,000 / 1,000,000 * $50 = $0.15
총 비용 = $0.23
입력 토큰이 출력보다 많지만, 비용의 대부분은 출력에서 발생합니다.
총 $0.23 중 출력 비용 = $0.15
따라서 코드 생성 기능에서는 다음을 꼭 적용해야 합니다.
- 불필요한 설명 줄이기
- 생성할 파일/함수 범위 제한
-
max_tokens를 작업별로 작게 설정 - “변경된 코드만 출력” 같은 응답 형식 지정
예시 3: 장기 에이전트 실행
가정:
- 입력 토큰: 300,000
- 출력 토큰: 50,000
계산:
입력 비용 = 300,000 / 1,000,000 * $10 = $3.00
출력 비용 = 50,000 / 1,000,000 * $50 = $2.50
총 비용 = $5.50
실행당 약 $5.50입니다.
팀에서 하루 200번 실행하면 다음과 같습니다.
$5.50 * 200 = $1,100 / day
장기 에이전트는 동일한 시스템 프롬프트, 도구 정의, 문서 컨텍스트를 반복해서 보내는 경우가 많습니다. 이런 워크로드에서는 프롬프트 캐싱이 비용 절감에 직접적인 영향을 줍니다.
Claude Fable 5 비용 줄이는 방법
1. 프롬프트 캐싱 사용
프롬프트 캐싱은 동일한 컨텍스트를 여러 요청에서 재사용할 때 효과적입니다.
일반적으로 캐시 읽기 비용은 입력 가격의 약 0.1배입니다.
일반 입력: 백만 토큰당 약 $10
캐시 읽기: 백만 토큰당 약 $1
캐시 쓰기 비용은 입력의 약 1.25배입니다.
5분 TTL 캐시 쓰기: 백만 토큰당 약 $12.50
예시 3의 장기 에이전트 실행에서 입력 300,000토큰 중 250,000토큰이 캐시에서 제공된다고 가정해 봅니다.
캐시 읽기 250,000토큰 = 250,000 / 1,000,000 * $1 = $0.25
새 입력 50,000토큰 = 50,000 / 1,000,000 * $10 = $0.50
입력 총 비용 = $0.75
기존 입력 비용은 $3.00이었으므로 입력 비용이 크게 줄어듭니다.
전체 실행 비용은 다음처럼 바뀝니다.
기존: 입력 $3.00 + 출력 $2.50 = $5.50
캐싱 적용 후: 입력 $0.75 + 출력 $2.50 = $3.25
반복되는 컨텍스트가 많은 에이전트, 챗봇, 코드 분석 도구에서는 프롬프트 캐싱을 우선 적용하세요.
2. 배치 API 사용
즉시 응답이 필요하지 않은 작업은 배치 API로 보내는 것이 좋습니다.
적합한 작업 예시:
- 야간 문서 처리
- 대량 분류
- 로그 분석
- 대규모 요약
- 오프라인 평가 실행
배치 API는 약 50% 할인된 가격으로 실행됩니다.
기본 요율: 입력 $10 / 출력 $50
배치 적용 시 대략: 입력 $5 / 출력 $25
사용자가 기다리는 인터랙티브 요청은 실시간 API로 처리하고, 지연이 허용되는 백그라운드 작업은 배치로 분리하세요.
3. 모델 라우팅 적용
모든 요청에 Claude Fable 5가 필요한 것은 아닙니다.
다음처럼 요청 난이도에 따라 모델을 나눌 수 있습니다.
| 작업 유형 | 추천 라우팅 |
|---|---|
| 복잡한 추론, 장기 계획, 어려운 코드 작업 | Fable 5 |
| 일반 코드 보조, 요약, 중간 난이도 작업 | Opus 4.8 또는 Sonnet 4.6 |
| 단순 분류, 짧은 변환, 템플릿 응답 | Haiku 4.5 |
예를 들어 전체 호출의 20%만 Fable 5로 보내고, 나머지 80%를 더 저렴한 모델로 보내면 비용을 크게 줄일 수 있습니다.
라우터는 처음에는 간단한 규칙 기반으로 시작해도 충분합니다.
if 요청이 긴 코드 컨텍스트 + 복잡한 추론을 포함:
claude-fable-5 사용
else:
더 저렴한 모델 사용
4. max_tokens를 작업별로 제한
출력 토큰은 백만 토큰당 $50입니다. 따라서 max_tokens를 너무 크게 열어두면 비용이 불필요하게 증가합니다.
나쁜 예:
{
"model": "claude-fable-5",
"max_tokens": 8000
}
더 나은 예:
{
"model": "claude-fable-5",
"max_tokens": 1500
}
프롬프트에도 출력 길이를 명시하세요.
변경된 코드만 출력하세요. 설명은 5문장 이내로 제한하세요.
3,000토큰 출력을 1,500토큰으로 줄이면 해당 요청의 출력 비용은 절반으로 줄어듭니다.
5. 스트리밍으로 불필요한 출력 중단
스트리밍은 토큰당 가격을 낮추지는 않습니다. 하지만 필요한 결과를 확인한 뒤 생성을 조기에 중단할 수 있습니다.
특히 다음 경우에 유용합니다.
- 긴 설명이 필요 없는 코드 생성
- 일부 결과만 확인하면 되는 탐색형 요청
- 사용자가 중간에 취소할 수 있는 UI
스트리밍과 낮은 max_tokens를 함께 사용하면 출력 비용을 더 쉽게 통제할 수 있습니다.
Apidog로 Claude Fable 5 사용량 확인하기
개발 중 비용을 관리하려면 월말 청구서를 기다리지 말고 요청 단위로 토큰 수를 확인해야 합니다.
Apidog는 Anthropic API 요청을 보내고 응답을 검사할 수 있는 API 클라이언트입니다.
Claude Fable 5를 호출하면 응답 본문에 usage 객체가 포함됩니다.
{
"usage": {
"input_tokens": 1500,
"output_tokens": 500
}
}
이 값으로 요청 비용을 바로 계산할 수 있습니다.
입력 비용 = input_tokens * 0.00001
출력 비용 = output_tokens * 0.00005
총 비용 = 입력 비용 + 출력 비용
예를 들어 다음과 같습니다.
input_tokens = 1500
output_tokens = 500
입력 비용 = 1500 * 0.00001 = $0.015
출력 비용 = 500 * 0.00005 = $0.025
총 비용 = $0.04
간단한 JavaScript 함수로도 계산할 수 있습니다.
function estimateFable5Cost(inputTokens, outputTokens) {
const inputCost = inputTokens * 0.00001;
const outputCost = outputTokens * 0.00005;
return {
inputCost,
outputCost,
totalCost: inputCost + outputCost,
};
}
console.log(estimateFable5Cost(1500, 500));
// { inputCost: 0.015, outputCost: 0.025, totalCost: 0.04 }
실무에서는 다음 흐름으로 확인하면 됩니다.
- Apidog에서 Anthropic API 요청을 생성합니다.
- 모델을
claude-fable-5로 설정합니다. - 대표 프롬프트를 여러 개 저장합니다.
- 각 프롬프트 실행 후
usage.input_tokens와usage.output_tokens를 확인합니다. - 프롬프트 변경 전후의 토큰 수를 비교합니다.
- 토큰 수가 급증한 시스템 메시지, 컨텍스트, 응답 형식을 찾아 수정합니다.
Apidog를 다운로드한 뒤 Claude Fable 5 API 가이드와 함께 요청 구조를 설정할 수 있습니다.
무료 포함 기간을 활용하려면 Claude Fable 5를 무료로 사용하는 방법도 참고하세요.
Apidog는 요청 기록을 유지하므로, 새로운 기능의 예상 비용을 계산할 때 과거 호출의 토큰 수를 다시 확인할 수 있습니다. 개발 중 Apidog를 비용 검사 계층으로 사용하면 프로덕션 트래픽이 늘기 전에 토큰 문제를 발견하기 쉽습니다.
정리
Claude Fable 5 가격은 다음 두 숫자로 요약됩니다.
입력: 백만 토큰당 $10
출력: 백만 토큰당 $50
운영 비용을 계산할 때는 다음을 함께 적용하세요.
- 6월 22일까지의 무료 포함 기간과 6월 23일 이후 크레딧 차감 구분
- 실제 워크로드별 입력/출력 토큰 계산
- 프롬프트 캐싱
- 배치 API
- 모델 라우팅
-
max_tokens제한 - 스트리밍 중단
- 요청별
usage확인
다음 단계는 단일 claude-fable-5 요청을 연결하고 usage 객체를 읽는 것입니다. Apidog를 다운로드해 첫 요청을 보내고, 실제 토큰 수 기준으로 비용을 확인하세요.


Top comments (0)