DEV Community

Cover image for LLM token economics — 자동화의 단위 경제학을 분기 보고로 끌고 가기
HyunSeok Jeong
HyunSeok Jeong

Posted on • Originally published at blog.trysitely.com

LLM token economics — 자동화의 단위 경제학을 분기 보고로 끌고 가기

LLM 자동화 한 자리에 비용이 매월 얼마나 드는지 즉답할 수 있나요? 첫 청구서를 받기 전까지는 의외로 어렵습니다. 호출 수 × 입력 토큰 × 단가가 각각 어떻게 움직이는지 모르고 자동화를 운영하면, 분기 마감일에 "이번 분기 LLM 비용이 예상보다 3배"라는 숫자만 받게 됩니다. 이 글은 그 숫자를 분기 보고로 끌고 가는 단위 경제학 한 묶음을 정리합니다.

마케터가 이 글을 읽어야 하는 이유: LLM 자동화는 ROI가 큰 만큼 비용도 빠르게 커집니다. 호출당 비용·일일 합계·모델별 단가 차이를 미리 알면 분기 예산 결정이 정확해지고, 어느 자동화에 어느 모델을 쓸지 결정할 때 데이터가 따라옵니다. 비용 청구서가 통제 안에 들어와야 LLM 자동화가 운영의 표준 도구가 됩니다.

입력 토큰·출력 토큰·캐시 토큰의 단가 차이를 보여주는 다이어그램과 모델별 단가 비교 표
자동화 한 자리의 비용은 입력·출력·캐시·모델 4가지 변수로 거의 결정된다.

1. LLM 비용의 4개 변수

LLM API 비용은 단순한 공식으로 계산됩니다.

Cost=calls(Tinpin+ToutpoutTcachepcache discount) \text{Cost} = \sum_{\text{calls}} (T_{\text{in}} \cdot p_{\text{in}} + T_{\text{out}} \cdot p_{\text{out}} - T_{\text{cache}} \cdot p_{\text{cache discount}})
  • TinT_{\text{in}} : 호출당 입력 토큰
  • ToutT_{\text{out}} : 호출당 출력 토큰
  • TcacheT_{\text{cache}} : 호출당 캐시 히트 토큰
  • pp : 토큰당 단가 (모델·종류별 다름)

이 4개 변수가 자동화 한 자리의 매월 비용을 거의 결정합니다.

📌 이 글의 전제

LLM API를 자동화에 한 번이라도 써보고 청구서를 받아본 적 있는 마케터·운영자를 가정합니다. 토큰·입력·출력 같은 단어는 일상으로 쓴다고 가정합니다.

2. 모델별 단가 — 자릿수 차이

2026년 기준 주요 모델 단가(1M 토큰당, USD).

모델 입력 출력 캐시 히트 추론(thinking)
GPT-5 55 15 2.52.5 15
GPT-5-mini 0.500.50 1.50 $0.25
Claude Opus 4.7 1515 75 $1.5
Claude Sonnet 4.6 33 15 $0.30
Claude Haiku 4.5 0.800.80 4 $0.08
Gemini 2.5 Pro 1.251.25 5 $0.31
Gemini 2.5 Flash 0.300.30 2.50 $0.075

같은 작업이라도 모델 선택만으로 비용이 10-30배 차이. 입력 토큰이 많은 자리(긴 컨텍스트)는 입력 단가, 출력이 긴 자리(보고서 생성)는 출력 단가가 핵심.

3. 호출당 비용 계산 — 한 자동화의 단위 경제학

캠페인 분류 자동화를 예로 들겠습니다.

항목
시스템 프롬프트 500 토큰
Few-shot 예시 1500 토큰
사용자 입력 100 토큰
출력 200 토큰
일일 호출 1000회

3-1. GPT-5 사용 시

호출당 비용:

  • 입력: (500+1500+100)/1M×(500 + 1500 + 100) / 1\text{M} \times 5 = \$0.0105$
  • 출력: 200/1M×200 / 1\text{M} \times 15 = \$0.003$
  • 호출당: 0.0135$

일일 1000회: 13.5 .한달:. 한 달: \$405$.

3-2. GPT-5-mini 사용 시

호출당:

  • 입력: 2100/1M×2100 / 1\text{M} \times 0.50 = \$0.00105$
  • 출력: 200/1M×200 / 1\text{M} \times 1.50 = \$0.0003$
  • 호출당: 0.00135$

일일 1000회: 1.35 .한달:. 한 달: \$40.5$. GPT-5의 1/10.

3-3. Caching 적용 GPT-5

Prompt caching을 적용하면 시스템 프롬프트·few-shot이 캐시 히트:

  • 입력 (캐시 안 됨): 100/1M×100 / 1\text{M} \times 5 = \$0.0005$
  • 입력 (캐시 히트): 2000/1M×2000 / 1\text{M} \times 2.5 = \$0.005$
  • 출력: 0.003$
  • 호출당: 0.0085$ (37% 절감)
옵션 호출당 일일 1000회 월 비용
GPT-5 (no cache) 0.01350.0135 13.5 $405
GPT-5 + caching 0.00850.0085 8.5 $255
GPT-5-mini 0.001350.00135 1.35 $40.5
GPT-5-mini + caching 0.0010.001 1.0 $30

같은 작업에 모델·캐싱 조합으로 월 $30-405. 13배 차이.

4. 코드 한 묶음 — 호출별 비용 추적

이게 글에 박는 유일한 코드입니다.


python
Enter fullscreen mode Exit fullscreen mode

Top comments (0)