Claude API max_tokens (invalid_request_error): 원인과 해결법

#troubleshooting

Originally published at claudeguide.io/claude-api-error-max-tokens

Claude API max_tokens (invalid_request_error): 원인과 해결법

Claude API max_tokens invalid_request_error는 max_tokens가 모델별 출력 한도를 초과한 경우에 발생합니다 (2026 기준). max_tokens 한도 초과이며, 재시도하지 말고 요청 자체를 수정해야 합니다. 이 글은 5가지 흔한 원인과 Python/TypeScript 코드 예시를 다룹니다.

전반적인 Claude API 에러 처리 패턴은 Claude API Error Handling 가이드를 참고하세요.

무엇을 의미하는가?

max_tokens 에러 서브타입는 max_tokens가 모델별 출력 한도를 초과한 경우을 의미합니다. Anthropic API의 에러 응답 본문에는 error.type이 "invalid_request_error"로 명시되며, error.message에 구체적 사유가 옵니다.

응답 예시:

{
  "type": "error",
  "error": {
    "type": "invalid_request_error",
    "message": "..."
  }
}

흔한 원인 5가지

Sonnet 4.5: max_tokens 8192 한도
Opus 4.5: max_tokens 8192 한도
Haiku 4.5: max_tokens 8192 한도
Sonnet extended thinking 시: 64K (별도 옵션)
오래된 모델 (Sonnet 3.5)에 대해 새 한도 사용

해결 코드 (Python)


python
MAX_OUTPUT = {
    "claude-haiku-4-5": 8192,
    "claude-sonnet-4-5": 8192,
    "claude-opus-4-5": 8192,
}

def safe_max_tokens(model: str, requested: int) -