jidong

Posted on Feb 26

Claude vs GPT vs Gemini — 칵테일해서 쓰는 법

#ai #llm #productivity #webdev

“어떤 모델이 제일 좋아요?”

이 질문 자체가 아마추어다.

정답은 “태스크마다 다르다”이고, 프로는 섞어 쓴다.

사주 앱이랑 부동산 분석 서비스를 사이드 프로젝트로 만들면서 Claude, GPT, Gemini를 전부 써보고 있다.

왜 하나로 안 되는지, 어떻게 섞어야 하는지 정리한다.

세 모델의 성격은 완전히 다르다

벤치마크 점수로는 안 보이는 게 있다.

써봐야 느끼는 성격 차이다.

Claude는 지시를 가장 정확히 따른다.

JSON 스키마를 강제하면 잘 안 깨진다.

XML 태그와 궁합이 좋다.

대신 거절이 좀 잦다.

GPT는 맥락 파악이 자연스럽다.

대충 말해도 의도를 잘 읽는다.

이미지 생성도 강하다.

Gemini는 컨텍스트와 가격이 무기다.

긴 입력을 한 번에 밀어 넣고 처리할 수 있다.

Flash는 싸다.

실전 가격표

가격을 모르면 라우팅 전략을 못 짠다.

Opus와 Flash 사이에 100배 차이가 난다.

같은 “사주 해석해줘”인데 어디에 보내느냐로 비용이 100배 달라진다.

사주 서비스를 설계한다면 이렇게 라우팅한다

오늘의 운세 한줄은 Gemini Flash.

기본 분석은 Claude Haiku.

심층 해석은 Claude Sonnet.

이미지 분석이 필요하면 GPT.

대량 컨텍스트가 필요하면 Gemini Pro.

핵심은 요청 타입 분류다.

복잡해 보여도 if-else 분기다.

모델별 프롬프트 포맷도 다르다

Claude에게는 XML.

GPT에게는 마크다운.

Gemini는 둘 다 괜찮지만 마크다운이 편하다.

같은 프롬프트를 그대로 보내면 품질이 떨어진다.

템플릿을 분리해라.

라우팅 도구

LiteLLM은 통합 API.

OpenRouter는 다중 모델 접근.

Helicone은 모니터링.

느낌으로 고르지 말고, 같은 테스트 케이스로 돌려서 비용/정확도/속도를 측정해라.

가격표만 보고 끝내면 반만 본 거다.

캐싱까지 봐야 한다.

Anthropic은 시스템 프롬프트 캐싱으로 input 비용을 크게 줄일 수 있다.

실제 운영 비용은 가격표 × 사용 패턴이다.

"모든 질문에 교수를 부르지 마라. 조교로 충분한 일이 80%다."

DEV Community