← All guides

Claude Opus vs Sonnet vs Haiku 완전 비교: 어떤 모델 써야 할까?

Claude 모델 2026 비교 — Haiku $0.80/M(빠름), Sonnet $3/M(균형), Opus $15/M(최강). 80/15/5 전략으로 비용 90% 절감.

Claude Opus vs Sonnet vs Haiku 완전 비교: 어떤 모델 써야 할까?

결론부터: 대부분의 작업에는 Haiku 3.5($0.80/M 토큰)가 정답이다. Haiku는 분류·초안·반복 작업에서 충분한 품질을 제공하며 Opus 대비 비용이 95% 저렴하다. 복잡한 코드 작성과 분석에는 Sonnet 4.5($3.00/M), 전략 결정과 복잡한 추론에만 Opus 4.5($15.00/M)를 써야 한다. 80% Haiku / 15% Sonnet / 5% Opus 비율을 목표로 하면 동일한 품질을 유지하면서 월 API 비용을 최대 90% 줄일 수 있다.


2026년 Claude 모델 스펙 비교표

모델 입력 (1M 토큰) 출력 (1M 토큰) 컨텍스트 속도 최적 용도
Haiku 3.5 $0.80 $4.00 200K 1초 이하 반복 작업, 분류, 콘텐츠 초안
Sonnet 4.5 $3.00 $15.00 200K 2–4초 코드 작성, 분석, 중간 복잡도
Opus 4.5 $15.00 $75.00 200K 5–10초 전략 결정, 복잡한 추론, 아키텍처

세 모델 모두 200K 토큰 컨텍스트 윈도우를 지원한다. 차이는 가격, 속도, 추론 깊이다. 동일한 입력을 주어도 Opus는 Haiku보다 더 깊이 생각하고, 더 긴 응답을 생성하며, 더 많은 비용이 든다.


모델별 최적 사용 케이스

Haiku 3.5 — 80%의 작업은 여기서 처리

Haiku는 "충분히 좋은" 품질이 필요한 고빈도 작업에 최적화되어 있다. 속도가 빠르고 비용이 낮아 대규모 배치 처리에 적합하다.

실전 예시:

Haiku를 쓰지 말아야 할 때:


Sonnet 4.5 — 균형점, 15%의 작업에 투자

Sonnet은 품질과 비용의 균형점이다. Haiku로 해결되지 않는 중간 복잡도 작업에 투입한다.

실전 예시:

실전 팁: Haiku로 먼저 테스트하라. 품질이 부족할 때만 Sonnet으로 올린다. 처음부터 Sonnet을 쓰는 것은 비용 낭비다.


Opus 4.5 — 최강, 하지만 5%에만 사용

Opus는 가장 강력하지만 가장 비싸다. 출력 1M 토큰 기준 $75로 Haiku의 18.75배다. 이 비용을 정당화하려면 Opus만이 낼 수 있는 결과가 필요해야 한다.

실전 예시:

Opus를 써야 한다는 신호:


80/15/5 전략: 비용 90% 절감의 핵심

80/15/5 전략은 단순하다. 모든 요청을 세 버킷으로 나눈다.

전체 API 트래픽
├── 80% → Haiku    ($0.80–$4.00/M)
├── 15% → Sonnet   ($3.00–$15.00/M)
└── 5%  → Opus     ($15.00–$75.00/M)

이 비율을 유지하면 "모든 요청에 Sonnet"을 쓰는 것보다 비용이 75% 줄고, "모든 요청에 Opus"를 쓰는 것보다 90% 이상 줄어든다.

구현 방법:

def route_model(task_type: str) -> str:
    # Haiku: 고빈도, 구조화된 작업
    if task_type in ["classify", "extract", "translate", "summarize_short", "draft"]:
        return "claude-haiku-3-5"
    
    # Sonnet: 중간 복잡도
    elif task_type in ["code", "analyze", "agent", "summarize_long", "review"]:
        return "claude-sonnet-4-5"
    
    # Opus: 최고 복잡도, 고부가치
    else:  # "strategy", "architecture", "critical_decision"
        return "claude-opus-4-5"

라우팅 로직을 처음 짤 때는 보수적으로 시작한다. 의심스러우면 Haiku로 시작하고, 품질 평가 후 올린다. 처음부터 Opus로 시작하면 절대 내리기 어렵다.


P5 Cost Optimization Masterclass: 80/15/5 전략 구현, 프롬프트 캐싱, 배치 API 활용까지 — 실제 프로덕션 비용을 90% 줄인 전략을 모두 담았다. Claude API 비용 최적화 마스터클래스 →


실전 비용 계산 예시

월 1,000만 토큰(입력 700만 + 출력 300만)을 처리하는 서비스를 기준으로 계산한다.

시나리오 A: 모든 요청에 Opus 사용 (최악)

항목 토큰 단가 비용
입력 7M $15.00/M $105.00
출력 3M $75.00/M $225.00
합계 $330.00/월

시나리오 B: 모든 요청에 Sonnet 사용 (보통)

항목 토큰 단가 비용
입력 7M $3.00/M $21.00
출력 3M $15.00/M $45.00
합계 $66.00/월

시나리오 C: 80/15/5 전략 적용 (최적)

모델 입력 토큰 출력 토큰 비용
Haiku (80%) 5.6M × $0.80 2.4M × $4.00 $4.48 + $9.60 = $14.08
Sonnet (15%) 1.05M × $3.00 0.45M × $15.00 $3.15 + $6.75 = $9.90
Opus (5%) 0.35M × $15.00 0.15M × $75.00 $5.25 + $11.25 = $16.50
합계 $40.48/월

결과 비교:

자세한 비용 계산 방법은 Claude API 비용 계산 완전 가이드에서 확인할 수 있다.


모델 선택 의사결정 트리

작업이 무엇인가?
│
├── 반복적이고 구조화된 작업인가? (분류, 추출, 번역, 초안)
│   └── YES → Haiku 3.5 ✓
│
├── 코드 작성, 분석, 에이전트 워크플로인가?
│   └── YES → Sonnet 4.5 ✓
│
├── 전략, 복잡한 추론, 아키텍처 설계인가?
│   └── YES → Opus 4.5 ✓
│
└── 확신이 없다면?
    └── Haiku로 시작 → 품질 부족 시 Sonnet → 그래도 부족 시 Opus

P5 마스터클래스로 더 깊이 파고들기

80/15/5 전략은 시작점이다. 프로덕션에서 비용을 실제로 90% 줄이려면 다음이 추가로 필요하다.

이 모든 내용은 P5 Cost Optimization Masterclass에 담겨 있다.

Claude API 비용 최적화 마스터클래스 구매하기 →


Frequently Asked Questions

Claude Haiku와 Sonnet의 품질 차이는 실제로 크나요?

작업 유형에 따라 다르다. 분류, 번역, 짧은 요약처럼 구조화된 작업에서는 품질 차이가 5% 미만이다. 반면 복잡한 코드 작성이나 긴 문서 분석에서는 Sonnet이 확연히 우수하다. 실전에서는 Haiku로 먼저 테스트하고 품질을 측정한 뒤 판단하는 것이 가장 좋다.

스타트업이라면 어떤 모델로 시작해야 하나요?

MVP 단계에서는 Sonnet 4.5로 시작하는 것을 권장한다. 품질이 충분히 좋고, 개발 속도를 높이는 데 유리하다. 월 API 비용이 $100을 넘기 시작하면 80/15/5 전략을 도입해 Haiku로 트래픽을 내리기 시작한다.

Opus 4.5는 언제 쓰는 게 맞나요?

Sonnet 결과를 사람이 검토하고 "이건 부족하다"고 반복적으로 판단할 때가 신호다. 또는 작업 실패 비용이 너무 커서 재시도를 허용할 수 없는 1회성 고부가가치 작업(투자 제안서, 법률 문서 초안)에 쓴다. Opus를 기본값으로 쓰는 것은 비용 낭비다.

세 모델 모두 한국어를 잘 지원하나요?

네. Haiku, Sonnet, Opus 모두 한국어를 포함한 다국어를 지원한다. 한국어 작업에서도 영어와 동일한 모델 선택 기준이 적용된다. 다만 매우 복잡한 한국어 문어체 문서 분석에서는 Sonnet 이상을 권장한다.

프롬프트 캐싱을 쓰면 비용이 얼마나 더 줄어드나요?

시스템 프롬프트가 1,000 토큰 이상이고, 같은 시스템 프롬프트를 반복 사용하는 경우 입력 비용을 최대 90%까지 줄일 수 있다. 80/15/5 전략과 프롬프트 캐싱을 함께 적용하면 Opus 단일 사용 대비 95% 이상 비용 절감이 가능하다. 자세한 내용은 Claude API 비용 계산 완전 가이드를 참고하라.

Claude 모델 버전은 얼마나 자주 바뀌나요?

Anthropic은 통상 6–12개월 주기로 새 모델을 출시한다. API를 사용할 때는 claude-haiku-3-5, claude-sonnet-4-5, claude-opus-4-5처럼 버전을 명시하는 것이 좋다. 버전 없이 claude-haiku만 지정하면 Anthropic이 자동으로 최신 버전으로 라우팅하며, 업데이트 시 동작이 바뀔 수 있다.

도구와 자료