▮▯ ANALYSIS LAB

Review Scope

디지털 제품과 도구를 깊게 분석하는 리서치 사이트

T · 22:00:36CH:4
SAMPLE 100k/sRUN
◀ BACK TO BUFFER
CH1 · 벤치마크CAPTURE · 2026-04-11

AI API 응답 시간 — 5개 모델 latency 비교

AI 5개 API 모델의 latency를 동일 조건에서 1주일 측정 비교한 데이터.

측정 조건

동일 프롬프트(500토큰 입력, 800토큰 출력), 서울 리전 출발, 1주일간 매 시간 측정 후 평균치 산출.

모델별 평균 latency (TTFT / 전체)

  • GPT-4 Turbo: 0.8s / 18.4s
  • Claude 3 Sonnet: 0.6s / 14.2s
  • Gemini 1.5 Pro: 1.1s / 22.7s
  • GPT-3.5 Turbo: 0.4s / 6.8s
  • Mistral Large: 0.7s / 15.5s

변동성

TTFT(첫 토큰 시간) 표준편차: GPT 계열 ±0.2s, Claude ±0.15s, Gemini ±0.4s. Gemini가 가장 변동성 큼.

응답 시간만 보면 Claude가 우세, 비용 대비는 GPT-3.5, 컨텍스트 길이는 Gemini.
▸ EDITED BY Review Scope 분석실CAPTURED · 2026-04-11