CH1 · 벤치마크CAPTURE · 2026-04-11

AI API 응답 시간 — 5개 모델 latency 비교

GPT-4 Turbo: 0.8s / 18.4s
Claude 3 Sonnet: 0.6s / 14.2s
Gemini 1.5 Pro: 1.1s / 22.7s
GPT-3.5 Turbo: 0.4s / 6.8s
Mistral Large: 0.7s / 15.5s

AI 5개 API 모델의 latency를 동일 조건에서 1주일 측정 비교한 데이터.

측정 조건

동일 프롬프트(500토큰 입력, 800토큰 출력), 서울 리전 출발, 1주일간 매 시간 측정 후 평균치 산출.

TTFT(첫 토큰 시간) 표준편차: GPT 계열 ±0.2s, Claude ±0.15s, Gemini ±0.4s. Gemini가 가장 변동성 큼.

응답 시간만 보면 Claude가 우세, 비용 대비는 GPT-3.5, 컨텍스트 길이는 Gemini.

▸ EDITED BY Review Scope 분석실CAPTURED · 2026-04-11