CH1 · 벤치마크CAPTURE · 2026-04-11
AI API 응답 시간 — 5개 모델 latency 비교
AI 5개 API 모델의 latency를 동일 조건에서 1주일 측정 비교한 데이터.
▮▯ ANALYSIS LAB
디지털 제품과 도구를 깊게 분석하는 리서치 사이트
AI 5개 API 모델의 latency를 동일 조건에서 1주일 측정 비교한 데이터.
동일 프롬프트(500토큰 입력, 800토큰 출력), 서울 리전 출발, 1주일간 매 시간 측정 후 평균치 산출.
TTFT(첫 토큰 시간) 표준편차: GPT 계열 ±0.2s, Claude ±0.15s, Gemini ±0.4s. Gemini가 가장 변동성 큼.
응답 시간만 보면 Claude가 우세, 비용 대비는 GPT-3.5, 컨텍스트 길이는 Gemini.