LIVE268개 제공업체의 976개 AI 모델 추적 중.

BenchGecko베타

모델976·제공업체268·벤치마크128·기업71·에이전트165·1위Qwen3 VL 235B A22B Instruct · 1415.8%·업데이트방금·데이터 포인트2,902·MCP 서버4,923

리더보드/Claude 3.5 Haiku

Claude 3.5 Haiku

제공 Anthropic · 출시일 2024-11-04

37.2

평균 점수

$0.80/1M

입력 가격

$4.00/1M

출력 가격

200K tokens (~100 books)

컨텍스트 윈도우

multimodal

유형

Tested on 17 benchmarks with 37.2% average. Top scores: HELM — IFEval (79.2%), HELM — WildBench (76.0%), Lech Mazur Writing (73.5%).

벤치마크 점수

벤치마크	카테고리	점수	Bar
HELM — IFEval	language	79.2
HELM — WildBench	reasoning	76.0
Lech Mazur Writing	knowledge	73.5
MMLU	knowledge	65.7
HELM — MMLU-Pro	knowledge	60.5
MATH level 5	math	46.4
HELM — GPQA	knowledge	36.3
GeoBench	knowledge	34.0
CadEval	coding	32.0
WeirdML	coding	30.7
Aider polyglot	coding	28.0
HELM — Omni-MATH	math	22.4
Balrog	knowledge	19.3
GPQA diamond	knowledge	17.5
SimpleQA Verified	knowledge	6.7
OTIS Mock AIME 2024-2025	math	4.2
FrontierMath-2025-02-28-Private	math	0.3

유사 모델

Claude Haiku 4.5

Qwen2.5 Coder 14B Instruct

Anthropic Claude Haiku 타임라인

Claude 3 HaikuMar 2024

$0.25/M in200Kctx8 benchmarks

Claude 3.5 HaikuNov 2024

$0.80/M in(+0.55)200Kctx17 benchmarks

Claude Haiku 4.5Oct 2025

$1.00/M in(+0.20)200Kctx10 benchmarks