ベータ
ランキング/Claude 3.5 Haiku
Anthropic logo

Claude 3.5 Haiku

開発元 Anthropic · リリース日 2024-11-04

37.2
平均スコア
$0.80/1M
入力料金
$4.00/1M
出力料金
200K tokens (~100 books)
コンテキストウィンドウ
multimodal
タイプ

Tested on 17 benchmarks with 37.2% average. Top scores: HELM — IFEval (79.2%), HELM — WildBench (76.0%), Lech Mazur Writing (73.5%).

ベンチマークカテゴリスコアBar
HELM — IFEvallanguage79.2
HELM — WildBenchreasoning76.0
Lech Mazur Writingknowledge73.5
MMLUknowledge65.7
HELM — MMLU-Proknowledge60.5
MATH level 5math46.4
HELM — GPQAknowledge36.3
GeoBenchknowledge34.0
CadEvalcoding32.0
WeirdMLcoding30.7
Aider polyglotcoding28.0
HELM — Omni-MATHmath22.4
Balrogknowledge19.3
GPQA diamondknowledge17.5
SimpleQA Verifiedknowledge6.7
OTIS Mock AIME 2024-2025math4.2
FrontierMath-2025-02-28-Privatemath0.3