ベータ
ランキング/Claude 3 Sonnet
Anthropic logo

Claude 3 Sonnet

開発元 Anthropic · リリース日 2024-01-01

28.3
平均スコア
N/A
入力料金
N/A
出力料金
N/A
コンテキストウィンドウ
text
タイプ

Tested on 6 benchmarks with 28.3% average. Top scores: MMLU (67.9%), Winogrande (50.2%), GPQA diamond (20.8%).

ベンチマークカテゴリスコアBar
MMLUknowledge67.9
Winograndeknowledge50.2
GPQA diamondknowledge20.8
MATH level 5math18.2
WeirdMLcoding10.2
OTIS Mock AIME 2024-2025math2.4