Beta
Classificação/Claude 3 Sonnet
Anthropic

Claude 3 Sonnet

por Anthropic · Lançado em 2024-01-01

28.3
pontuação média
N/A
Preço de entrada
N/A
Preço de saída
N/A
Janela de contexto
text
Tipo

Tested on 6 benchmarks with 28.3% average. Top scores: MMLU (67.9%), Winogrande (50.2%), GPQA diamond (20.8%).

Pontuações de benchmark

BenchmarkCategoriaPontuaçãoBar
MMLUknowledge67.9
Winograndeknowledge50.2
GPQA diamondknowledge20.8
MATH level 5math18.2
WeirdMLcoding10.2
OTIS Mock AIME 2024-2025math2.4

Modelos similares