Beta
Anthropic

Claude 2

por Anthropic · Lançado em 2024-01-01

37.2
pontuação média
N/A
Preço de entrada
N/A
Preço de saída
N/A
Janela de contexto
text
Tipo

Tested on 5 benchmarks with 37.2% average. Top scores: TriviaQA (87.5%), MMLU (71.3%), GPQA diamond (12.9%).

Pontuações de benchmark

BenchmarkCategoriaPontuaçãoBar
TriviaQAknowledge87.5
MMLUknowledge71.3
GPQA diamondknowledge12.9
MATH level 5math11.7
OTIS Mock AIME 2024-2025math2.4

Modelos similares