Claude 3 Opus

por Anthropic · Lançado em 2024-01-01

33.7

pontuação média

N/A

Preço de entrada

N/A

Preço de saída

N/A

Janela de contexto

text

Tipo

Tested on 8 benchmarks with 33.7% average. Top scores: MMLU (79.5%), Winogrande (77.0%), MATH level 5 (37.5%).

Pontuações de benchmark

Benchmark	Categoria	Pontuação
MMLU	knowledge	79.5
Winogrande	knowledge	77.0
MATH level 5	math	37.5
GPQA diamond	knowledge	29.6
WeirdML	coding	23.2
Cybench	coding	10.0
SimpleBench	reasoning	8.2
OTIS Mock AIME 2024-2025	math	4.6