Classificação/Grok-2 (Dec 2024)

Grok-2 (Dec 2024)

por xAI · Lançado em 2024-01-01

29.6

pontuação média

N/A

Preço de entrada

N/A

Preço de saída

N/A

Janela de contexto

text

Tipo

Tested on 7 benchmarks with 29.6% average. Top scores: Lech Mazur Writing (63.6%), MATH level 5 (63.5%), GPQA diamond (38.4%).

Pontuações de benchmark

Benchmark	Categoria	Pontuação
Lech Mazur Writing	knowledge	63.6
MATH level 5	math	63.5
GPQA diamond	knowledge	38.4
WeirdML	coding	22.2
OTIS Mock AIME 2024-2025	math	11.4
SimpleBench	reasoning	7.2
FrontierMath-2025-02-28-Private	math	0.7