o1-mini

por OpenAI · Lançado em 2024-01-01

31.7

pontuação média

N/A

Preço de entrada

N/A

Preço de saída

N/A

Janela de contexto

text

Tipo

Tested on 11 benchmarks with 31.7% average. Top scores: MATH level 5 (89.2%), Lech Mazur Writing (64.9%), GPQA diamond (49.8%).

Pontuações de benchmark

Benchmark	Categoria	Pontuação
MATH level 5	math	89.2
Lech Mazur Writing	knowledge	64.9
GPQA diamond	knowledge	49.8
OTIS Mock AIME 2024-2025	math	46.9
WeirdML	coding	36.3
Aider polyglot	coding	32.9
ARC-AGI	reasoning	14.0
Cybench	coding	10.0
SimpleBench	reasoning	1.7
FrontierMath-2025-02-28-Private	math	1.7
ARC-AGI-2	reasoning	0.8