Beta
OpenAI

o1-mini

por OpenAI · Lançado em 2024-01-01

31.7
pontuação média
N/A
Preço de entrada
N/A
Preço de saída
N/A
Janela de contexto
text
Tipo

Tested on 11 benchmarks with 31.7% average. Top scores: MATH level 5 (89.2%), Lech Mazur Writing (64.9%), GPQA diamond (49.8%).

Pontuações de benchmark

BenchmarkCategoriaPontuaçãoBar
MATH level 5math89.2
Lech Mazur Writingknowledge64.9
GPQA diamondknowledge49.8
OTIS Mock AIME 2024-2025math46.9
WeirdMLcoding36.3
Aider polyglotcoding32.9
ARC-AGIreasoning14.0
Cybenchcoding10.0
SimpleBenchreasoning1.7
FrontierMath-2025-02-28-Privatemath1.7
ARC-AGI-2reasoning0.8

Modelos similares