Beta
Classificação/o1-preview
OpenAI

o1-preview

por OpenAI · Lançado em 2024-01-01

36.0
pontuação média
N/A
Preço de entrada
N/A
Preço de saída
N/A
Janela de contexto
text
Tipo

Tested on 7 benchmarks with 36.0% average. Top scores: MATH level 5 (81.7%), WeirdML (47.6%), GPQA diamond (33.8%).

Pontuações de benchmark

BenchmarkCategoriaPontuaçãoBar
MATH level 5math81.7
WeirdMLcoding47.6
GPQA diamondknowledge33.8
OTIS Mock AIME 2024-2025math31.0
SimpleBenchreasoning30.0
ARC-AGIreasoning18.0
Cybenchcoding10.0

Modelos similares