Classifica/o1-preview

o1-preview

Name: o1-preview
Author: OpenAI

di OpenAI · Rilascio 2024-01-01

41.5

punteggio medio

N/A

Prezzo Input

N/A

Prezzo Output

N/A

Finestra di Contesto

text

Tipo

Tested on 9 benchmarks with 41.5% average. Top scores: Chatbot Arena Elo — Overall (1387.7%), MATH level 5 (81.7%), Aider — Code Editing (79.7%).

Punteggi Benchmark

Benchmark	Categoria	Punteggio
Chatbot Arena Elo — Overall	arena	1387.7
MATH level 5	math	81.7
Aider — Code Editing	coding	79.7
WeirdML	coding	47.6
GPQA diamond	knowledge	33.8
OTIS Mock AIME 2024-2025	math	31.0
SimpleBench	reasoning	30.0
ARC-AGI	reasoning	18.0
Cybench	coding	10.0