Rangliste/o1-preview

o1-preview

Name: o1-preview
Author: OpenAI

von OpenAI · Veroeffentlicht 2024-01-01

41.5

Durchschn. Score

N/A

Eingabepreis

N/A

Ausgabepreis

N/A

Kontextfenster

text

Typ

Tested on 9 benchmarks with 41.5% average. Top scores: Chatbot Arena Elo — Overall (1387.7%), MATH level 5 (81.7%), Aider — Code Editing (79.7%).

Benchmark-Ergebnisse

Benchmark	Kategorie	Score
Chatbot Arena Elo — Overall	arena	1387.7
MATH level 5	math	81.7
Aider — Code Editing	coding	79.7
WeirdML	coding	47.6
GPQA diamond	knowledge	33.8
OTIS Mock AIME 2024-2025	math	31.0
SimpleBench	reasoning	30.0
ARC-AGI	reasoning	18.0
Cybench	coding	10.0