R1 vs o1
Lado a lado. Cada métrica. Cada benchmark.
| Tipo | R1 | o1 |
|---|---|---|
| Provider | ||
| pontuação média | 45.1 | 56.4 |
| Preço de entrada | $0.70 | $15.00 |
| Preço de saída | $2.50 | $60.00 |
| Janela de contexto | 64K tokens (~32 books) | 200K tokens (~100 books) |
| Lançado em | 2025-01-20 | 2024-12-17 |
| Código aberto | Open Source | Proprietary |
Pontuações de benchmark
9 benchmarks · R1: 1, o1: 8
| Benchmark | Categoria | R1 | o1 |
|---|---|---|---|
| Aider polyglot | coding | 56.9 | 61.7 |
| ARC-AGI | reasoning | 15.8 | 30.7 |
| Fiction.LiveBench | knowledge | 69.4 | 83.3 |
| GPQA diamond | knowledge | 62.3 | 69.0 |
| Lech Mazur Writing | knowledge | 83.0 | 70.2 |
| MATH level 5 | math | 93.0 | 94.7 |
| OTIS Mock AIME 2024-2025 | math | 53.3 | 73.3 |
| SimpleBench | reasoning | 17.1 | 28.1 |
| WeirdML | coding | 36.5 | 43.8 |