Beta
Home/Comparar/Claude 3.5 Sonnet vs o1

Claude 3.5 Sonnet vs o1

Lado a lado. Cada métrica. Cada benchmark.

Anthropic
42.3
puntuación promedio
1/11
benchmarks
OpenAI logoo1Ganador
OpenAI
56.4
puntuación promedio
9/11
benchmarks
TipoClaude 3.5 Sonneto1
ProviderAnthropic logoAnthropicOpenAI logoOpenAI
puntuación promedio42.356.4
Precio de entrada-$15.00
Precio de salida-$60.00
Ventana de contexto-200K tokens (~100 books)
Publicado el2024-01-012024-12-17
Código abiertoProprietaryProprietary

11 benchmarks · Claude 3.5 Sonnet: 1, o1: 9

BenchmarkCategoríaClaude 3.5 Sonneto1
Aider — Code Editingcoding84.284.2
Aider polyglotcoding51.661.7
CadEvalcoding48.056.0
FrontierMath-2025-02-28-Privatemath1.09.3
GeoBenchknowledge62.080.0
GPQA diamondknowledge38.769.0
Lech Mazur Writingknowledge80.370.2
MATH level 5math51.794.7
OTIS Mock AIME 2024-2025math6.473.3
SimpleBenchreasoning13.028.1
WeirdMLcoding31.043.8