LIVETracking 971 AI models from 268 providers.

Models971·Providers268·Benchmarks128·Companies71·Agents165·TopQwen3 VL 235B A22B Instruct · 1415.8%·Updated2h·Data Points2,902·MCP Servers4,923

Home/Comparar/Grok 4 vs o3

Grok 4 vs o3

Lado a lado. Cada métrica. Cada benchmark.

xAI

54.8

puntuación promedio

9/19

benchmarks

o3Ganador

OpenAI

55.2

puntuación promedio

9/19

benchmarks

Tipo	Grok 4	o3
Provider	xAI	OpenAI
puntuación promedio	54.8	55.2
Precio de entrada	$3.00	$2.00
Precio de salida	$15.00	$8.00
Ventana de contexto	256K tokens (~128 books)	200K tokens (~100 books)
Publicado el	2025-07-09	2025-04-16
Código abierto	Proprietary	Proprietary

Puntuaciones de benchmark

19 benchmarks · Grok 4: 9, o3: 9

Benchmark	Categoría	Grok 4	o3
Aider polyglot	coding	79.6	81.3
ARC-AGI	reasoning	66.7	60.8
ARC-AGI-2	reasoning	16.0	6.5
DeepResearch Bench	knowledge	47.9	46.6
Fiction.LiveBench	knowledge	94.4	88.9
FrontierMath-2025-02-28-Private	math	19.7	18.7
FrontierMath-Tier-4-2025-07-01-Private	math	2.1	2.1
GeoBench	knowledge	45.0	74.0
GPQA diamond	knowledge	82.7	75.8
HELM — GPQA	knowledge	72.6	75.3
HELM — IFEval	language	94.9	86.9
HELM — MMLU-Pro	knowledge	85.1	85.9
HELM — Omni-MATH	math	60.3	71.4
HELM — WildBench	reasoning	79.7	86.1
Lech Mazur Writing	knowledge	80.7	83.9
OTIS Mock AIME 2024-2025	math	84.0	83.9
SimpleBench	reasoning	52.6	43.7
SimpleQA Verified	knowledge	47.9	53.0
WeirdML	coding	45.7	52.4

More Comparisons

Claude Mythos Preview vs Claude Opus 4.6 Claude Mythos Preview vs GPT-5.4 Claude Mythos Preview vs Gemini 3.1 Pro Preview Claude Mythos Preview vs o3 Pro Claude Opus 4 vs GPT-5 Claude Opus 4.5 vs GPT-5.2 Claude Opus 4.6 vs GPT-5.4 Claude Opus 4.6 vs o3 Pro