Which model leads on MATH level 5?

GPT-5 from OpenAI leads MATH level 5 with a score of 98.1. The median score across 72 tested models is 62.7.

Is MATH level 5 saturated?

Yes · the top model on MATH level 5 has reached 98.1 out of 100, within 5% of the theoretical ceiling. This benchmark is approaching saturation and may be replaced by a harder successor.

Does MATH level 5 predict performance on other benchmarks?

Yes · MATH level 5 scores correlate 0.98 with MATH Level 5 across 9 shared models. Models that do well on MATH level 5 tend to do well on MATH Level 5.

How often is MATH level 5 data refreshed?

BenchGecko pulls updates daily. New model scores on MATH level 5 appear as soon as they are published by Epoch AI or the model provider.

Benchmark · MathSettled

MATH level 5

Name: MATH level 5 Benchmark
Creator: BenchGecko
License: https://creativecommons.org/licenses/by/4.0/

MATH Level 5 · the hardest tier of the MATH benchmark, featuring competition-level problems from AMC, AIME, and Olympiad-style mathematics.

Updated 2025-10-15

Models tested

Top score

98.1

GPT-5

Median

62.7

min 3.3

Top-5 spread

σ 0.1

Settled

The Frontier

Best score over time · one chart, every benchmark

Chart type

Frontier on MATH level 5 rose from 52.6 to 98.1 in 13 months · +45.5 points · latest leader GPT-5 from OpenAI.

Pink dots = frontier records · 8 totalClick to open model page

Full rankings

72 models tested · sorted by score

#	Model	Score	Price
1	GPT-5· OpenAI	98.1	$1.25
2	GPT-5 Mini· OpenAI	97.8	$0.25
3	o4 Mini· OpenAI	97.8	$1.10
4	o3· OpenAI	97.8	$2.00
5	Claude Sonnet 4.5· Anthropic	97.7	$3.00
6	Qwen3 Max· Alibaba Qwen	97.1	$0.78
7	R1 0528· DeepSeek	96.6	$0.50
8	o3 Mini· OpenAI	96.5	$1.10
9	Claude Haiku 4.5· Anthropic	96.4	$1.00
10	Gemini 2.5 Pro· Google DeepMind	95.6	$1.25
11	GPT-5 Nano· OpenAI	95.2	$0.05
12	o1· OpenAI	94.7	$15.00
13	R1· DeepSeek	93.0	$0.70
14	Claude 3.7 Sonnet· Anthropic	91.2	$3.00
15	Grok 3 Mini· xAI	90.9	$0.30
16	o1-mini· OpenAI	89.2	—
17	Grok 3· xAI	88.8	$3.00
18	GPT-4.1 Mini· OpenAI	87.3	$0.40
19	Claude Opus 4· Anthropic	85.0	$15.00
20	Claude Sonnet 4· Anthropic	84.4	$3.00
21	Gemini 2.0 Pro· Google DeepMind	83.5	—
22	GPT-4.1· OpenAI	83.0	$2.00
23	Gemini 2.0 Flash· Google DeepMind	82.2	$0.10
24	o1-preview· OpenAI	81.7	—
25	Mistral Medium 3· Mistral AI	81.6	$0.40
26	GPT-4.5· OpenAI	78.6	—
27	Gemma 3 27B· Google DeepMind	74.0	$0.08
28	Gemma 3 27B (free)· Google DeepMind	74.0	$0.00
29	Llama 4 Maverick· Meta	73.0	$0.15
30	GPT-4.1 Nano· OpenAI	70.0	$0.10
31	Qwen3 235B A22B· Alibaba Qwen	68.9	$0.46
32	Qwen2.5-Max· Alibaba Qwen	67.2	—
33	Phi 4· Microsoft	64.9	$0.07
34	DeepSeek V3· DeepSeek	64.8	$0.32
35	Grok-2 (Dec 2024)· xAI	63.5	—
36	Qwen2.5 72B Instruct· Alibaba Qwen	63.2	$0.36
37	Llama 4 Scout· Meta	62.3	$0.08
38	GPT-4o (2024-08-06)· OpenAI	53.3	$2.50
39	GPT-4o (2024-11-20)· OpenAI	53.3	$2.50
40	GPT-4o-mini· OpenAI	52.6	$0.15
41	GPT-4o-mini (2024-07-18)· OpenAI	52.6	$0.15
42	Claude 3.5 Sonnet· Anthropic	51.7	—
43	GPT-4o (2024-05-13)· OpenAI	51.0	$5.00
44	Mistral Large 2411· Mistral AI	50.3	$2.00
45	Llama 3.1 405B· Meta	49.8	—
46	Claude 3.5 Haiku· Anthropic	46.4	$0.80
47	Mistral Large 2407· Mistral AI	44.8	$2.00
48	Llama 3.3 70B Instruct (free)· Meta	41.6	$0.00
49	Gemini 1.5 Pro (Feb 2024)· Google DeepMind	40.8	—
50	Llama 3.2 90B· Meta	39.4	—
51	Qwen2-72B· Alibaba Qwen	39.1	—
52	Claude 3 Opus· Anthropic	37.5	—
53	Llama 3.1 70B Instruct· Meta	36.7	$0.40
54	Gemma 2 27B· Google DeepMind	27.9	$0.65
55	Gemini 1.5 Flash (May 2024)· Google DeepMind	25.1	—
56	Mistral Large· Mistral AI	24.5	$2.00
57	Mixtral 8x22B Instruct· Mistral AI	24.2	$2.00
58	GPT-4 Turbo· OpenAI	23.0	$10.00
59	Llama 3.1 8B Instruct· Meta	22.9	$0.02
60	Llama 3 70B Instruct· Meta	22.6	$0.51
61	Gemma 2 9B· Google DeepMind	21.0	$0.03
62	Claude 3 Sonnet· Anthropic	18.2	—
63	phi-3-medium 14B· Microsoft	17.6	—
64	Claude 3 Haiku· Anthropic	14.9	$0.25
65	Claude 2· Anthropic	11.7	—
66	GPT-3.5 Turbo (older v0613)· OpenAI	11.6	$1.00
67	Gemini 1.0 Pro· Google DeepMind	11.2	—
68	Mistral Nemo· Mistral AI	10.8	$0.02
69	Mixtral 8x7B Instruct· Mistral AI	9.9	$0.54
70	Llama 3 8B Instruct· Meta	6.1	$0.03
71	U Yi 6B· Unknown	5.2	—
72	Llama 2-13B· Meta	3.3	—