Compare · ModelsLive · 2 picked · head to head

Grok 4 vs gpt-oss-20b

Side by side · benchmarks, pricing, and signals you can act on.

CiteAdd another

Winner summary

Grok 4 wins on 5/5 benchmarks

Grok 4 wins 5 of 5 shared benchmarks. Leads in knowledge · language · math.

Category leads

knowledge·Grok 4language·Grok 4math·Grok 4reasoning·Grok 4

Hype vs Reality

Attention vs performance

Grok 4

#73 by perf·no signal

QUIET

gpt-oss-20b

#24 by perf·no signal

QUIET

See full mindshare →

Best value

gpt-oss-20b

130.2x better value than Grok 4

Grok 4

6.1 pts/$

$9.00/M

gpt-oss-20b

792.9 pts/$

$0.09/M

Explore pricing →

Vendor risk

Who is behind the model

xAI

$250.0B·Tier 1

Medium risk

OpenAI

$840.0B·Tier 1

Medium risk

See the AI economy →

Head to head

5 benchmarks · 2 models

Grok 4gpt-oss-20b

HELM · GPQA

Grok 4 leads by +13.2

Grok 4

72.6

gpt-oss-20b

59.4

HELM · IFEval

Grok 4 leads by +21.7

Grok 4

94.9

gpt-oss-20b

73.2

HELM · MMLU-Pro

Grok 4 leads by +11.1

Grok 4

85.1

gpt-oss-20b

74.0

HELM · Omni-MATH

Grok 4 leads by +3.8

Grok 4

60.3

gpt-oss-20b

56.5

HELM · WildBench

Grok 4 leads by +6.0

Grok 4

79.7

gpt-oss-20b

73.7

Full benchmark table

Benchmark	Grok 4	gpt-oss-20b
HELM · GPQA	72.6	59.4
HELM · IFEval	94.9	73.2
HELM · MMLU-Pro	85.1	74.0
HELM · Omni-MATH	60.3	56.5
HELM · WildBench	79.7	73.7

Pricing · per 1M tokens · projected $/mo at 10M tokens

Model	Input	Output	Context	Projected $/mo
Grok 4	$3.00	$15.00	256K tokens (~128 books)	$60.00
gpt-oss-20b	$0.03	$0.14	131K tokens (~66 books)	$0.57

People also compared

Claude Sonnet 4.5 vs Grok 4 Grok 4 vs o3 GLM 4.5 vs gpt-oss-20b gpt-oss-20b vs phi-3-small 7.4B gpt-oss-20b vs Qwen3 30B A3B Thinking 2507 Grok 3 Beta vs Grok 4 Grok 3 Mini Beta vs Grok 4 Grok 3 Mini vs Grok 4