Compare · ModelsLive · 2 picked · head to head

GPT-4.1 vs gpt-oss-20b

Side by side · benchmarks, pricing, and signals you can act on.

CiteAdd another

Winner summary

GPT-4.1 wins on 4/5 benchmarks

GPT-4.1 wins 4 of 5 shared benchmarks. Leads in knowledge · language · reasoning.

Category leads

knowledge·GPT-4.1language·GPT-4.1math·gpt-oss-20breasoning·GPT-4.1

Hype vs Reality

Attention vs performance

GPT-4.1

#123 by perf·no signal

QUIET

gpt-oss-20b

#24 by perf·no signal

QUIET

See full mindshare →

Best value

gpt-oss-20b

91.6x better value than GPT-4.1

GPT-4.1

8.7 pts/$

$5.00/M

gpt-oss-20b

792.9 pts/$

$0.09/M

Explore pricing →

Vendor risk

Who is behind the model

OpenAI

$840.0B·Tier 1

Medium risk

OpenAI

$840.0B·Tier 1

Medium risk

See the AI economy →

Head to head

5 benchmarks · 2 models

GPT-4.1gpt-oss-20b

HELM · GPQA

GPT-4.1 leads by +6.5

GPT-4.1

65.9

gpt-oss-20b

59.4

HELM · IFEval

GPT-4.1 leads by +10.6

GPT-4.1

83.8

gpt-oss-20b

73.2

HELM · MMLU-Pro

GPT-4.1 leads by +7.1

GPT-4.1

81.1

gpt-oss-20b

74.0

HELM · Omni-MATH

gpt-oss-20b leads by +9.4

GPT-4.1

47.1

gpt-oss-20b

56.5

HELM · WildBench

GPT-4.1 leads by +11.7

GPT-4.1

85.4

gpt-oss-20b

73.7

Full benchmark table

Benchmark	GPT-4.1	gpt-oss-20b
HELM · GPQA	65.9	59.4
HELM · IFEval	83.8	73.2
HELM · MMLU-Pro	81.1	74.0
HELM · Omni-MATH	47.1	56.5
HELM · WildBench	85.4	73.7

Pricing · per 1M tokens · projected $/mo at 10M tokens

Model	Input	Output	Context	Projected $/mo
GPT-4.1	$2.00	$8.00	1.0M tokens (~524 books)	$35.00
gpt-oss-20b	$0.03	$0.14	131K tokens (~66 books)	$0.57

People also compared

GPT-4.1 vs Llama 4 Maverick DeepSeek V3.1 vs GPT-4.1 GPT-4.1 vs Qwen3 Coder 480B A35B GLM 4.5 vs gpt-oss-20b gpt-oss-20b vs phi-3-small 7.4B gpt-oss-20b vs Qwen3 30B A3B Thinking 2507