Home/Comparer/Claude Sonnet 4.5 vs GPT-5

Claude Sonnet 4.5 vs GPT-5

Côte à côte. Chaque métrique. Chaque benchmark.

Anthropic

42.1

score moyen

3/18

benchmarks

GPT-5Gagnant

OpenAI

54.4

score moyen

15/18

benchmarks

Scores de benchmark

18 benchmarks · Claude Sonnet 4.5: 3, GPT-5: 15

Benchmark	Catégorie	Claude Sonnet 4.5	GPT-5
ARC-AGI	reasoning	63.7	65.7
ARC-AGI-2	reasoning	13.6	9.9
Chess Puzzles	knowledge	12.0	37.0
DeepResearch Bench	knowledge	52.6	55.1
FrontierMath-2025-02-28-Private	math	15.2	32.4
FrontierMath-Tier-4-2025-07-01-Private	math	4.2	12.5
GPQA diamond	knowledge	76.4	81.6
GSO-Bench	coding	14.7	6.9
HLE	knowledge	9.4	21.6
MATH level 5	math	97.7	98.1
OTIS Mock AIME 2024-2025	math	77.8	91.4
SimpleBench	reasoning	45.2	48.0
SimpleQA Verified	knowledge	23.6	50.6
SWE-Bench verified	coding	71.3	73.5
SWE-Bench Verified (Bash Only)	coding	70.6	65.0
Terminal Bench	coding	46.5	49.6
VPCT	knowledge	9.7	49.0
WeirdML	coding	47.7	60.7