排行榜/Claude Sonnet 4

Claude Sonnet 4

Name: Claude Sonnet 4
Price: 3 USD
Author: Anthropic

来自 Anthropic · 发布于 2025-05-22

44.6

平均分

$3.00/1M

输入价格

$15.00/1M

输出价格

1.0M tokens (~500 books)

上下文窗口

multimodal

类型

Tested on 27 benchmarks with 44.6% average. Top scores: MASK (95.3%), OpenCompass — IFEval (88.3%), MATH level 5 (84.4%).

基准测试分数

基准测试	类别	分数
MASK	safety	95.3
OpenCompass — IFEval	language	88.3
MATH level 5	math	84.4
OpenCompass — MMLU-Pro	knowledge	83.0
OpenCompass — GPQA-Diamond	knowledge	74.6
GPQA diamond	knowledge	72.3
OTIS Mock AIME 2024-2025	math	71.1
OpenCompass — AIME2025	math	68.7
SWE-Bench Verified (Bash Only)	coding	64.9
Aider polyglot	coding	61.3
DeepResearch Bench	knowledge	47.8
OpenCompass — LiveCodeBenchV6	coding	47.5
Fiction.LiveBench	knowledge	46.9
WeirdML	coding	46.1
OSWorld	agentic	43.9
ARC-AGI	reasoning	40.0
GeoBench	knowledge	37.0
Cybench	coding	35.0
SimpleBench	reasoning	34.6
The Agent Company	agentic	33.1
OpenCompass — HLE	knowledge	8.7
ARC-AGI-2	reasoning	5.9
GSO-Bench	coding	4.9
FrontierMath-2025-02-28-Private	math	4.1
HLE	knowledge	3.1
VPCT	knowledge	1.0
FrontierMath-Tier-4-2025-07-01-Private	math	0.1