实时正在追踪来自268家提供商的976个AI模型。

BenchGecko测试版

模型976·提供商268·基准测试128·公司71·智能体165·榜首Qwen3 VL 235B A22B Instruct · 1415.8%·已更新刚刚·数据点2,902·MCP服务器4,923

Home/对比/Claude Opus 4.6 vs GPT-5.4

Claude Opus 4.6 vs GPT-5.4

并排对比，每项指标，每项基准测试。

Claude Opus 4.6

Anthropic

57.5

平均分

6/13

benchmarks

OpenAI

59.0

平均分

7/13

benchmarks

类型	Claude Opus 4.6	GPT-5.4
Provider	Anthropic	OpenAI
平均分	57.5	59.0
输入价格	$5.00	$2.50
输出价格	$25.00	$15.00
上下文窗口	1.0M tokens (~500 books)	1.1M tokens (~525 books)
发布于	2026-02-04	2026-03-05
开源	Proprietary	Proprietary

基准测试分数

13 benchmarks · Claude Opus 4.6: 6, GPT-5.4: 7

基准测试	类别	Claude Opus 4.6	GPT-5.4
APEX-Agents	agentic	31.7	35.9
ARC-AGI	reasoning	94.0	93.7
ARC-AGI-2	reasoning	69.2	74.0
Chatbot Arena Elo — Overall	arena	1496.6	1465.8
Chess Puzzles	knowledge	17.0	44.0
FrontierMath-2025-02-28-Private	math	40.7	47.6
FrontierMath-Tier-4-2025-07-01-Private	math	22.9	27.1
GPQA diamond	knowledge	87.4	91.1
OTIS Mock AIME 2024-2025	math	94.4	95.3
PostTrainBench	knowledge	23.2	20.2
SimpleQA Verified	knowledge	46.5	44.8
SWE-Bench verified	coding	78.7	76.9
WeirdML	coding	77.9	57.4

Claude Opus 4.6 GPT-5.4

More Comparisons

Claude Mythos Preview vs Claude Opus 4.6 Claude Mythos Preview vs GPT-5.4 Claude Mythos Preview vs Gemini 3.1 Pro Preview Claude Mythos Preview vs o3 Pro Claude Opus 4 vs GPT-5 Claude Opus 4.5 vs GPT-5.2 Claude Opus 4.6 vs o3 Pro Claude Sonnet 4 vs GPT-4o