LIVE268개 제공업체의 976개 AI 모델 추적 중.

BenchGecko베타

모델976·제공업체268·벤치마크128·기업71·에이전트165·1위Qwen3 VL 235B A22B Instruct · 1415.8%·업데이트1시간 전·데이터 포인트2,902·MCP 서버4,923

리더보드/Claude Opus 4.1

Claude Opus 4.1

제공 Anthropic · 출시일 2025-08-05

41.3

평균 점수

$15.00/1M

입력 가격

$75.00/1M

출력 가격

200K tokens (~100 books)

컨텍스트 윈도우

multimodal

유형

Tested on 14 benchmarks with 41.3% average. Top scores: Lech Mazur Writing (85.4%), SWE-Bench verified (73.3%), GPQA diamond (69.7%).

벤치마크 점수

벤치마크	카테고리	점수	Bar
Lech Mazur Writing	knowledge	85.4
SWE-Bench verified	coding	73.3
GPQA diamond	knowledge	69.7
OTIS Mock AIME 2024-2025	math	68.9
SimpleBench	reasoning	52.0
DeepResearch Bench	knowledge	49.7
WeirdML	coding	42.8
Cybench	coding	42.0
Terminal Bench	coding	38.0
SimpleQA Verified	knowledge	34.8
FrontierMath-2025-02-28-Private	math	7.2
HLE	knowledge	7.1
FrontierMath-Tier-4-2025-07-01-Private	math	4.2
VPCT	knowledge	2.5

유사 모델

Gemini 1.5 Pro (Feb 2024)

Google DeepMind

Devstral 2 2512

Anthropic Claude Opus 타임라인

Claude 3 OpusJan 2024

N/AN/Actx8 benchmarks

Claude Opus 4May 2025

$15.00/M in200Kctx19 benchmarks

Claude Opus 4.1Aug 2025

$15.00/M in200Kctx14 benchmarks

Claude Opus 4.5Nov 2025

$5.00/M in(-10)200Kctx28 benchmarks

Claude Opus 4.6Feb 2026

$5.00/M in1.0Mctx(+800K)19 benchmarks

Claude Opus 4.6 (Fast)Apr 2026

$30.00/M in(+25)1.0Mctx12 benchmarks

Claude Opus 4.7Apr 2026

$5.00/M in(-25)1.0Mctx