리더보드/GPT-5.1

GPT-5.1

Name: GPT-5.1
Price: 1.25 USD
Author: OpenAI

제공 OpenAI · 출시일 2025-11-13

49.6

평균 점수

$1.25/1M

입력 가격

$10.00/1M

출력 가격

400K tokens (~200 books)

컨텍스트 윈도우

multimodal

유형

Tested on 24 benchmarks with 49.6% average. Top scores: Chatbot Arena Elo — Overall (1438.5%), Chatbot Arena Elo — Coding (1338.8%), HELM — IFEval (93.5%).

벤치마크 점수

벤치마크	카테고리	점수
Chatbot Arena Elo — Overall	arena	1438.5
Chatbot Arena Elo — Coding	arena	1338.8
HELM — IFEval	language	93.5
OTIS Mock AIME 2024-2025	math	88.6
HELM — WildBench	reasoning	86.3
GPQA diamond	knowledge	83.5
ARC-AGI	reasoning	72.8
SWE-Bench verified	coding	68.0
SWE-Bench Verified (Bash Only)	coding	66.0
WeirdML	coding	60.8
HELM — MMLU-Pro	knowledge	57.9
SimpleQA Verified	knowledge	48.9
Terminal Bench	coding	47.6
HELM — Omni-MATH	math	46.4
HELM — GPQA	knowledge	44.2
SimpleBench	reasoning	43.8
VPCT	knowledge	38.0
Chess Puzzles	knowledge	32.0
FrontierMath-2025-02-28-Private	math	31.0
HLE	knowledge	19.8
ARC-AGI-2	reasoning	17.6
APEX-Agents	agentic	17.5
GSO-Bench	coding	13.7
FrontierMath-Tier-4-2025-07-01-Private	math	12.5