베타
리더보드/Claude 2.1
Anthropic logo

Claude 2.1

제공 Anthropic · 출시일 2024-01-01

21.0
평균 점수
N/A
입력 가격
N/A
출력 가격
N/A
컨텍스트 윈도우
text
유형

Tested on 4 benchmarks with 21.0% average. Top scores: MMLU (64.7%), GPQA diamond (10.6%), WeirdML (7.1%).

벤치마크카테고리점수Bar
MMLUknowledge64.7
GPQA diamondknowledge10.6
WeirdMLcoding7.1
OTIS Mock AIME 2024-2025math1.9