Beta
Classement/Claude 2.1
Anthropic

Claude 2.1

par Anthropic · Sorti le 2024-01-01

21.0
score moyen
N/A
Prix d'entrée
N/A
Prix de sortie
N/A
Fenêtre de contexte
text
Type

Tested on 4 benchmarks with 21.0% average. Top scores: MMLU (64.7%), GPQA diamond (10.6%), WeirdML (7.1%).

Scores de benchmark

BenchmarkCatégorieScoreBar
MMLUknowledge64.7
GPQA diamondknowledge10.6
WeirdMLcoding7.1
OTIS Mock AIME 2024-2025math1.9

Modèles similaires