Fournisseurs Pays Serveurs MCP Tendances Actualités Calculateur État

Classement/Claude 2.1

Claude 2.1

par Anthropic · Sorti le 2024-01-01

21.0

score moyen

N/A

Prix d'entrée

N/A

Prix de sortie

N/A

Fenêtre de contexte

text

Type

Tested on 4 benchmarks with 21.0% average. Top scores: MMLU (64.7%), GPQA diamond (10.6%), WeirdML (7.1%).

Scores de benchmark

Benchmark	Catégorie	Score	Bar
MMLU	knowledge	64.7
GPQA diamond	knowledge	10.6
WeirdML	coding	7.1
OTIS Mock AIME 2024-2025	math	1.9

Modèles similaires