Classifica/Claude 2.1

Claude 2.1

Name: Claude 2.1
Author: Anthropic

di Anthropic · Rilascio 2024-01-01

21.0

punteggio medio

N/A

Prezzo Input

N/A

Prezzo Output

N/A

Finestra di Contesto

text

Tipo

Tested on 4 benchmarks with 21.0% average. Top scores: MMLU (64.7%), GPQA diamond (10.6%), WeirdML (7.1%).

Punteggi Benchmark

Benchmark	Categoria	Punteggio
MMLU	knowledge	64.7
GPQA diamond	knowledge	10.6
WeirdML	coding	7.1
OTIS Mock AIME 2024-2025	math	1.9