Classifica/Qwen2.5-Max

Qwen2.5-Max

Name: Qwen2.5-Max
Author: Alibaba Qwen

Open Source

di Alibaba Qwen · Rilascio 2024-01-01

41.0

punteggio medio

N/A

Prezzo Input

N/A

Prezzo Output

N/A

Finestra di Contesto

text

Tipo

Tested on 8 benchmarks with 41.0% average. Top scores: Chatbot Arena Elo — Overall (1374.2%), Lech Mazur Writing (72.9%), MATH level 5 (67.2%).

Punteggi Benchmark

Benchmark	Categoria	Punteggio
Chatbot Arena Elo — Overall	arena	1374.2
Lech Mazur Writing	knowledge	72.9
MATH level 5	math	67.2
Fiction.LiveBench	knowledge	66.7
GPQA diamond	knowledge	41.5
Aider polyglot	coding	21.8
OTIS Mock AIME 2024-2025	math	16.0
FrontierMath-2025-02-28-Private	math	1.0