Qwen2.5 32B Instruct
Código abertopor Alibaba · Lançado em 2024-09-17
43.2
pontuação média
N/A
Preço de entrada
N/A
Preço de saída
N/A
Janela de contexto
text-generation
Tipo
Tested on 7 benchmarks with 43.2% average. Top scores: IFEval (83.5%), MATH Level 5 (62.5%), BBH (HuggingFace) (56.5%).
Pontuações de benchmark
| Benchmark | Categoria | Pontuação | Bar |
|---|---|---|---|
| IFEval | language | 83.5 | |
| MATH Level 5 | math | 62.5 | |
| BBH (HuggingFace) | general | 56.5 | |
| MMLU-PRO | knowledge | 51.9 | |
| PropensityBench | safety | 22.9 | |
| MUSR | reasoning | 13.5 | |
| GPQA | knowledge | 11.7 |