Qwen2.5 32B Instruct
オープンソース開発元 Alibaba · リリース日 2024-09-17
43.2
平均スコア
N/A
入力料金
N/A
出力料金
N/A
コンテキストウィンドウ
text-generation
タイプ
Tested on 7 benchmarks with 43.2% average. Top scores: IFEval (83.5%), MATH Level 5 (62.5%), BBH (HuggingFace) (56.5%).
ベンチマークスコア
| ベンチマーク | カテゴリ | スコア | Bar |
|---|---|---|---|
| IFEval | language | 83.5 | |
| MATH Level 5 | math | 62.5 | |
| BBH (HuggingFace) | general | 56.5 | |
| MMLU-PRO | knowledge | 51.9 | |
| PropensityBench | safety | 22.9 | |
| MUSR | reasoning | 13.5 | |
| GPQA | knowledge | 11.7 |