DeepSeek R1 Distill Qwen 14B
オープンソース開発元 DeepSeek · リリース日 2025-01-20
56.0
平均スコア
N/A
入力料金
N/A
出力料金
N/A
コンテキストウィンドウ
text-generation
タイプ
Tested on 11 benchmarks with 56.0% average. Top scores: JCommonsenseQA (93.7%), JSQuAD (89.8%), JNLI (82.4%).
ベンチマークスコア
| ベンチマーク | カテゴリ | スコア | Bar |
|---|---|---|---|
| JCommonsenseQA | language | 93.7 | |
| JSQuAD | language | 89.8 | |
| JNLI | language | 82.4 | |
| JMMLU | language | 63.4 | |
| MATH Level 5 | math | 57.0 | |
| LLM-JP — Overall | language | 56.8 | |
| IFEval | language | 43.8 | |
| MMLU-PRO | knowledge | 40.7 | |
| BBH (HuggingFace) | general | 40.7 | |
| MUSR | reasoning | 28.7 | |
| GPQA | knowledge | 18.3 |