Qwen-14B
オープンソース開発元 Alibaba Qwen · リリース日 2024-01-01
60.7
平均スコア
N/A
入力料金
N/A
出力料金
N/A
コンテキストウィンドウ
text
タイプ
Tested on 7 benchmarks with 60.7% average. Top scores: ARC AI2 (79.2%), LAMBADA (71.1%), GSM8K (61.3%).
ベンチマークスコア
| ベンチマーク | カテゴリ | スコア | Bar |
|---|---|---|---|
| ARC AI2 | knowledge | 79.2 | |
| LAMBADA | knowledge | 71.1 | |
| GSM8K | math | 61.3 | |
| PIQA | knowledge | 59.8 | |
| CMMLU | knowledge | 58.7 | |
| MMLU | knowledge | 55.1 | |
| BBH | reasoning | 40.0 |