Qwen-14B
Code source ouvertpar Alibaba · Sorti le 2024-01-01
61.1
score moyen
N/A
Prix d'entrée
N/A
Prix de sortie
N/A
Fenêtre de contexte
text
Type
Tested on 6 benchmarks with 61.1% average. Top scores: ARC AI2 (79.2%), LAMBADA (71.1%), GSM8K (61.3%).
Scores de benchmark
| Benchmark | Catégorie | Score | Bar |
|---|---|---|---|
| ARC AI2 | knowledge | 79.2 | |
| LAMBADA | knowledge | 71.1 | |
| GSM8K | math | 61.3 | |
| PIQA | knowledge | 59.8 | |
| MMLU | knowledge | 55.1 | |
| BBH | reasoning | 40.0 |