Qwen-7B
Code source ouvertpar Alibaba · Sorti le 2024-01-01
49.3
score moyen
N/A
Prix d'entrée
N/A
Prix de sortie
N/A
Fenêtre de contexte
text
Type
Tested on 6 benchmarks with 49.3% average. Top scores: LAMBADA (67.9%), ARC AI2 (67.1%), PIQA (55.8%).
Scores de benchmark
| Benchmark | Catégorie | Score | Bar |
|---|---|---|---|
| LAMBADA | knowledge | 67.9 | |
| ARC AI2 | knowledge | 67.1 | |
| PIQA | knowledge | 55.8 | |
| GSM8K | math | 51.7 | |
| BBH | reasoning | 26.7 | |
| MMLU | knowledge | 26.7 |