U
Baichuan2-13B
por unknown · Lançado em 2024-01-01
48.4
pontuação média
N/A
Preço de entrada
N/A
Preço de saída
N/A
Janela de contexto
text
Tipo
Tested on 7 benchmarks with 48.4% average. Top scores: LAMBADA (74.0%), HellaSwag (61.1%), PIQA (56.2%).
Pontuações de benchmark
| Benchmark | Categoria | Pontuação | Bar |
|---|---|---|---|
| LAMBADA | knowledge | 74.0 | |
| HellaSwag | knowledge | 61.1 | |
| PIQA | knowledge | 56.2 | |
| GSM8K | math | 52.8 | |
| MMLU | knowledge | 45.6 | |
| BBH | reasoning | 32.0 | |
| ARC AI2 | knowledge | 17.3 |