LLaMA-65B
Código abertopor Meta · Lançado em 2024-01-01
61.9
pontuação média
N/A
Preço de entrada
N/A
Preço de saída
N/A
Janela de contexto
text
Tipo
Tested on 10 benchmarks with 61.9% average. Top scores: TriviaQA (86.0%), HellaSwag (78.9%), LAMBADA (77.7%).
Pontuações de benchmark
| Benchmark | Categoria | Pontuação | Bar |
|---|---|---|---|
| TriviaQA | knowledge | 86.0 | |
| HellaSwag | knowledge | 78.9 | |
| LAMBADA | knowledge | 77.7 | |
| PIQA | knowledge | 65.6 | |
| ARC AI2 | knowledge | 59.3 | |
| GSM8K | math | 54.4 | |
| Winogrande | knowledge | 54.0 | |
| MMLU | knowledge | 51.2 | |
| OpenBookQA | knowledge | 46.9 | |
| BBH | reasoning | 44.5 |