Llama 3.1 70B Instruct
オープンソース開発元 Meta · リリース日 2024-07-23
37.8
平均スコア
$0.40/1M
入力料金
$0.40/1M
出力料金
131K tokens (~66 books)
コンテキストウィンドウ
text
タイプ
Tested on 16 benchmarks with 37.8% average. Top scores: Chatbot Arena Elo — Overall (1292.8%), IFEval (86.7%), MMLU (73.5%).
ベンチマークスコア
| ベンチマーク | カテゴリ | スコア | Bar |
|---|---|---|---|
| Chatbot Arena Elo — Overall | arena | 1292.8 | |
| IFEval | language | 86.7 | |
| MMLU | knowledge | 73.5 | |
| CMMLU | knowledge | 64.4 | |
| Aider — Code Editing | coding | 58.6 | |
| BBH (HuggingFace) | general | 55.9 | |
| MMLU-PRO | knowledge | 47.9 | |
| MATH Level 5 | math | 38.1 | |
| MATH level 5 | math | 36.7 | |
| Balrog | knowledge | 27.9 | |
| GPQA diamond | knowledge | 25.6 | |
| MUSR | reasoning | 17.7 | |
| GPQA | knowledge | 14.2 | |
| WeirdML | coding | 9.0 | |
| The Agent Company | agentic | 6.9 | |
| OTIS Mock AIME 2024-2025 | math | 3.5 |