Mistral Large 2411
オープンソース開発元 Mistral AI · リリース日 2024-11-19
45.8
平均スコア
$2.00/1M
入力料金
$6.00/1M
出力料金
131K tokens (~66 books)
コンテキストウィンドウ
text
タイプ
Tested on 11 benchmarks with 45.8% average. Top scores: Chatbot Arena Elo — Overall (1304.7%), HELM — IFEval (87.6%), HELM — WildBench (80.1%).
ベンチマークスコア
| ベンチマーク | カテゴリ | スコア | Bar |
|---|---|---|---|
| Chatbot Arena Elo — Overall | arena | 1304.7 | |
| HELM — IFEval | language | 87.6 | |
| HELM — WildBench | reasoning | 80.1 | |
| Aider — Code Editing | coding | 65.4 | |
| HELM — MMLU-Pro | knowledge | 59.9 | |
| MATH level 5 | math | 50.3 | |
| HELM — GPQA | knowledge | 43.5 | |
| GPQA diamond | knowledge | 35.1 | |
| HELM — Omni-MATH | math | 28.1 | |
| OTIS Mock AIME 2024-2025 | math | 7.7 | |
| FrontierMath-2025-02-28-Private | math | 0.3 |