Llama 3.2 90B
开源来自 Meta · 发布于 2024-01-01
36.1
平均分
N/A
输入价格
N/A
输出价格
N/A
上下文窗口
text
类型
Tested on 6 benchmarks with 36.1% average. Top scores: MMLU (73.7%), GeoBench (52.0%), MATH level 5 (39.4%).
基准测试分数
| 基准测试 | 类别 | 分数 | Bar |
|---|---|---|---|
| MMLU | knowledge | 73.7 | |
| GeoBench | knowledge | 52.0 | |
| MATH level 5 | math | 39.4 | |
| Balrog | knowledge | 27.3 | |
| GPQA diamond | knowledge | 21.4 | |
| OTIS Mock AIME 2024-2025 | math | 2.5 |
相似模型
Google DeepMind
36.0
OpenAI
35.9
Google DeepMind
36.4
OpenAI
35.6