ベータ
U

MPT-30B

開発元 Unknown · リリース日 2024-01-01

31.7
平均スコア
N/A
入力料金
N/A
出力料金
N/A
コンテキストウィンドウ
text
タイプ

Tested on 16 benchmarks with 31.7% average. Top scores: TriviaQA (73.6%), LAMBADA (70.0%), HellaSwag (68.5%).

ベンチマークカテゴリスコアBar
TriviaQAknowledge73.6
LAMBADAknowledge70.0
HellaSwagknowledge68.5
PIQAknowledge63.8
Winograndeknowledge42.0
OpenBookQAknowledge36.0
GSM8Kmath34.4
ARC AI2knowledge34.1
MMLUknowledge30.5
IFEvallanguage21.5
BBHreasoning17.3
BBH (HuggingFace)general6.5
MUSRreasoning2.9
MMLU-PROknowledge2.3
MATH Level 5math1.6
GPQAknowledge1.3