ベータ
ランキング/INTELLECT-1
U

INTELLECT-1

開発元 Unknown · リリース日 2024-01-01

20.2
平均スコア
N/A
入力料金
N/A
出力料金
N/A
コンテキストウィンドウ
text
タイプ

Tested on 12 benchmarks with 20.2% average. Top scores: HellaSwag (61.9%), ARC AI2 (39.4%), GSM8K (38.6%).

ベンチマークカテゴリスコアBar
HellaSwagknowledge61.9
ARC AI2knowledge39.4
GSM8Kmath38.6
MMLUknowledge33.2
Winograndeknowledge31.6
IFEvallanguage17.6
BBHreasoning13.1
MUSRreasoning4.1
MMLU-PROknowledge1.3
BBH (HuggingFace)general1.0
MATH Level 5math0.0
GPQAknowledge0.0