ベータ
ランキング/Claude 2.1
Anthropic logo

Claude 2.1

開発元 Anthropic · リリース日 2024-01-01

21.0
平均スコア
N/A
入力料金
N/A
出力料金
N/A
コンテキストウィンドウ
text
タイプ

Tested on 4 benchmarks with 21.0% average. Top scores: MMLU (64.7%), GPQA diamond (10.6%), WeirdML (7.1%).

ベンチマークカテゴリスコアBar
MMLUknowledge64.7
GPQA diamondknowledge10.6
WeirdMLcoding7.1
OTIS Mock AIME 2024-2025math1.9