ベータ
ランキング/Claude Mythos Preview
Anthropic logo

Claude Mythos Preview

開発元 Anthropic · リリース日 2026-04-07

81.8
平均スコア
N/A
入力料金
N/A
出力料金
1.0M tokens (~500 books)
コンテキストウィンドウ
text
タイプ

Tested on 14 benchmarks with 81.8% average. Top scores: USAMO (97.6%), GPQA diamond (94.5%), SWE-Bench verified (93.9%).

ベンチマークカテゴリスコアBar
USAMOmath97.6
GPQA diamondknowledge94.5
SWE-Bench verifiedcoding93.9
CharXiv Reasoning (with tools)reasoning93.2
MMMLUknowledge92.7
SWE-bench Multilingualcoding87.3
CharXiv Reasoningreasoning86.1
Terminal Benchcoding82.0
GraphWalks BFS 256K-1Mreasoning80.0
OSWorldagentic79.6
SWE-bench Procoding77.8
HLE (with tools)reasoning64.7
SWE-bench Multimodalcoding59.0
HLEknowledge56.8