Qwen3 4B Instruct 2507
オープンソース開発元 Alibaba · リリース日 2025-08-05
47.2
平均スコア
N/A
入力料金
N/A
出力料金
N/A
コンテキストウィンドウ
text-generation
タイプ
Tested on 6 benchmarks with 47.2% average. Top scores: OpenCompass — IFEval (82.4%), OpenCompass — MMLU-Pro (63.0%), OpenCompass — GPQA-Diamond (52.3%).
ベンチマークスコア
| ベンチマーク | カテゴリ | スコア | Bar |
|---|---|---|---|
| OpenCompass — IFEval | language | 82.4 | |
| OpenCompass — MMLU-Pro | knowledge | 63.0 | |
| OpenCompass — GPQA-Diamond | knowledge | 52.3 | |
| OpenCompass — AIME2025 | math | 46.9 | |
| OpenCompass — LiveCodeBenchV6 | coding | 33.5 | |
| OpenCompass — HLE | knowledge | 5.1 |
類似モデル
Alibaba
47.3
Google DeepMind
47.4
Meta
46.9
OpenAI
46.9