Qwen3 4B Instruct 2507
오픈소스제공 Alibaba · 출시일 2025-08-05
47.2
평균 점수
N/A
입력 가격
N/A
출력 가격
N/A
컨텍스트 윈도우
text-generation
유형
Tested on 6 benchmarks with 47.2% average. Top scores: OpenCompass — IFEval (82.4%), OpenCompass — MMLU-Pro (63.0%), OpenCompass — GPQA-Diamond (52.3%).
벤치마크 점수
| 벤치마크 | 카테고리 | 점수 | Bar |
|---|---|---|---|
| OpenCompass — IFEval | language | 82.4 | |
| OpenCompass — MMLU-Pro | knowledge | 63.0 | |
| OpenCompass — GPQA-Diamond | knowledge | 52.3 | |
| OpenCompass — AIME2025 | math | 46.9 | |
| OpenCompass — LiveCodeBenchV6 | coding | 33.5 | |
| OpenCompass — HLE | knowledge | 5.1 |
유사 모델
Alibaba
47.3
Google DeepMind
47.4
Meta
46.9
OpenAI
46.9