Qwen3 4B Thinking 2507
오픈소스제공 Alibaba · 출시일 2025-08-05
60.6
평균 점수
N/A
입력 가격
N/A
출력 가격
N/A
컨텍스트 윈도우
text-generation
유형
Tested on 6 benchmarks with 60.6% average. Top scores: OpenCompass — IFEval (88.5%), OpenCompass — AIME2025 (80.0%), OpenCompass — MMLU-Pro (72.8%).
벤치마크 점수
| 벤치마크 | 카테고리 | 점수 | Bar |
|---|---|---|---|
| OpenCompass — IFEval | language | 88.5 | |
| OpenCompass — AIME2025 | math | 80.0 | |
| OpenCompass — MMLU-Pro | knowledge | 72.8 | |
| OpenCompass — GPQA-Diamond | knowledge | 64.7 | |
| OpenCompass — LiveCodeBenchV6 | coding | 51.6 | |
| OpenCompass — HLE | knowledge | 6.0 |
유사 모델
Google DeepMind
60.6
Alibaba Qwen
60.7
Google DeepMind
60.5
OpenAI
60.4