Qwen3 4B Thinking 2507
Código abertopor Alibaba · Lançado em 2025-08-05
60.6
pontuação média
N/A
Preço de entrada
N/A
Preço de saída
N/A
Janela de contexto
text-generation
Tipo
Tested on 6 benchmarks with 60.6% average. Top scores: OpenCompass — IFEval (88.5%), OpenCompass — AIME2025 (80.0%), OpenCompass — MMLU-Pro (72.8%).
Pontuações de benchmark
| Benchmark | Categoria | Pontuação | Bar |
|---|---|---|---|
| OpenCompass — IFEval | language | 88.5 | |
| OpenCompass — AIME2025 | math | 80.0 | |
| OpenCompass — MMLU-Pro | knowledge | 72.8 | |
| OpenCompass — GPQA-Diamond | knowledge | 64.7 | |
| OpenCompass — LiveCodeBenchV6 | coding | 51.6 | |
| OpenCompass — HLE | knowledge | 6.0 |
Modelos similares
Google DeepMind
60.6
Alibaba Qwen
60.7
Google DeepMind
60.5
OpenAI
60.4