Qwen3 4B Instruct 2507
Código abertopor Alibaba · Lançado em 2025-08-05
47.2
pontuação média
N/A
Preço de entrada
N/A
Preço de saída
N/A
Janela de contexto
text-generation
Tipo
Tested on 6 benchmarks with 47.2% average. Top scores: OpenCompass — IFEval (82.4%), OpenCompass — MMLU-Pro (63.0%), OpenCompass — GPQA-Diamond (52.3%).
Pontuações de benchmark
| Benchmark | Categoria | Pontuação | Bar |
|---|---|---|---|
| OpenCompass — IFEval | language | 82.4 | |
| OpenCompass — MMLU-Pro | knowledge | 63.0 | |
| OpenCompass — GPQA-Diamond | knowledge | 52.3 | |
| OpenCompass — AIME2025 | math | 46.9 | |
| OpenCompass — LiveCodeBenchV6 | coding | 33.5 | |
| OpenCompass — HLE | knowledge | 5.1 |
Modelos similares
Alibaba
47.3
Google DeepMind
47.4
Meta
46.9
OpenAI
46.9