LIVETracking 971 AI models from 268 providers.

Models971·Providers268·Benchmarks128·Companies71·Agents165·TopQwen3 VL 235B A22B Instruct · 1415.8%·Updatedjust now·Data Points2,902·MCP Servers4,923

Home/Models/Qwen3 4B Instruct 2507

Qwen3 4B Instruct 2507

by Alibaba · Released Aug 2025

Open Source

20.3

avg score

Rank #202

Better than 13% of all models

Context

N/A

Input $/1M

TBD

Output $/1M

TBD

Type

text-generation

License

Open Source

Benchmarks

6 tested

Data updated today

About

Qwen text generation model. 6219K downloads on HuggingFace.

Tested on 6 benchmarks with 47.2% average. Top scores: OpenCompass — IFEval (82.4%), OpenCompass — MMLU-Pro (63.0%), OpenCompass — GPQA-Diamond (52.3%).

Capabilities

coding

33.5

#112 globally

math

46.9

#84 globally

knowledge

40.1

#148 globally

language

82.4

#43 globally

Benchmark Scores

Tested on 6 benchmarks · Ranked across 4 categories

Score Distribution (all 231 models)

0255075100

▲ You are here

codingCompare coding →

OpenCompass — LiveCodeBenchV6

OpenCompass Live Code Bench v6. Fresh competitive programming problems to evaluate code generation without memorization.

33.5—

mathCompare math →

OpenCompass — AIME2025

OpenCompass evaluation on AIME 2025 problems. Tests mathematical reasoning on fresh competition problems.

46.9—

knowledgeCompare knowledge →

OpenCompass — MMLU-Pro

OpenCompass MMLU-Pro evaluation. Harder knowledge test with more answer choices.

63.0—

OpenCompass — GPQA-Diamond

OpenCompass evaluation of GPQA Diamond. PhD-level science questions from the hardest subset.

52.3—

OpenCompass — HLE

OpenCompass evaluation of Humanitys Last Exam. Expert-level cross-discipline knowledge test.

5.1—

Quick compare:

vs Llama 3.2 1B Instruct

Excellent (85+) Good (70-85) Average (50-70) Below (<50)

Model Family · Alibaba Qwen 3

Qwen3 0.6BApr 2025

Qwen3 0.6B FP8Apr 2025

Qwen3 1.7BApr 2025

Qwen3 1.7B BaseApr 2025

Qwen3 14B AWQMay 2025

Qwen3 30B A3B Instruct 2507 FP8Jul 2025

Qwen3 32B AWQMay 2025

Qwen3 4BApr 2025

Qwen3 4B AWQMay 2025

Qwen3 4B BaseApr 2025

Qwen3 4B Instruct 2507Aug 2025

N/AN/Actx6 benchmarks

Qwen3 4B Instruct 2507 FP8Aug 2025

Qwen3 4B Thinking 2507Aug 2025

N/AN/Actx6 benchmarks

Qwen3 8B AWQMay 2025

Qwen3 8B BaseApr 2025

Qwen3 ASR 0.6BJan 2026

Qwen3 ASR 1.7BJan 2026

Qwen3 Coder 30B A3B Instruct FP8Jul 2025

Qwen3 Coder Next FP8Feb 2026

Qwen3 Embedding 0.6BJun 2025

Qwen3 Embedding 4BJun 2025

Qwen3 Embedding 8BJun 2025

Qwen3 ForcedAligner 0.6BJan 2026

Qwen3 Reranker 0.6BMay 2025

Qwen3 Reranker 4BJun 2025

Qwen3 TTS 12Hz 0.6B BaseJan 2026

Qwen3 TTS 12Hz 0.6B CustomVoiceJan 2026

Qwen3 TTS 12Hz 1.7B CustomVoiceJan 2026

Qwen3 TTS 12Hz 1.7B VoiceDesignJan 2026

Qwen3 VL 2B InstructOct 2025

Qwen3 VL 30B A3B Instruct FP8Oct 2025

Qwen3 VL 32B Instruct FP8Oct 2025

Qwen3 VL 4B InstructOct 2025

Qwen3 VL 8B Instruct FP8Oct 2025

Qwen3 VL Embedding 2BJan 2026

Qwen3 VL Embedding 8BJan 2026

See the full Qwen 3 family →

Similar Models

Llama 3.2 1B Instruct

Links

Info

Research

Technical Report

Documentation

API Docs Playground

Community

Source Code

GitHub Hugging Face

BenchGecko API

qwen-qwen3-4b-instruct-2507

Specifications

Typetext-generation
ContextN/A
ReleasedAug 2025
LicenseOpen Source
StatusActive

Available On

AlibabaTBD

Categories

coding math knowledge language

Learn More

transformer open-weights tokens

Share & Export

Related Models

Llama 3.2 1B Instruct

Frequently Asked Questions

Qwen3 4B Instruct 2507 is an open-source text-generation AI model by Alibaba, released in August 2025. It has an average benchmark score of 20.3.

Related Models

Llama 3.2 1B Instruct · Meta INTELLECT-1 · Unknown QwQ 32B · Alibaba Qwen Vicuna 7b V1.5 · LMSYS Gemma 2 2b · Google DeepMind

Benchmarks

OpenCompass — IFEval OpenCompass — MMLU-Pro OpenCompass — GPQA-Diamond OpenCompass — AIME2025 OpenCompass — LiveCodeBenchV6

Related Pages

Alibaba · Provider All Models Compare Models