LIVE268社のプ��バイダーから976のAIモデルを追跡中。

BenchGeckoベータ

モデル976·プロバイダー268·ベンチマーク128·企業71·エージェント165·トップQwen3 VL 235B A22B Instruct · 1415.8%·更新たった今·データポイント2,902·MCPサーバー4,923

ランキング/Qwen3 4B Thinking 2507

Qwen3 4B Thinking 2507

オープンソース

開発元 Alibaba · リリース日 2025-08-05

60.6

平均スコア

N/A

入力料金

N/A

出力料金

N/A

コンテキストウィンドウ

text-generation

タイプ

Tested on 6 benchmarks with 60.6% average. Top scores: OpenCompass — IFEval (88.5%), OpenCompass — AIME2025 (80.0%), OpenCompass — MMLU-Pro (72.8%).

ベンチマークスコア

ベンチマーク	カテゴリ	スコア	Bar
OpenCompass — IFEval	language	88.5
OpenCompass — AIME2025	math	80.0
OpenCompass — MMLU-Pro	knowledge	72.8
OpenCompass — GPQA-Diamond	knowledge	64.7
OpenCompass — LiveCodeBenchV6	coding	51.6
OpenCompass — HLE	knowledge	6.0

類似モデル

Gemini 3.1 Pro Preview

Google DeepMind

Google DeepMind

GPT-5.1-Codex-Mini

Alibaba Qwen 3 タイムライン

Qwen3 0.6BApr 2025

Qwen3 0.6B FP8Apr 2025

Qwen3 1.7BApr 2025

Qwen3 1.7B BaseApr 2025

Qwen3 14B AWQMay 2025

Qwen3 30B A3B Instruct 2507 FP8Jul 2025

Qwen3 32B AWQMay 2025

Qwen3 4BApr 2025

Qwen3 4B AWQMay 2025

Qwen3 4B BaseApr 2025

Qwen3 4B Instruct 2507Aug 2025

N/AN/Actx6 benchmarks

Qwen3 4B Instruct 2507 FP8Aug 2025

Qwen3 4B Thinking 2507Aug 2025

N/AN/Actx6 benchmarks

Qwen3 8B AWQMay 2025

Qwen3 8B BaseApr 2025

Qwen3 ASR 0.6BJan 2026

Qwen3 ASR 1.7BJan 2026

Qwen3 Coder 30B A3B Instruct FP8Jul 2025

Qwen3 Coder Next FP8Feb 2026

Qwen3 Embedding 0.6BJun 2025

Qwen3 Embedding 4BJun 2025

Qwen3 Embedding 8BJun 2025

Qwen3 ForcedAligner 0.6BJan 2026

Qwen3 Reranker 0.6BMay 2025

Qwen3 Reranker 4BJun 2025

Qwen3 TTS 12Hz 0.6B BaseJan 2026

Qwen3 TTS 12Hz 0.6B CustomVoiceJan 2026

Qwen3 TTS 12Hz 1.7B CustomVoiceJan 2026

Qwen3 TTS 12Hz 1.7B VoiceDesignJan 2026

Qwen3 VL 2B InstructOct 2025

Qwen3 VL 30B A3B Instruct FP8Oct 2025

Qwen3 VL 32B Instruct FP8Oct 2025

Qwen3 VL 4B InstructOct 2025

Qwen3 VL 8B Instruct FP8Oct 2025

Qwen3 VL Embedding 2BJan 2026

Qwen3 VL Embedding 8BJan 2026