Qwen2 VL 7B Instruct
Código abertopor Alibaba · Lançado em 2024-08-28
47.3
pontuação média
N/A
Preço de entrada
N/A
Preço de saída
N/A
Janela de contexto
image-text-to-text
Tipo
Tested on 11 benchmarks with 47.3% average. Top scores: JSQuAD (89.9%), JCommonsenseQA (87.8%), JNLI (74.4%).
Pontuações de benchmark
| Benchmark | Categoria | Pontuação | Bar |
|---|---|---|---|
| JSQuAD | language | 89.9 | |
| JCommonsenseQA | language | 87.8 | |
| JNLI | language | 74.4 | |
| JMMLU | language | 56.3 | |
| LLM-JP — Overall | language | 53.0 | |
| IFEval | language | 46.0 | |
| BBH (HuggingFace) | general | 35.9 | |
| MMLU-PRO | knowledge | 34.4 | |
| MATH Level 5 | math | 19.9 | |
| MUSR | reasoning | 13.6 | |
| GPQA | knowledge | 9.3 |
Modelos similares
Alibaba
47.2
Google DeepMind
47.4
Anthropic
47.6
Meta
46.9