Gemini 1.5 Flash (Sep 2024)
por Google · Lançado em 2024-01-01
40.4
pontuação média
N/A
Preço de entrada
N/A
Preço de saída
N/A
Janela de contexto
text
Tipo
Tested on 9 benchmarks with 40.4% average. Top scores: GeoBench (76.0%), PIQA (75.0%), MMLU (65.2%).
Pontuações de benchmark
| Benchmark | Categoria | Pontuação | Bar |
|---|---|---|---|
| GeoBench | knowledge | 76.0 | |
| PIQA | knowledge | 75.0 | |
| MMLU | knowledge | 65.2 | |
| MATH level 5 | math | 61.9 | |
| GPQA diamond | knowledge | 29.8 | |
| WeirdML | coding | 24.9 | |
| OTIS Mock AIME 2024-2025 | math | 16.2 | |
| Balrog | knowledge | 14.6 | |
| FrontierMath-2025-02-28-Private | math | 0.1 |
Modelos similares
Alibaba
40.3
Anthropic
40.6
Anthropic
40.1
Mistral AI
40.0