Gemini 1.5 Flash (Sep 2024)
par Google · Sorti le 2024-01-01
40.4
score moyen
N/A
Prix d'entrée
N/A
Prix de sortie
N/A
Fenêtre de contexte
text
Type
Tested on 9 benchmarks with 40.4% average. Top scores: GeoBench (76.0%), PIQA (75.0%), MMLU (65.2%).
Scores de benchmark
| Benchmark | Catégorie | Score | Bar |
|---|---|---|---|
| GeoBench | knowledge | 76.0 | |
| PIQA | knowledge | 75.0 | |
| MMLU | knowledge | 65.2 | |
| MATH level 5 | math | 61.9 | |
| GPQA diamond | knowledge | 29.8 | |
| WeirdML | coding | 24.9 | |
| OTIS Mock AIME 2024-2025 | math | 16.2 | |
| Balrog | knowledge | 14.6 | |
| FrontierMath-2025-02-28-Private | math | 0.1 |
Modèles similaires
Alibaba
40.3
Anthropic
40.6
Anthropic
40.1
Mistral AI
40.0