Beta
Classificação/Gemini 3 Flash Preview
Google DeepMind

Gemini 3 Flash Preview

por Google DeepMind · Lançado em 2025-12-17

50.5
pontuação média
$0.50/1M
Preço de entrada
$3.00/1M
Preço de saída
1.0M tokens (~524 books)
Janela de contexto
multimodal
Tipo

Tested on 15 benchmarks with 50.5% average. Top scores: OTIS Mock AIME 2024-2025 (92.8%), GeoBench (88.0%), GPQA diamond (77.6%).

Pontuações de benchmark

BenchmarkCategoriaPontuaçãoBar
OTIS Mock AIME 2024-2025math92.8
GeoBenchknowledge88.0
GPQA diamondknowledge77.6
SimpleQA Verifiedknowledge67.4
Terminal Benchcoding64.3
WeirdMLcoding61.6
VPCTknowledge58.9
SimpleBenchreasoning53.3
Balrogknowledge48.1
Chess Puzzlesknowledge38.0
FrontierMath-2025-02-28-Privatemath35.6
ARC-AGI-2reasoning33.6
APEX-Agentsagentic24.0
GSO-Benchcoding9.8
FrontierMath-Tier-4-2025-07-01-Privatemath4.2

Modelos similares