#					Benchmarks
1	GPT-5.5 Pro	99.9	$30.00	400K	3
2	Claude Mythos Preview	99.8	—	1000K	14
3	Qwen3.5 397B A17B	96.3	$0.39	262K	11
4	DeepSeek V3.2 Speciale	95.2	$0.40	164K	9
5	GPT-5.4 Pro	93.0	$30.00	1050K	8
6	GPT-5.1-Codex-Max	91.2	$1.25	400K	8
7	Gemini 3.1 Pro Preview	90.0	$2.00	1049K	23
8	Step 3.5 Flash	89.5	$0.10	262K	10
9	GPT-5 Chat	89.0	$1.25	128K	7
10	Qwen3.6 Plus	88.7	$0.33	1000K	11
11	DeepSeek R1 Distill Qwen 14B	88.3	—	—	11
12	HA Qwen2.5 72B Instruct Abliterated	87.5	—	—	6
13	GLM 5.1	87.0	$1.05	203K	12
14	GPT-5.2-Codex	85.4	$1.75	400K	9
15	Claude Instant	84.6	—	—	4
16	DeepSeek-V2 (MoE-236B, May 2024)	84.4	—	—	7
17	GPT-5.4	83.4	$2.50	1050K	16
18	Claude Opus 4.6 (Fast)	83.3	$30.00	1000K	12
19	GPT-5.1-Codex	82.8	$1.25	400K	8
20	MiMo-V2-Flash	81.7	$0.09	262K	11

A stack · 11 camadas de dados

Modelos

Benchmark, preço, contexto · cada modelo frontier

1057 rastreados

Provedores

Matriz de disponibilidade em cada provedor de inferência

274 rastreados

Agentes

SWE-bench · MLE-bench · OSWorld e mais

165 rastreados

Benchmarks

Evolução de notas em cada benchmark importante

130 rastreados

Pesquisa

Biblioteca de pesquisa · métodos · notas · mapas de fontes

Hub

Economia

Índice Bolha · avaliações · investimento · market cap

71 empresas

O que tá bombando

Rastreamento de atenção estilo Kaito em todos os sinais

93 entidades

Infra

Chips · foundries · memória · sistemas · energia

6 índices

Preços

Busca de arbitragem · substitutos · free tier tracker

Ao vivo

Recursos

251 termos · glossário · trilhas de aprendizado

251 termos

Comparar

Comparação universal · modelos · agentes · provedores

15+ rotas

Recursos IA

Todas as trilhas →

Trilha · 7 termos

The AI Bubble Explained

Seven terms that decode whether AI is overpriced, fairly priced, or criminally underpriced. Read in order.

Trilha · 6 termos

Pick an AI Model

Six terms to go from "I need an AI" to "here is the cheapest model that meets my spec."

Trilha · 7 termos

From Sand to Model

The AI supply chain in 7 terms · foundry, memory, chip, system, datacenter, provider, API.

Buscar 297 termos IA · de transformers a attention premiumAbrir →

Destaques

O Pulso

Saúde do ecossistema IA · composto 0-100

Ver gráfico completo →

Índice Bolha IA

Leitura atual vs pico dotcom

Ver gráfico completo →

O que tá bombando

Share of voice entre modelos

Ver gráfico completo →

Classificação

Top modelos por nota média

Ver gráfico completo →

Largura de banda HBM

Índice de pressão de supply de memória

Ver gráfico completo →

Capex Parabólico

Trajetória de capex IA dos hyperscalers

Ver gráfico completo →

Metodologia · FAQ · Atualização

Metodologia completa →

Com que frequência os dados do BenchGecko são atualizados?›

Dados de modelos e benchmarks são atualizados diariamente das fontes primárias. Preços são extraídos de cada API de provedor em rotação. Sinais de buzz são agregados semanalmente. O Pulso recalcula às 00:00 UTC.

O que é O Pulso?›

Uma nota composta de 0-100 da saúde da economia IA. Combina o inverso do Índice Bolha, velocidade de benchmarks, compressão de preços, diversidade de atenção e pressão na cadeia de suprimentos num único número. Menor é mais saudável.

Como as notas de benchmark são normalizadas?›

Cada benchmark é normalizado min-max no conjunto completo de modelos avaliados. O pódio calcula a média das notas normalizadas em 3+ benchmarks por modelo pra evitar peso excessivo em qualquer teste individual.

De onde vêm os dados de preços?›

Direto das APIs de provedores · OpenRouter, OpenAI, Anthropic, Google, xAI, DeepSeek, Mistral e outros. Cada snapshot é armazenado com atribuição de fonte na página de detalhe do modelo.

Posso citar dados do BenchGecko?›

Pode sim. Cada página tem uma barra Compartilhar e Citar com formatos APA, MLA, BibTeX, Chicago e texto puro. Atribuição é obrigatória no tier grátis da API e encorajada em todo lugar.

Fontes ·OpenRouterEpoch AISWE-benchMCP RegistryChatbot ArenaHuggingFaceLiveBenchArtificial AnalysisSEALAider

Atualizado há 2h · 10+ fontes de referência · zero conteúdo editorial·Learn · Glossary·Pesquisa·Developers