#					Benchmarks
1	GPT-5.5 Pro	99.9	$30.00	400K	3
2	Claude Mythos Preview	99.8	—	1000K	14
3	Qwen3.5 397B A17B	96.3	$0.39	262K	11
4	DeepSeek V3.2 Speciale	95.2	$0.40	164K	9
5	GPT-5.4 Pro	93.0	$30.00	1050K	8
6	GPT-5.1-Codex-Max	91.2	$1.25	400K	8
7	Gemini 3.1 Pro Preview	90.0	$2.00	1049K	23
8	Step 3.5 Flash	89.5	$0.10	262K	10
9	GPT-5 Chat	89.0	$1.25	128K	7
10	Qwen3.6 Plus	88.7	$0.33	1000K	11
11	DeepSeek R1 Distill Qwen 14B	88.3	—	—	11
12	HA Qwen2.5 72B Instruct Abliterated	87.5	—	—	6
13	GLM 5.1	87.0	$1.05	203K	12
14	GPT-5.2-Codex	85.4	$1.75	400K	9
15	Claude Instant	84.6	—	—	4
16	DeepSeek-V2 (MoE-236B, May 2024)	84.4	—	—	7
17	GPT-5.4	83.4	$2.50	1050K	16
18	Claude Opus 4.6 (Fast)	83.3	$30.00	1000K	12
19	GPT-5.1-Codex	82.8	$1.25	400K	8
20	MiMo-V2-Flash	81.7	$0.09	262K	11

El stack · 11 capas de datos

Modelos

Benchmark, precio, contexto · cada modelo frontier

1057 rastreados

Proveedores

Matriz de disponibilidad en cada proveedor de inferencia IA

274 rastreados

Agentes

SWE-bench · MLE-bench · OSWorld y más

165 rastreados

Benchmarks

Evolución de puntuaciones en cada benchmark importante

130 rastreados

Investigación

Biblioteca de investigación · métodos · notas · mapas de fuentes

Hub

Economía

Índice Burbuja · valoraciones · inversión · capitalización

71 empresas

Lo que suena

Seguimiento de atención estilo Kaito en todas las señales

93 entidades

Infra

Chips · fundiciones · memoria · sistemas · energía

6 índices

Precios

Buscador de arbitraje · sustitutos · rastreador de tier gratuito

En vivo

Recursos

251 términos · glosario · rutas de aprendizaje

251 términos

Comparar

Comparación universal · modelos · agentes · proveedores

15+ rutas

Recursos IA

Todas las rutas →

Ruta · 7 términos

The AI Bubble Explained

Seven terms that decode whether AI is overpriced, fairly priced, or criminally underpriced. Read in order.

Ruta · 6 términos

Pick an AI Model

Six terms to go from "I need an AI" to "here is the cheapest model that meets my spec."

Ruta · 7 términos

From Sand to Model

The AI supply chain in 7 terms · foundry, memory, chip, system, datacenter, provider, API.

Buscar 297 términos de IA · desde transformers hasta attention premiumAbrir →

Indicadores destacados

El Pulso

Salud del ecosistema IA · compuesto 0-100

Ver gráfico completo →

Índice Burbuja

Lectura actual vs pico dotcom

Ver gráfico completo →

Lo que suena

Cuota de voz entre modelos

Ver gráfico completo →

Clasificación

Top modelos por puntuación promedio de benchmark

Ver gráfico completo →

Ancho de banda HBM

Índice de tensión de suministro de memoria

Ver gráfico completo →

Capex parabólico

Trayectoria de capex IA de hyperscalers

Ver gráfico completo →

Metodología · FAQ · Frescura

Metodología completa →

¿Con qué frecuencia se actualizan los datos de BenchGecko?›

Los datos de modelos y benchmarks se actualizan a diario desde fuentes primarias. Los precios se obtienen de cada API de proveedor de forma continua. Las señales de atención se agregan semanalmente. El Pulso se recalcula a las 00:00 UTC.

¿Qué es El Pulso?›

Una puntuación compuesta de 0 a 100 sobre la salud de la economía IA. Combina el Índice Burbuja inverso, velocidad de benchmarks, compresión de precios, diversidad de atención y tensión de la cadena de suministro en un solo número. Más bajo es más saludable.

¿Cómo se normalizan las puntuaciones de benchmark?›

Cada benchmark se normaliza min-max en todo el conjunto de modelos puntuados. Los rankings promedian puntuaciones normalizadas de 3 o más benchmarks por modelo para evitar sobreponderar una sola prueba.

¿De dónde provienen los datos de precios?›

Respuestas directas de API de proveedores · OpenRouter, OpenAI, Anthropic, Google, xAI, DeepSeek, Mistral y otros. Cada captura se almacena con atribución de fuente en la página de detalle del modelo.

¿Puedo citar datos de BenchGecko?›

Sí. Cada página incluye una barra de Compartir y Citar con formatos APA, MLA, BibTeX, Chicago y texto plano. La atribución es obligatoria en el tier gratuito de la API y recomendada en todos los casos.

Fuentes ·OpenRouterEpoch AISWE-benchMCP RegistryChatbot ArenaHuggingFaceLiveBenchArtificial AnalysisSEALAider

Actualizado hace 2h · 10+ fuentes autorizadas · cero contenido editorial·Learn · Glossary·Investigación·Developers