#					Benchmarks
1	GPT-5.5 Pro	99.9	$30.00	400K	3
2	Claude Mythos Preview	99.8	—	1000K	14
3	Qwen3.5 397B A17B	96.3	$0.39	262K	11
4	DeepSeek V3.2 Speciale	95.2	$0.40	164K	9
5	GPT-5.4 Pro	93.0	$30.00	1050K	8
6	GPT-5.1-Codex-Max	91.2	$1.25	400K	8
7	Gemini 3.1 Pro Preview	90.0	$2.00	1049K	23
8	Step 3.5 Flash	89.5	$0.10	262K	10
9	GPT-5 Chat	89.0	$1.25	128K	7
10	Qwen3.6 Plus	88.7	$0.33	1000K	11
11	DeepSeek R1 Distill Qwen 14B	88.3	—	—	11
12	HA Qwen2.5 72B Instruct Abliterated	87.5	—	—	6
13	GLM 5.1	87.0	$1.05	203K	12
14	GPT-5.2-Codex	85.4	$1.75	400K	9
15	Claude Instant	84.6	—	—	4
16	DeepSeek-V2 (MoE-236B, May 2024)	84.4	—	—	7
17	GPT-5.4	83.4	$2.50	1050K	16
18	Claude Opus 4.6 (Fast)	83.3	$30.00	1000K	12
19	GPT-5.1-Codex	82.8	$1.25	400K	8
20	MiMo-V2-Flash	81.7	$0.09	262K	11

Der Stack · 11 Datenschichten

Modelle

Benchmark, Preis, Kontext · jedes Frontier-Modell

994 erfasst

Anbieter

Verfügbarkeitsmatrix über alle KI-Inferenz-Anbieter

268 erfasst

Agents

SWE-bench · MLE-bench · OSWorld und mehr

165 erfasst

Benchmarks

Score-Entwicklung über alle wichtigen Benchmarks

128 erfasst

Research

Research-Bibliothek · Methoden · Notizen · Quellenkarten

Hub

Wirtschaft

Blasen-Index · Bewertungen · Finanzierung · Marktkapitalisierung

71 Unternehmen

Im Gespräch

Aufmerksamkeitsverfolgung über alle Signalquellen

93 Entitäten

Infrastruktur

Chips · Foundries · Speicher · Systeme · Energie

6 Indizes

Preise

Arbitrage Finder · Substitut Finder · Free Tier Tracker

Live

Wissen

251 Begriffe · Glossar · Lernpfade

251 Begriffe

Vergleichen

Universeller Vergleich · Modelle · Agents · Anbieter

15+ Routen

KI verstehen

Alle Pfade →

Pfad · 7 Begriffe

The AI Bubble Explained

Seven terms that decode whether AI is overpriced, fairly priced, or criminally underpriced. Read in order.

Pfad · 6 Begriffe

Pick an AI Model

Six terms to go from "I need an AI" to "here is the cheapest model that meets my spec."

Pfad · 7 Begriffe

From Sand to Model

The AI supply chain in 7 terms · foundry, memory, chip, system, datacenter, provider, API.

Suchen 297 KI-Begriffe · von Transformern bis Attention PremiumÖffnen →

Ausgewählte Indikatoren

Der Puls

KI-Ökosystem-Gesundheit · Kompositindex 0-100

Vollständiges Diagramm ansehen →

Blasen-Index

Aktueller Stand im Vergleich zum Dotcom-Höhepunkt

Vollständiges Diagramm ansehen →

Im Gespräch

Stimmenanteil über alle Modelle

Vollständiges Diagramm ansehen →

Rangliste

Führende Modelle nach durchschn. Benchmark-Score

Vollständiges Diagramm ansehen →

HBM-Bandbreite

Speicherversorgungsindex

Vollständiges Diagramm ansehen →

Parabolisches Capex

Hyperscaler-KI-Capex-Kurve

Vollständiges Diagramm ansehen →

Methodik · FAQ · Aktualität

Vollständige Methodik →

Wie oft werden BenchGecko-Daten aktualisiert?›

Modell- und Benchmarkdaten werden täglich aus Primärquellen aktualisiert. Preise werden rollierend von jeder Anbieter-API abgerufen. Aufmerksamkeitssignale werden wöchentlich aggregiert. Der Puls wird um 00:00 UTC neu berechnet.

Was ist der Puls?›

Ein Kompositindex von 0 bis 100 für die Gesundheit der KI-Wirtschaft. Kombiniert den inversen Blasen-Index, Benchmark-Geschwindigkeit, Preiskompression, Aufmerksamkeitsvielfalt und Lieferkettenspannung in einer einzigen Zahl. Niedriger ist gesünder.

Wie werden Benchmark-Ergebnisse normalisiert?›

Jeder Benchmark wird min-max-normalisiert über den gesamten Satz bewerteter Modelle. Rankings mitteln normalisierte Scores über mindestens 3 Benchmarks pro Modell, um eine Übergewichtung einzelner Tests zu vermeiden.

Woher stammen die Preisdaten?›

Direkte Anbieter-API-Antworten · OpenRouter, OpenAI, Anthropic, Google, xAI, DeepSeek, Mistral und weitere. Jeder Snapshot wird mit Quellenangabe auf der Modelldetailseite zwischengespeichert.

Kann ich BenchGecko-Daten zitieren?›

Ja. Jede Seite enthält eine Teilen-&-Zitieren-Leiste mit APA, MLA, BibTeX, Chicago und Klartext-Formaten. Quellenangabe ist für den kostenlosen API-Tarif erforderlich und überall empfohlen.

Quellen ·OpenRouterEpoch AISWE-benchMCP RegistryChatbot ArenaHuggingFaceLiveBenchArtificial AnalysisSEALAider

Aktualisiert vor 2h · 10+ maßgebliche Quellen · kein redaktioneller Inhalt·Learn · Glossary·Research·Developers

Die KI-Wirtschaft, Erfasst.

Rangliste

Im Gespräch

Der Puls

Übergreifende Signale

Aktuelle Benchmark-Bewegungen

Chip-Effizienzrennen

Heute in der KI

Weitere Indikatoren

Die Matrix · Top 20 Modelle

Der Stack · 11 Datenschichten

KI verstehen

Ausgewählte Indikatoren

Methodik · FAQ · Aktualität