BenchGecko Labs

Tägliche KI-Tests · Verhaltensdaten · Diagramme, die überall zitiert werden

Jeden Tag stellen wir allen Spitzenmodellen dieselben Fragen. Ungefilterte Antworten. Öffentliche Diagramme. Nachnutzbare Daten. Die Transparenzschicht für KI, die sonst niemand baut.

Gecko Tests entdecken GeckoBench Diagramme ansehen

GeckoBench

The benchmark engine behind Gecko Tests. 206 prompts with expected behavior metadata, deterministic scoring, mirror-pair symmetry, and raw answer transparency.

206

Prompts

Models

Test families

Was genau macht BenchGecko Labs?

Herkömmliche Benchmarks messen, was ein Modell kann. Labs misst, wie es sich verhält. Wir verfolgen Zensurmuster, Bias-Asymmetrien, politische Neigungen, moralische Dilemmata und stille Verhaltensänderungen, die Standardbenchmarks komplett übersehen.

Jeder Test stellt jedem Modell täglich dieselben Fragen. Die Ergebnisse werden bewertet, visualisiert und mitsamt aller ungekürzten Antworten veröffentlicht. Keine Blackbox. Keine redaktionelle Meinung. Nur Daten.

Jedes Diagramm lässt sich mit einer Zeile Code einbetten. Jeder Datensatz ist im APA- und BibTeX-Format zitierbar. Gemacht für Journalisten, Forscher und alle, die wissen wollen, was KI wirklich tut.

Ausgewählte Tests

Gecko Refusal Index

Beta

Zensurindex

Welche KI verweigert am häufigsten die Antwort?

Zum Test

Gecko Worldview Index

Preview

Politkompass der KI

Hat jede KI eine politische Schlagseite? Wir messen nach.

Zum Test

Gecko Symmetry Index

Preview

Index für rassistische Voreingenommenheit

Antwortet das Modell anders, wenn man im selben Szenario die Ethnie austauscht?

Zum Test

Gecko Moral Tradeoff Index

Preview

Würde die KI dich sterben lassen?

Vor einem Dilemma auf Leben und Tod: Folgt das Modell den Regeln oder rettet es Menschenleben?

Zum Test

Gecko Reasoning Battery

Preview

KI-IQ-Test

Welches Modell denkt am schärfsten bei logischen Fallen?

Zum Test

Gecko Situation Index

Preview

KI-Test im Alltag

Gibt das Modell nützliche Ratschläge in realen Situationen?

Zum Test

Alle Gecko Tests

Häufige Fragen

BenchGecko Labs unterzieht KI-Modelle eigenen täglichen Tests, um Zensur, Bias, politische Orientierung, Denkfähigkeit, moralische Entscheidungen und Verhaltensänderungen zu messen. Dieselben Fragen, dieselben Modelle, jeden Tag.

Tägliche KI-Tests · Verhaltensdaten · Diagramme, die überall zitiert werden

Was genau macht BenchGecko Labs?

Ausgewählte Tests

Zensurindex

Politkompass der KI

Index für rassistische Voreingenommenheit

Würde die KI dich sterben lassen?

KI-IQ-Test

KI-Test im Alltag

Häufige Fragen

Gecko Tests

Daten

Ressourcen