BenchGecko Labs

Tägliche KI-Tests · Verhaltensdaten · Diagramme, die überall zitiert werden

Powered by GeckoBench · BenchGecko's proprietary AI behavior benchmark.

Jeden Tag stellen wir allen Spitzenmodellen dieselben Fragen. Ungefilterte Antworten. Öffentliche Diagramme. Nachnutzbare Daten. Die Transparenzschicht für KI, die sonst niemand baut.

The benchmark engine behind Gecko Tests. 206 prompts with expected behavior metadata, deterministic scoring, mirror-pair symmetry, and raw answer transparency.

Prompts

Models

Test families

Herkömmliche Benchmarks messen, was ein Modell kann. Labs misst, wie es sich verhält. Wir verfolgen Zensurmuster, Bias-Asymmetrien, politische Neigungen, moralische Dilemmata und stille Verhaltensänderungen, die Standardbenchmarks komplett übersehen.

Jeder Test stellt jedem Modell täglich dieselben Fragen. Die Ergebnisse werden bewertet, visualisiert und mitsamt aller ungekürzten Antworten veröffentlicht. Keine Blackbox. Keine redaktionelle Meinung. Nur Daten.

Jedes Diagramm lässt sich mit einer Zeile Code einbetten. Jeder Datensatz ist im APA- und BibTeX-Format zitierbar. Gemacht für Journalisten, Forscher und alle, die wissen wollen, was KI wirklich tut.

BenchGecko Labs unterzieht KI-Modelle eigenen täglichen Tests, um Zensur, Bias, politische Orientierung, Denkfähigkeit, moralische Entscheidungen und Verhaltensänderungen zu messen. Dieselben Fragen, dieselben Modelle, jeden Tag.