BenchGecko Labs

Tests d'IA au quotidien · données de comportement · graphiques repris partout

Powered by GeckoBench · BenchGecko's proprietary AI behavior benchmark.

Chaque jour, on soumet les mêmes questions à tous les modèles de pointe. Les réponses sont brutes, les graphiques publics, les données réutilisables. Personne d'autre ne construit cette couche de transparence.

The benchmark engine behind Gecko Tests. 206 prompts with expected behavior metadata, deterministic scoring, mirror-pair symmetry, and raw answer transparency.

Prompts

Models

Test families

Les benchmarks classiques mesurent ce qu'un modèle sait faire. Labs mesure comment il se comporte. On suit la censure, les biais, les penchants politiques, les dilemmes moraux et les changements de comportement silencieux que les benchmarks habituels ne captent pas.

Chaque test pose les mêmes questions à chaque modèle, tous les jours. Les résultats sont notés, mis en graphique et publiés avec l'intégralité des réponses. Zéro boîte noire. Zéro éditorial. Rien que des données.

Tous les graphiques s'intègrent en une ligne de code. Tous les jeux de données sont citables en APA ou BibTeX. Pensé pour les journalistes, les chercheurs et quiconque veut savoir ce que l'IA fait vraiment.

BenchGecko Labs fait passer des tests quotidiens aux modèles d'IA pour mesurer la censure, les biais, l'orientation politique, le raisonnement, les choix moraux et les changements de comportement. Mêmes questions, mêmes modèles, chaque jour.