BenchGecko Labs

Tests d'IA au quotidien · données de comportement · graphiques repris partout

Chaque jour, on soumet les mêmes questions à tous les modèles de pointe. Les réponses sont brutes, les graphiques publics, les données réutilisables. Personne d'autre ne construit cette couche de transparence.

Découvrir les Gecko Tests GeckoBench Voir les graphiques

GeckoBench

The benchmark engine behind Gecko Tests. 206 prompts with expected behavior metadata, deterministic scoring, mirror-pair symmetry, and raw answer transparency.

206

Prompts

Models

Test families

C'est quoi BenchGecko Labs ?

Les benchmarks classiques mesurent ce qu'un modèle sait faire. Labs mesure comment il se comporte. On suit la censure, les biais, les penchants politiques, les dilemmes moraux et les changements de comportement silencieux que les benchmarks habituels ne captent pas.

Chaque test pose les mêmes questions à chaque modèle, tous les jours. Les résultats sont notés, mis en graphique et publiés avec l'intégralité des réponses. Zéro boîte noire. Zéro éditorial. Rien que des données.

Le modèle donne-t-il des conseils utiles face à des situations concrètes ?

Voir le test

Tous les Gecko Tests

Questions fréquentes

BenchGecko Labs fait passer des tests quotidiens aux modèles d'IA pour mesurer la censure, les biais, l'orientation politique, le raisonnement, les choix moraux et les changements de comportement. Mêmes questions, mêmes modèles, chaque jour.

Tests d'IA au quotidien · données de comportement · graphiques repris partout

C'est quoi BenchGecko Labs ?

Tests phares

Indice de censure

Boussole politique de l'IA

Indice de biais racial

L'IA vous laisserait-elle mourir ?

Test de QI des IA

Test IA du quotidien

Questions fréquentes

Gecko Tests

Données

Ressources