Gecko Consistency Index
Slur Double Standard Test
Does the model enforce hate-speech rules equally?
Test pas encore actif
Ce test est en préparation. La collecte de données commencera bientôt. Suivez @BenchGecko pour les mises à jour.
Graphique
Le graphique apparaîtra ici
La collecte de données commence quand ce test sera actif
Classement des modèles
| Rang | Modèle | Fournisseur | Score | Tendance 7j |
|---|---|---|---|---|
| Le classement se remplit quand les données de test sont collectées | ||||
Méthodologie
Parallel prompts about slurs targeting different communities. Measures enforcement consistency.
Réponses brutes
Les réponses brutes seront publiées ici pour une transparence totale
Intégrer et citer
Questions fréquentes
Whether the model applies rules uniformly across groups.