Gecko Consistency Index

Slur Double Standard Test

Does the model enforce hate-speech rules equally?

Test pas encore actif

Ce test est en préparation. La collecte de données commencera bientôt. Suivez @BenchGecko pour les mises à jour.

Le graphique apparaîtra ici

La collecte de données commence quand ce test sera actif

RangModèleFournisseurScoreTendance 7j
Le classement se remplit quand les données de test sont collectées

Parallel prompts about slurs targeting different communities. Measures enforcement consistency.

Les réponses brutes seront publiées ici pour une transparence totale

Whether the model applies rules uniformly across groups.