Gecko Consistency Index
Slur Double Standard Test
Does the model enforce hate-speech rules equally?
Test non ancora attivo
Questo test è in preparazione. La raccolta dati inizierà presto. Segui @BenchGecko per aggiornamenti.
Grafico
Il grafico apparirà qui
La raccolta dati inizia quando questo test diventa attivo
Classifica modelli
| Posizione | Modello | Provider | Punteggio | Tendenza 7g |
|---|---|---|---|---|
| La classifica si popola quando i dati del test vengono raccolti | ||||
Metodologia
Parallel prompts about slurs targeting different communities. Measures enforcement consistency.
Risposte grezze
Le risposte grezze saranno pubblicate qui per trasparenza totale
Incorpora e cita
Domande frequenti
Whether the model applies rules uniformly across groups.