Gecko Consistency Index

Slur Double Standard Test

Does the model enforce hate-speech rules equally?

Test non ancora attivo

Questo test è in preparazione. La raccolta dati inizierà presto. Segui @BenchGecko per aggiornamenti.

Il grafico apparirà qui

La raccolta dati inizia quando questo test diventa attivo

PosizioneModelloProviderPunteggioTendenza 7g
La classifica si popola quando i dati del test vengono raccolti

Parallel prompts about slurs targeting different communities. Measures enforcement consistency.

Le risposte grezze saranno pubblicate qui per trasparenza totale

Whether the model applies rules uniformly across groups.