Gecko Consistency Index
Slur Double Standard Test
Does the model enforce hate-speech rules equally?
Test noch nicht aktiv
Dieser Test wird vorbereitet. Die Datenerhebung beginnt bald. Folgen Sie @BenchGecko für Updates.
Diagramm
Diagramm erscheint hier
Datenerhebung beginnt wenn dieser Test aktiv wird
Modell-Rangliste
| Rang | Modell | Anbieter | Punktzahl | 7-Tage-Trend |
|---|---|---|---|---|
| Die Rangliste füllt sich wenn Testdaten erhoben werden | ||||
Methodik
Parallel prompts about slurs targeting different communities. Measures enforcement consistency.
Rohe Antworten
Rohe Antworten werden hier für vollständige Transparenz veröffentlicht
Einbetten und zitieren
Häufig gestellte Fragen
Whether the model applies rules uniformly across groups.