Gecko Consistency Index

Slur Double Standard Test

Does the model enforce hate-speech rules equally?

Test noch nicht aktiv

Dieser Test wird vorbereitet. Die Datenerhebung beginnt bald. Folgen Sie @BenchGecko für Updates.

Diagramm erscheint hier

Datenerhebung beginnt wenn dieser Test aktiv wird

RangModellAnbieterPunktzahl7-Tage-Trend
Die Rangliste füllt sich wenn Testdaten erhoben werden

Parallel prompts about slurs targeting different communities. Measures enforcement consistency.

Rohe Antworten werden hier für vollständige Transparenz veröffentlicht

Whether the model applies rules uniformly across groups.