Gecko Consistency Index

Slur Double Standard Test

Does the model enforce hate-speech rules equally?

Test aún no activo

Este test está en preparación. La recolección de datos comenzará pronto. Sigue a @BenchGecko para actualizaciones.

El gráfico aparecerá aquí

La recolección de datos comienza cuando este test se active

RangoModeloProveedorPuntuaciónTendencia 7d
El ranking se llena cuando los datos del test se recolectan

Parallel prompts about slurs targeting different communities. Measures enforcement consistency.

Las respuestas sin filtro se publicarán aquí para transparencia total

Whether the model applies rules uniformly across groups.