Gecko Consistency Index
Slur Double Standard Test
Does the model enforce hate-speech rules equally?
Test aún no activo
Este test está en preparación. La recolección de datos comenzará pronto. Sigue a @BenchGecko para actualizaciones.
Gráfico
El gráfico aparecerá aquí
La recolección de datos comienza cuando este test se active
Ranking de modelos
| Rango | Modelo | Proveedor | Puntuación | Tendencia 7d |
|---|---|---|---|---|
| El ranking se llena cuando los datos del test se recolectan | ||||
Metodología
Parallel prompts about slurs targeting different communities. Measures enforcement consistency.
Respuestas sin filtro
Las respuestas sin filtro se publicarán aquí para transparencia total
Integrar y citar
Preguntas frecuentes
Whether the model applies rules uniformly across groups.