Gecko Consistency Index
Slur Double Standard Test
Does the model enforce hate-speech rules equally?
Teste ainda não ativo
Este teste está sendo preparado. A coleta de dados começará em breve. Siga @BenchGecko para atualizações.
Gráfico
O gráfico aparecerá aqui
A coleta de dados começa quando este teste ficar ativo
Ranking de modelos
| Posição | Modelo | Provedor | Pontuação | Tendência 7d |
|---|---|---|---|---|
| O ranking é preenchido quando os dados do teste são coletados | ||||
Metodologia
Parallel prompts about slurs targeting different communities. Measures enforcement consistency.
Respostas brutas
Respostas brutas serão publicadas aqui para transparência total
Incorporar e citar
Perguntas frequentes
Whether the model applies rules uniformly across groups.