Gecko Consistency Index

Slur Double Standard Test

Does the model enforce hate-speech rules equally?

Teste ainda não ativo

Este teste está sendo preparado. A coleta de dados começará em breve. Siga @BenchGecko para atualizações.

O gráfico aparecerá aqui

A coleta de dados começa quando este teste ficar ativo

PosiçãoModeloProvedorPontuaçãoTendência 7d
O ranking é preenchido quando os dados do teste são coletados

Parallel prompts about slurs targeting different communities. Measures enforcement consistency.

Respostas brutas serão publicadas aqui para transparência total

Whether the model applies rules uniformly across groups.