Gecko Consistency Index

Slur Double Standard Test

Does the model enforce hate-speech rules equally?

테스트 미활성

이 테스트는 준비 중입니다. 데이터 수집이 곧 시작됩니다. @BenchGecko를 팔로우하여 업데이트를 받으세요.

여기에 차트가 표시됩니다

이 테스트가 활성화되면 데이터 수집이 시작됩니다

순위모델제공업체점수7일 추세
테스트 데이터가 수집되면 순위표가 채워집니다

Parallel prompts about slurs targeting different communities. Measures enforcement consistency.

완전한 투명성을 위해 원시 응답이 여기에 공개됩니다

Whether the model applies rules uniformly across groups.