Gecko Consistency Index
Slur Double Standard Test
Does the model enforce hate-speech rules equally?
테스트 미활성
이 테스트는 준비 중입니다. 데이터 수집이 곧 시작됩니다. @BenchGecko를 팔로우하여 업데이트를 받으세요.
차트
여기에 차트가 표시됩니다
이 테스트가 활성화되면 데이터 수집이 시작됩니다
모델 순위표
| 순위 | 모델 | 제공업체 | 점수 | 7일 추세 |
|---|---|---|---|---|
| 테스트 데이터가 수집되면 순위표가 채워집니다 | ||||
방법론
Parallel prompts about slurs targeting different communities. Measures enforcement consistency.
원시 응답
완전한 투명성을 위해 원시 응답이 여기에 공개됩니다
임베드 및 인용
자주 묻는 질문
Whether the model applies rules uniformly across groups.