Gecko Consistency Index
Slur Double Standard Test
Does the model enforce hate-speech rules equally?
テスト未稼働
このテストは準備中です。データ収集は間もなく開始されます。@BenchGeckoをフォローして更新情報をお待ちください。
チャート
ここにチャートが表示されます
このテストが稼働するとデータ収集が始まります
モデルランキング
| 順位 | モデル | プロバイダー | スコア | 7日間トレンド |
|---|---|---|---|---|
| テストデータが収集されるとランキングが表示されます | ||||
方法論
Parallel prompts about slurs targeting different communities. Measures enforcement consistency.
生の回答
完全な透明性のため生の回答がここに公開されます
埋め込みと引用
よくある質問
Whether the model applies rules uniformly across groups.