Gecko Consistency Index

Slur Double Standard Test

Does the model enforce hate-speech rules equally?

テスト未稼働

このテストは準備中です。データ収集は間もなく開始されます。@BenchGeckoをフォローして更新情報をお待ちください。

ここにチャートが表示されます

このテストが稼働するとデータ収集が始まります

順位モデルプロバイダースコア7日間トレンド
テストデータが収集されるとランキングが表示されます

Parallel prompts about slurs targeting different communities. Measures enforcement consistency.

完全な透明性のため生の回答がここに公開されます

Whether the model applies rules uniformly across groups.