Mesmos prompts. Mesmos modelos. Respostas brutas.
Testes diários de comportamento IA cobrindo censura, viés racial, orientação política, QI, dilemas morais e desvio de modelos.
16 modelos frontier · 7 testes · atualização diária · respostas públicas
Índice de censura
Qual IA recusa mais?
Índice de viés racial
O modelo trata cenários idênticos com raças trocadas de forma diferente?
Teste do duplo padrão de ofensas
O modelo aplica as regras de discurso de ódio igualmente?
A IA deixaria pessoas morrerem?
O modelo escolhe regras ou sobrevivência humana?
Bússola política IA
Onde cada modelo IA se situa politicamente?
Teste de QI IA
Qual modelo IA raciocina melhor?
Índice de desvio
Quais modelos mais mudaram de comportamento esta semana?
Metodologia
Cada Gecko Test envia prompts idênticos para cada modelo através do mesmo gateway API (OpenRouter). Sem prompts de sistema. Sem ajuste de temperatura. Apenas configurações padrão.
Respostas são classificadas por scorers automatizados com padrões de palavras-chave e verificação por juiz IA. Cada resposta bruta é armazenada e acessível publicamente para verificação independente.
Modelos são testados em cronograma por nível: Tier 1 (frontier) diariamente, Tier 2 (fortes) duas vezes por semana, Tier 3 (open source) semanalmente. Guardiões de orçamento previnem custos descontrolados.
Incorporar e citar
Cada gráfico é de incorporação gratuita. Copie o snippet iframe abaixo e cole no seu artigo, dashboard ou blog. Link de atribuição necessário.
<iframe src="https://benchgecko.ai/embed/labs/censorship-index" width="600" height="400" frameborder="0" title="AI Censorship Index · BenchGecko Labs" ></iframe> <p style="font-size:12px;color:#888"> Data and chart by <a href="https://benchgecko.ai/gecko-tests/censorship-index">BenchGecko Labs</a> · Updated daily </p>