BenchGecko Labs

Testes de IA todo dia · dados de comportamento · gráficos citados em toda parte

Todo dia a gente faz as mesmas perguntas pra todos os modelos de ponta. Respostas na íntegra. Gráficos abertos. Dados reutilizáveis. A camada de transparência em IA que ninguém mais tá construindo.

Conhecer os Gecko Tests GeckoBench Ver os gráficos

GeckoBench

The benchmark engine behind Gecko Tests. 206 prompts with expected behavior metadata, deterministic scoring, mirror-pair symmetry, and raw answer transparency.

206

Prompts

Models

Test families

O que o BenchGecko Labs faz?

Benchmarks tradicionais medem o que um modelo sabe fazer. O Labs mede como ele se comporta. A gente rastreia censura, vieses, inclinações políticas, dilemas morais e mudanças silenciosas de comportamento que os benchmarks de sempre nem percebem.

Cada teste manda as mesmas perguntas pra cada modelo, todo dia. Os resultados são pontuados, colocados em gráficos e publicados com todas as respostas na íntegra. Sem caixa preta. Sem opinião editorial. Só dados.

O modelo dá conselhos úteis em situações do cotidiano?

Ver o teste

Todos os Gecko Tests

Perguntas frequentes

O BenchGecko Labs roda testes diários próprios em modelos de IA pra medir censura, vieses, orientação política, raciocínio, decisões morais e mudanças de comportamento. Mesmas perguntas, mesmos modelos, todo dia.

Testes de IA todo dia · dados de comportamento · gráficos citados em toda parte

O que o BenchGecko Labs faz?

Testes em destaque

Índice de censura

Bússola política da IA

Índice de viés racial

A IA deixaria você morrer?

Teste de QI da IA

Teste de IA na vida real

Perguntas frequentes

Gecko Tests

Dados

Recursos