BenchGecko Labs

Tests de IA a diario · datos de comportamiento · gráficos que se citan en todas partes

Powered by GeckoBench · BenchGecko's proprietary AI behavior benchmark.

Cada día hacemos las mismas preguntas a todos los modelos punteros. Respuestas sin retocar. Gráficos abiertos. Datos reutilizables. La capa de transparencia en IA que nadie más está construyendo.

The benchmark engine behind Gecko Tests. 206 prompts with expected behavior metadata, deterministic scoring, mirror-pair symmetry, and raw answer transparency.

Prompts

Models

Test families

Los benchmarks de siempre miden lo que un modelo sabe hacer. Labs mide cómo se comporta. Rastreamos la censura, los sesgos, las inclinaciones políticas, los dilemas morales y los cambios silenciosos que los benchmarks convencionales ni detectan.

Cada test lanza las mismas preguntas a cada modelo, todos los días. Los resultados se puntúan, se grafican y se publican con todas las respuestas íntegras. Sin caja negra. Sin opinión editorial. Solo datos.

Todos los gráficos se incrustan con una línea de código. Todos los datasets son citables en APA y BibTeX. Pensado para periodistas, investigadores y cualquiera que quiera saber qué hace realmente la IA.

BenchGecko Labs somete a los modelos de IA a tests diarios propios para medir la censura, los sesgos, la orientación política, el razonamiento, las decisiones morales y los cambios de comportamiento. Mismas preguntas, mismos modelos, cada día.