BenchGecko Labs

Test di IA ogni giorno · dati sul comportamento · grafici ripubblicati ovunque

Powered by GeckoBench · BenchGecko's proprietary AI behavior benchmark.

Ogni giorno facciamo le stesse domande a tutti i modelli di punta. Risposte integrali. Grafici aperti. Dati riutilizzabili. Lo strato di trasparenza sull'IA che nessun altro sta costruendo.

The benchmark engine behind Gecko Tests. 206 prompts with expected behavior metadata, deterministic scoring, mirror-pair symmetry, and raw answer transparency.

Prompts

Models

Test families

I benchmark tradizionali misurano cosa sa fare un modello. Labs misura come si comporta. Tracciamo la censura, i bias, le inclinazioni politiche, i dilemmi morali e i cambiamenti silenziosi che i benchmark classici non rilevano nemmeno.

Ogni test pone le stesse domande a ogni modello, tutti i giorni. I risultati vengono valutati, graficati e pubblicati con tutte le risposte integrali. Nessuna scatola nera. Nessuna opinione editoriale. Solo dati.

Ogni grafico si incorpora con una riga di codice. Ogni dataset si cita in formato APA e BibTeX. Pensato per giornalisti, ricercatori e chiunque voglia sapere cosa fa davvero l'IA.

BenchGecko Labs sottopone i modelli di IA a test giornalieri proprietari per misurare censura, bias, orientamento politico, ragionamento, decisioni morali e cambiamenti di comportamento. Stesse domande, stessi modelli, ogni giorno.