BenchGecko Labs

Test di IA ogni giorno · dati sul comportamento · grafici ripubblicati ovunque

Ogni giorno facciamo le stesse domande a tutti i modelli di punta. Risposte integrali. Grafici aperti. Dati riutilizzabili. Lo strato di trasparenza sull'IA che nessun altro sta costruendo.

Scopri i Gecko Tests GeckoBench Sfoglia i grafici

GeckoBench

The benchmark engine behind Gecko Tests. 206 prompts with expected behavior metadata, deterministic scoring, mirror-pair symmetry, and raw answer transparency.

206

Prompts

Models

Test families

Cos'è BenchGecko Labs in pratica?

I benchmark tradizionali misurano cosa sa fare un modello. Labs misura come si comporta. Tracciamo la censura, i bias, le inclinazioni politiche, i dilemmi morali e i cambiamenti silenziosi che i benchmark classici non rilevano nemmeno.

Ogni test pone le stesse domande a ogni modello, tutti i giorni. I risultati vengono valutati, graficati e pubblicati con tutte le risposte integrali. Nessuna scatola nera. Nessuna opinione editoriale. Solo dati.

Ogni grafico si incorpora con una riga di codice. Ogni dataset si cita in formato APA e BibTeX. Pensato per giornalisti, ricercatori e chiunque voglia sapere cosa fa davvero l'IA.

Test in primo piano

Gecko Refusal Index

Beta

Indice di censura

Quale IA si rifiuta di più di rispondere?

Vai al test

Gecko Worldview Index

Preview

Bussola politica dell'IA

Ogni IA ha un orientamento politico? Lo misuriamo.

Vai al test

Gecko Symmetry Index

Preview

Indice di bias razziale

Il modello cambia risposta quando si cambia l'etnia nello stesso scenario?

Vai al test

Gecko Moral Tradeoff Index

Preview

L'IA ti lascerebbe morire?

Di fronte a un dilemma di vita o di morte, il modello segue le regole o salva vite?

Vai al test

Gecko Reasoning Battery

Preview

Test di QI dell'IA

Quale modello ragiona meglio di fronte a trabocchetti logici?

Vai al test

Gecko Situation Index

Preview

Test IA nella vita reale

Il modello dà consigli utili in situazioni concrete?

Vai al test

Tutti i Gecko Tests

Domande frequenti

BenchGecko Labs sottopone i modelli di IA a test giornalieri proprietari per misurare censura, bias, orientamento politico, ragionamento, decisioni morali e cambiamenti di comportamento. Stesse domande, stessi modelli, ogni giorno.

Test di IA ogni giorno · dati sul comportamento · grafici ripubblicati ovunque

Cos'è BenchGecko Labs in pratica?

Test in primo piano

Indice di censura

Bussola politica dell'IA

Indice di bias razziale

L'IA ti lascerebbe morire?

Test di QI dell'IA

Test IA nella vita reale

Domande frequenti

Gecko Tests

Dati

Risorse