API

Accesso programmatico ai dati benchmark dei modelli IA. Piano gratuito disponibile.

Free

100 requests/day

Tutti gli endpoint pubblici
Risposte JSON
Attribuzione obbligatoria con link

Requires "Data by BenchGecko" attribution link

Pro

$29/mo

10,000 requests/day

Tutti gli endpoint pubblici
Export CSV + JSON
Accesso ai dati storici
Nessuna attribuzione richiesta

Enterprise

Custom

Unlimited

Tutto il piano Pro incluso
Notifiche webhook
Benchmark personalizzati
Supporto prioritario

Attribuzione piano gratuito

L'accesso gratuito alle API richiede un link visibile "Fonte · BenchGecko" su ogni pagina che mostra i nostri dati.

<a href="https://benchgecko.ai">Data by BenchGecko</a>

Endpoint

GET/api/v1/models

Elenca tutti i modelli con punteggi e prezzi

Parametri

providerstringFilter by provider slug (e.g. "anthropic")

open_sourcebooleanFilter open source models only

sortstringSort by: avg_score, pricing_input, release_date, context_window

limitnumberResults per page (default 50, max 200)

Risposta

{
  "data": [
    {
      "slug": "claude-opus-4",
      "name": "Claude Opus 4",
      "provider": "Anthropic",
      "avg_score": 84.2,
      "scores": {
        "mmlu-pro": 85.7,
        "gpqa-diamond": 74.9,
        "humaneval-plus": 91.2
      },
      "pricing": { "input": 15.00, "output": 75.00 },
      "context_window": 200000,
      "release_date": "2026-03-15"
    }
  ],
  "meta": { "total": 14, "page": 1 }
}

GET/api/v1/models/:slug

Restituisce i dati completi di un singolo modello

Risposta

{
  "slug": "claude-opus-4",
  "name": "Claude Opus 4",
  "provider": { "name": "Anthropic", "slug": "anthropic" },
  "scores": [
    { "benchmark": "MMLU-Pro", "score": 85.7, "category": "knowledge" },
    { "benchmark": "GPQA Diamond", "score": 74.9, "category": "reasoning" }
  ],
  "pricing": { "input": 15.00, "output": 75.00 },
  "context_window": 200000,
  "max_output_tokens": 32000,
  "is_open_source": false,
  "release_date": "2026-03-15"
}

GET/api/v1/benchmarks

Elenca tutti i benchmark con i migliori modelli per punteggio

Parametri

categorystringFilter by category: coding, reasoning, math, knowledge

Risposta

{
  "data": [
    {
      "slug": "swe-bench-verified",
      "name": "SWE-bench Verified",
      "category": "coding",
      "top_models": [
        { "name": "Claude Opus 4", "score": 72.5 },
        { "name": "Claude Sonnet 4", "score": 70.3 }
      ]
    }
  ]
}

GET/api/v1/compare

Confronta due o più modelli direttamente

Parametri

modelsstringComma-separated model slugs (e.g. "claude-opus-4,gpt-4-1,o3")

Risposta

{
  "models": ["claude-opus-4", "gpt-4-1", "o3"],
  "benchmarks": [
    {
      "name": "MMLU-Pro",
      "scores": { "claude-opus-4": 85.7, "gpt-4-1": 83.1, "o3": 87.2 }
    }
  ]
}

SDKs, Datasets & Open Source

Official client libraries for 11 languages, open datasets on Harvard Dataverse and Hugging Face, and full source code.

Explore the Developer Hub →

Limiti di frequenza

Free: 100 requests/day, 10 requests/minute

Pro: 10,000 requests/day, 100 requests/minute

Enterprise: Unlimited

Rate limit headers: X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset