API
Acesso programático a dados de benchmark de modelos IA. Tier grátis disponível.
Free
$0
100 requests/day
- Todos os endpoints públicos
- Respostas em JSON
- Precisa incluir link de atribuição
Requires "Data by BenchGecko" attribution link
Pro
$29/mo
10,000 requests/day
- Todos os endpoints públicos
- Exportação CSV + JSON
- Acesso a dados históricos
- Sem atribuição necessária
Enterprise
Custom
Unlimited
- Tudo do Pro
- Notificações via webhook
- Benchmarks personalizados
- Suporte prioritário
Atribuição do tier grátis
O acesso grátis à API exige um link visível "Fonte · BenchGecko" em qualquer página que exiba nossos dados.
<!-- Add this wherever you display BenchGecko data -->
<a href="https://benchgecko.ai">Data by BenchGecko</a>
<a href="https://benchgecko.ai">Data by BenchGecko</a>
Endpoints
GET
/api/v1/modelsListar todos os modelos com notas e preços
Parâmetros
providerstringFilter by provider slug (e.g. "anthropic")open_sourcebooleanFilter open source models onlysortstringSort by: avg_score, pricing_input, release_date, context_windowlimitnumberResults per page (default 50, max 200)Resposta
{
"data": [
{
"slug": "claude-opus-4",
"name": "Claude Opus 4",
"provider": "Anthropic",
"avg_score": 84.2,
"scores": {
"mmlu-pro": 85.7,
"gpqa-diamond": 74.9,
"humaneval-plus": 91.2
},
"pricing": { "input": 15.00, "output": 75.00 },
"context_window": 200000,
"release_date": "2026-03-15"
}
],
"meta": { "total": 14, "page": 1 }
}GET
/api/v1/models/:slugPegar dados detalhados de um modelo específico
Resposta
{
"slug": "claude-opus-4",
"name": "Claude Opus 4",
"provider": { "name": "Anthropic", "slug": "anthropic" },
"scores": [
{ "benchmark": "MMLU-Pro", "score": 85.7, "category": "knowledge" },
{ "benchmark": "GPQA Diamond", "score": 74.9, "category": "reasoning" }
],
"pricing": { "input": 15.00, "output": 75.00 },
"context_window": 200000,
"max_output_tokens": 32000,
"is_open_source": false,
"release_date": "2026-03-15"
}GET
/api/v1/benchmarksListar todos os benchmarks com os modelos que mais pontuaram
Parâmetros
categorystringFilter by category: coding, reasoning, math, knowledgeResposta
{
"data": [
{
"slug": "swe-bench-verified",
"name": "SWE-bench Verified",
"category": "coding",
"top_models": [
{ "name": "Claude Opus 4", "score": 72.5 },
{ "name": "Claude Sonnet 4", "score": 70.3 }
]
}
]
}GET
/api/v1/compareComparar dois ou mais modelos lado a lado
Parâmetros
modelsstringComma-separated model slugs (e.g. "claude-opus-4,gpt-4-1,o3")Resposta
{
"models": ["claude-opus-4", "gpt-4-1", "o3"],
"benchmarks": [
{
"name": "MMLU-Pro",
"scores": { "claude-opus-4": 85.7, "gpt-4-1": 83.1, "o3": 87.2 }
}
]
}SDKs, Datasets & Open Source
Official client libraries for 11 languages, open datasets on Harvard Dataverse and Hugging Face, and full source code.
Explore the Developer Hub →Limites de taxa
Free: 100 requests/day, 10 requests/minute
Pro: 10,000 requests/day, 100 requests/minute
Enterprise: Unlimited
Rate limit headers: X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset