베타

API

AI 모델 벤치마크 데이터에 대한 프로그래밍 방식 접근. 무료 등급 이용 가능합니다.

Free
$0
100 requests/day
  • 모든 공개 엔드포인트
  • JSON 응답
  • 출처 링크를 반드시 포함해야 합니다
Requires "Data by BenchGecko" attribution link
Pro
$29/mo
10,000 requests/day
  • 모든 공개 엔드포인트
  • CSV + JSON 내보내기
  • 과거 데이터 접근
  • 출처 표기 불필요
Enterprise
Custom
Unlimited
  • Pro의 모든 기능 포함
  • Webhook 알림
  • 맞춤 벤치마크
  • 우선 지원

무료 등급 출처 표기

무료 API 이용 시 BenchGecko 데이터를 표시하는 모든 페이지에 "Data by BenchGecko" 링크를 표시해야 합니다.

<!-- Add this wherever you display BenchGecko data -->
<a href="https://benchgecko.ai">Data by BenchGecko</a>
GET/api/v1/models

점수 및 가격을 포함한 모든 모델 목록

파라미터
providerstringFilter by provider slug (e.g. "anthropic")
open_sourcebooleanFilter open source models only
sortstringSort by: avg_score, pricing_input, release_date, context_window
limitnumberResults per page (default 50, max 200)
응답
{
  "data": [
    {
      "slug": "claude-opus-4",
      "name": "Claude Opus 4",
      "provider": "Anthropic",
      "avg_score": 84.2,
      "scores": {
        "mmlu-pro": 85.7,
        "gpqa-diamond": 74.9,
        "humaneval-plus": 91.2
      },
      "pricing": { "input": 15.00, "output": 75.00 },
      "context_window": 200000,
      "release_date": "2026-03-15"
    }
  ],
  "meta": { "total": 14, "page": 1 }
}
GET/api/v1/models/:slug

단일 모델의 상세 데이터 조회

응답
{
  "slug": "claude-opus-4",
  "name": "Claude Opus 4",
  "provider": { "name": "Anthropic", "slug": "anthropic" },
  "scores": [
    { "benchmark": "MMLU-Pro", "score": 85.7, "category": "knowledge" },
    { "benchmark": "GPQA Diamond", "score": 74.9, "category": "reasoning" }
  ],
  "pricing": { "input": 15.00, "output": 75.00 },
  "context_window": 200000,
  "max_output_tokens": 32000,
  "is_open_source": false,
  "release_date": "2026-03-15"
}
GET/api/v1/benchmarks

최고 점수 모델을 포함한 모든 벤치마크 목록

파라미터
categorystringFilter by category: coding, reasoning, math, knowledge
응답
{
  "data": [
    {
      "slug": "swe-bench-verified",
      "name": "SWE-bench Verified",
      "category": "coding",
      "top_models": [
        { "name": "Claude Opus 4", "score": 72.5 },
        { "name": "Claude Sonnet 4", "score": 70.3 }
      ]
    }
  ]
}
GET/api/v1/compare

두 개 이상의 모델을 직접 비교

파라미터
modelsstringComma-separated model slugs (e.g. "claude-opus-4,gpt-4-1,o3")
응답
{
  "models": ["claude-opus-4", "gpt-4-1", "o3"],
  "benchmarks": [
    {
      "name": "MMLU-Pro",
      "scores": { "claude-opus-4": 85.7, "gpt-4-1": 83.1, "o3": 87.2 }
    }
  ]
}

SDKs, Datasets & Open Source

Official client libraries for 11 languages, open datasets on Harvard Dataverse and Hugging Face, and full source code.

Explore the Developer Hub →

요청 제한

Free: 100 requests/day, 10 requests/minute

Pro: 10,000 requests/day, 100 requests/minute

Enterprise: Unlimited

Rate limit headers: X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset