Méthodologie

Comment on collecte les données, ce qu'on suit, et à quelle fréquence.

OpenRouter API

Quotidien

Model pricing (9 tiers: input, output, cache read/write, reasoning, image, audio, web search, per-request), context windows, modalities, supported parameters, deprecation dates.

Source: https://openrouter.ai/api/v1/modelsLicence: Public API, no authentication required

Epoch AI

Hebdomadaire

Benchmark scores across 40+ benchmarks for 168+ models. Normalized 0-1 scores. Training compute and cost data for 3,200+ models.

Source: https://epoch.ai/dataLicence: CC-BY 4.0

SWE-bench

Hebdomadaire

Software engineering task resolution rates across 6 leaderboard variants (Verified, Lite, Full, bash-only, Multilingual, Multimodal). Cost per instance. Open-source flags.

Source: https://www.swebench.comLicence: Open data

MCP Registry

Quotidien

4,000+ MCP server listings with package info, transport types, and repository links.

Source: https://registry.modelcontextprotocol.ioLicence: Open API

HuggingFace

Hebdomadaire

Model metadata · parameter counts, downloads, likes, licenses, model types, and last modified dates for 650+ models.

Source: https://huggingface.co/api/modelsLicence: Public API, no authentication required

Ollama Registry

Hebdomadaire

Locally-runnable models · model names, sizes, quantization options for on-device inference.

Source: https://ollama.com/api/tagsLicence: Public API

Official Provider Reports

À la sortie

Benchmark scores published by model providers (Anthropic, OpenAI, Google, Meta, etc.) in model cards and technical reports.

Licence: Public

Les scores sont affichés tels que rapportés par leur source. Aucun ajustement, pondération ou normalisation inter-benchmarks sauf mention explicite.

Quand un modèle a plusieurs scores pour le même benchmark, on utilise le score officiel publié par le fournisseur. En l'absence de score officiel, on prend l'évaluation indépendante la plus récente.

La colonne « Moy. » est une moyenne arithmétique non pondérée de tous les benchmarks testés. C’est un signal approximatif, pas un classement définitif.

Tous les prix proviennent de l'API publique OpenRouter et reflètent le meilleur fournisseur disponible. Les prix sont affichés par million de tokens. On suit 9 niveaux de tarification.

Les prix sont vérifiés quotidiennement. Chaque changement de prix est enregistré avec un horodatage.

La disponibilité est mesurée par des requêtes de vérification toutes les 60 secondes depuis US-East. On enregistre le temps de réponse et le code HTTP.

Le pourcentage de disponibilité est calculé sur une fenêtre glissante de 30 jours.

Un modèle est marqué « Open Source » si ses poids sont disponibles publiquement sous licence approuvée OSI ou sous licence communautaire permissive.

Type de donnéesFréquence
Tarification APIQuotidien
Disponibilité fournisseursToutes les 60 secondes
Scores de benchmarkÀ chaque sortie + balayage hebdomadaire
Serveurs MCPQuotidien
GitHub Stars/ForksQuotidien
Répertoire de modèlesQuotidien (depuis OpenRouter)

Si vous trouvez une erreur, ouvrez un ticket sur notre dépôt GitHub ou contactez-nous sur Twitter @BenchGecko.

Construit par l'équipe BenchGecko. Alimenté par les données de l'écosystème IA ouvert.