LIVE
Apr 7Claude Mythos Preview · Anthropic's most capable model arrives·Mar 31GPT-5.4 Nano launched on OpenAI·Mar 31GPT-5.4 Mini joins the OpenAI lineup·Mar 30Claude Opus 4.5 input price dropped · $5.00 per 1M tokens·Mar 30Mistral Small 4 available via Mistral AI·Mar 29Gemini 2.5 Pro scores 94.1% on MMLU·Mar 29Grok 4.20 Multi-Agent Beta enters agent rankings·Mar 28DeepSeek V3.2 output price dropped · $0.38 per 1M tokens·Mar 287 new MCP servers added in dev-tools category·Mar 27Claude Sonnet 4.6 released by Anthropic·Mar 27Claude Opus 4.6 released by Anthropic·Mar 26OTIS Mock AIME 2024-2025 benchmark added·Mar 26Claude Opus 4.1 pricing increased · $15/$75 per 1M tokens·Mar 25Grok 4.20 Beta launched by xAI·Mar 25Inception added as a tracked provider·Mar 24DeepSeek R1 0528 posted 87.2% on GPQA Diamond·Mar 243 new MCP servers in AI/ML category·Mar 23GPT-4o Audio Preview marked as deprecated·Mar 23Mistral Medium 3.1 input price cut to $0.40 per 1M tokens·Mar 22DeepSeek V3.2 Speciale released·Mar 22WeirdML benchmark now tracked on BenchGecko·Mar 20Nemotron 3 Super (120B) launched by NVIDIA·Mar 20Gemini 2.5 Flash Lite priced at $0.10/$0.40 per 1M tokens·Mar 18Mistral Large 3 2512 released by Mistral AI·Mar 18Grok Code Fast 1 added to agent rankings·Mar 16Claude Sonnet 4.5 scores 91.7% on MMLU·Mar 1612 new MCP servers added across 5 categories·Mar 14GPT-5.4 Pro launched · OpenAI's new flagship·Mar 14GPT-5.4 standard tier released by OpenAI·Mar 12Grok 3 Mini marked as deprecated by xAI·Mar 12Llama 3.3 Nemotron Super 49B pricing dropped·Mar 10Liquid added as a tracked provider·Mar 10MiniMax M2.7 released by MiniMax·Mar 8Grok 4 posted 89.4% on GPQA Diamond·Mar 8LAMBADA benchmark scores now tracked·Mar 5Gemini 2.5 Flash output price reduced to $2.50 per 1M tokens·Mar 5Mercury 2 launched by Inception·Mar 3Qwen3.5-Flash released by Alibaba Qwen·Mar 35 new MCP servers added · finance and auth categories·Apr 7Claude Mythos Preview · Anthropic's most capable model arrives·Mar 31GPT-5.4 Nano launched on OpenAI·Mar 31GPT-5.4 Mini joins the OpenAI lineup·Mar 30Claude Opus 4.5 input price dropped · $5.00 per 1M tokens·Mar 30Mistral Small 4 available via Mistral AI·Mar 29Gemini 2.5 Pro scores 94.1% on MMLU·Mar 29Grok 4.20 Multi-Agent Beta enters agent rankings·Mar 28DeepSeek V3.2 output price dropped · $0.38 per 1M tokens·Mar 287 new MCP servers added in dev-tools category·Mar 27Claude Sonnet 4.6 released by Anthropic·Mar 27Claude Opus 4.6 released by Anthropic·Mar 26OTIS Mock AIME 2024-2025 benchmark added·Mar 26Claude Opus 4.1 pricing increased · $15/$75 per 1M tokens·Mar 25Grok 4.20 Beta launched by xAI·Mar 25Inception added as a tracked provider·Mar 24DeepSeek R1 0528 posted 87.2% on GPQA Diamond·Mar 243 new MCP servers in AI/ML category·Mar 23GPT-4o Audio Preview marked as deprecated·Mar 23Mistral Medium 3.1 input price cut to $0.40 per 1M tokens·Mar 22DeepSeek V3.2 Speciale released·Mar 22WeirdML benchmark now tracked on BenchGecko·Mar 20Nemotron 3 Super (120B) launched by NVIDIA·Mar 20Gemini 2.5 Flash Lite priced at $0.10/$0.40 per 1M tokens·Mar 18Mistral Large 3 2512 released by Mistral AI·Mar 18Grok Code Fast 1 added to agent rankings·Mar 16Claude Sonnet 4.5 scores 91.7% on MMLU·Mar 1612 new MCP servers added across 5 categories·Mar 14GPT-5.4 Pro launched · OpenAI's new flagship·Mar 14GPT-5.4 standard tier released by OpenAI·Mar 12Grok 3 Mini marked as deprecated by xAI·Mar 12Llama 3.3 Nemotron Super 49B pricing dropped·Mar 10Liquid added as a tracked provider·Mar 10MiniMax M2.7 released by MiniMax·Mar 8Grok 4 posted 89.4% on GPQA Diamond·Mar 8LAMBADA benchmark scores now tracked·Mar 5Gemini 2.5 Flash output price reduced to $2.50 per 1M tokens·Mar 5Mercury 2 launched by Inception·Mar 3Qwen3.5-Flash released by Alibaba Qwen·Mar 35 new MCP servers added · finance and auth categories·
AI 경제를, 추적합니다.
펄스20·건강
버블278%·불안정
Claude Mythos Preview+4.1
Open Source16.2%
프로바이더 상태 · 24시간전체 상태 →
순위
Qwen3.5 397B A17B
#1
96.3
$0.39/M
DeepSeek V3.2 Speciale
#2
95.2
$0.40/M
GPT-5.4 Pro
#3
93.0
$30.00/M
GPT-5.1-Codex-Max
#4
91.2
$1.25/M
Gemini 3.1 Pro Preview
#5
90.0
$2.00/M
Step 3.5 Flash
#6
89.5
$0.10/M
GPT-5 Chat
#7
89.0
$1.25/M
Qwen3.6 Plus
#8
88.7
$0.33/M
GLM 5.1
#9
87.0
$1.05/M
GPT-5.2-Codex
#10
85.4
$1.75/M
GPT-5.4
#11
83.4
$2.50/M
Claude Opus 4.6 (Fast)
#12
83.3
$30.00/M
GPT-5.1-Codex
#13
82.8
$1.25/M
바 너비 · 평균 벤치마크 점수 · 색상 · 카테고리
The Pulse
펄스
20 /100
healthy
7d · +3 pts
버블 지수 · 구성 요소
Valuation Premium+2.1
Funding Acceleration+1.5
Concentration Risk0
Revenue Quality+1.4
Capex Gap+0.3
최대 변동 · Valuation Premium 상승 2.1 pts
AI 버블 지수278%
건전과열 조짐과열버블
크로스 레이어 인사이트
최신 벤치마크 변동
전체 →오늘의 AI
전체 →Apr 7
Claude Mythos Preview · Anthropic's most capable model arrivesMar 31
GPT-5.4 Nano launched on OpenAIMar 31
GPT-5.4 Mini joins the OpenAI lineupMar 30
Claude Opus 4.5 input price dropped · $5.00 per 1M tokensMar 30
Mistral Small 4 available via Mistral AIMar 29
Gemini 2.5 Pro scores 94.1% on MMLUMar 29
Grok 4.20 Multi-Agent Beta enters agent rankingsMar 28
DeepSeek V3.2 output price dropped · $0.38 per 1M tokensMar 287 new MCP servers added in dev-tools categoryMar 27
Claude Sonnet 4.6 released by AnthropicMar 27
Claude Opus 4.6 released by AnthropicMar 26OTIS Mock AIME 2024-2025 benchmark added
추가 지표
Gecko Pulse
20+3
Pulse rose +3 this week · Claude Mythos Preview drove benchmark velocity.
AI Bubble Index
278%↑
frothy · valuation premium leading the move.
Mindshare Pulse
78+12
Narrative energy spread across models · no single winner.
AICDI · Compute
71+2
Data-center intensity climbing · HBM bookings tight.
FCI · Foundries
62+1
TSMC N3 utilisation above 90% · queue deepening.
MDI · Memory
84+4
HBM3E scarcity driving GPU street prices up.
HBM Tension
50+3
Lead times stretching past 52 weeks · supply cliff watch.
Capex / Rev Gap
3.4×+0.2×
Hyperscaler capex outpacing AI revenue by 3.4× · widening.
The Matrix · 상위 20개 모델
| # | 벤치마크 | ||||
|---|---|---|---|---|---|
| 1 | 100.0 | — | 1000K | 14 | |
| 2 | 96.3 | $0.39 | 262K | 11 | |
| 3 | 95.2 | $0.40 | 164K | 9 | |
| 4 | 93.0 | $30.00 | 1050K | 8 | |
| 5 | 91.2 | $1.25 | 400K | 8 | |
| 6 | 90.0 | $2.00 | 1049K | 23 | |
| 7 | 89.5 | $0.10 | 262K | 10 | |
| 8 | 89.0 | $1.25 | 128K | 7 | |
| 9 | 88.7 | $0.33 | 1000K | 11 | |
| 10 | 88.3 | — | — | 11 | |
| 11 | HA Qwen2.5 72B Instruct Abliterated | 87.5 | — | — | 6 |
| 12 | 87.0 | $1.05 | 203K | 12 | |
| 13 | 85.4 | $1.75 | 400K | 9 | |
| 14 | 84.6 | — | — | 4 | |
| 15 | 84.4 | — | — | 7 | |
| 16 | 83.4 | $2.50 | 1050K | 16 | |
| 17 | 83.3 | $30.00 | 1000K | 12 | |
| 18 | 82.8 | $1.25 | 400K | 8 | |
| 19 | 81.7 | $0.09 | 262K | 11 | |
| 20 | 81.3 | — | — | 7 |
The Stack · 10개 데이터 레이어
모델
벤치마크, 가격, 컨텍스트 · 모든 프론티어 모델
976 추적 중
프로바이더
모든 AI 추론 프로바이더의 가용성 매트릭스
268 추적 중
에이전트
SWE-bench · MLE-bench · OSWorld 등
165 추적 중
벤치마크
모든 주요 벤치마크의 점수 변화
128 추적 중
이코노미
버블 지수 · 밸류에이션 · 펀딩 · 시가총액
71 기업
화제
Kaito 스타일 모든 시그널 어텐션 추적
93 엔티티
인프라
칩 · 파운드리 · 메모리 · 시스템 · 에너지
6개 지수
가격
차익 거래 탐색기 · 대체 모델 탐색기 · 무료 등급 추적기
실시간
Learn
251개 용어 · 글로서리 · 학습 경로
251개 용어
비교
유니버설 비교 · 모델 · 에이전트 · 프로바이더
15+ 라우트
AI 학습
전체 경로 →경로 · 7 용어
The AI Bubble Explained
Seven terms that decode whether AI is overpriced, fairly priced, or criminally underpriced. Read in order.
경로 · 6 용어
Pick an AI Model
Six terms to go from "I need an AI" to "here is the cheapest model that meets my spec."
경로 · 7 용어
From Sand to Model
The AI supply chain in 7 terms · foundry, memory, chip, system, datacenter, provider, API.
방법론 · FAQ · 최신성
전체 방법론 →BenchGecko 데이터는 얼마나 자주 업데이트됩니까?›
모델 및 벤치마크 데이터는 1차 출처에서 매일 갱신합니다. 가격은 모든 프로바이더 API에서 순환 방식으로 수집합니다. 화제 시그널은 주간 단위로 집계합니다. 펄스는 매일 00:00 UTC에 재산출합니다.
펄스란 무엇입니까?›
AI 경제 건전성의 0-100 복합 점수입니다. 역 버블 지수, 벤치마크 속도, 가격 압축, 화제 다양성, 공급망 긴장을 하나의 숫자로 결합합니다. 낮을수록 건전합니다.
벤치마크 점수는 어떻게 정규화됩니까?›
모든 벤치마크는 점수가 매겨진 전체 모델 세트에 대해 min-max 정규화합니다. 순위는 모델당 3개 이상 벤치마크에 걸쳐 정규화된 점수를 평균하여 단일 테스트의 과대 반영을 방지합니다.
가격 데이터의 출처는 어디입니까?›
프로바이더 API 직접 응답 · OpenRouter, OpenAI, Anthropic, Google, xAI, DeepSeek, Mistral 등. 모든 스냅샷은 모델 상세 페이지에 출처 표기와 함께 캐시됩니다.
BenchGecko 데이터를 인용할 수 있습니까?›
가능합니다. 모든 페이지에 APA, MLA, BibTeX, Chicago, 일반 텍스트 형식의 공유 및 인용 바를 제공합니다. 무료 API 등급에서는 출처 표기가 필수이며, 모든 곳에서 권장합니다.
출처 ·OpenRouterEpoch AISWE-benchMCP RegistryChatbot ArenaHuggingFaceLiveBenchArtificial AnalysisSEALAider
2시간 전 업데이트 · 10개 이상의 권위 있는 출처 · 편집 콘텐츠 없음