LIVE267개 제공업체의 994개 AI 모델 추적 중.

BenchGecko베타

Charts·Build live AI market views Open charts 나만의 차트 만들기

LIVE

Apr 7Claude Mythos Preview · Anthropic's most capable model arrives·Mar 31GPT-5.4 Nano launched on OpenAI·Mar 31GPT-5.4 Mini joins the OpenAI lineup·Mar 30Claude Opus 4.5 input price dropped · $5.00 per 1M tokens·Mar 30Mistral Small 4 available via Mistral AI·Mar 29Gemini 2.5 Pro scores 94.1% on MMLU·Mar 29Grok 4.20 Multi-Agent Beta enters agent rankings·Mar 28DeepSeek V3.2 output price dropped · $0.38 per 1M tokens·Mar 287 new MCP servers added in dev-tools category·Mar 27Claude Sonnet 4.6 released by Anthropic·Mar 27Claude Opus 4.6 released by Anthropic·Mar 26OTIS Mock AIME 2024-2025 benchmark added·Mar 26Claude Opus 4.1 pricing increased · $15/$75 per 1M tokens·Mar 25Grok 4.20 Beta launched by xAI·Mar 25Inception added as a tracked provider·Mar 24DeepSeek R1 0528 posted 87.2% on GPQA Diamond·Mar 243 new MCP servers in AI/ML category·Mar 23GPT-4o Audio Preview marked as deprecated·Mar 23Mistral Medium 3.1 input price cut to $0.40 per 1M tokens·Mar 22DeepSeek V3.2 Speciale released·Mar 22WeirdML benchmark now tracked on BenchGecko·Mar 20Nemotron 3 Super (120B) launched by NVIDIA·Mar 20Gemini 2.5 Flash Lite priced at $0.10/$0.40 per 1M tokens·Mar 18Mistral Large 3 2512 released by Mistral AI·Mar 18Grok Code Fast 1 added to agent rankings·Mar 16Claude Sonnet 4.5 scores 91.7% on MMLU·Mar 1612 new MCP servers added across 5 categories·Mar 14GPT-5.4 Pro launched · OpenAI's new flagship·Mar 14GPT-5.4 standard tier released by OpenAI·Mar 12Grok 3 Mini marked as deprecated by xAI·Mar 12Llama 3.3 Nemotron Super 49B pricing dropped·Mar 10Liquid added as a tracked provider·Mar 10MiniMax M2.7 released by MiniMax·Mar 8Grok 4 posted 89.4% on GPQA Diamond·Mar 8LAMBADA benchmark scores now tracked·Mar 5Gemini 2.5 Flash output price reduced to $2.50 per 1M tokens·Mar 5Mercury 2 launched by Inception·Mar 3Qwen3.5-Flash released by Alibaba Qwen·Mar 35 new MCP servers added · finance and auth categories·Apr 7Claude Mythos Preview · Anthropic's most capable model arrives·Mar 31GPT-5.4 Nano launched on OpenAI·Mar 31GPT-5.4 Mini joins the OpenAI lineup·Mar 30Claude Opus 4.5 input price dropped · $5.00 per 1M tokens·Mar 30Mistral Small 4 available via Mistral AI·Mar 29Gemini 2.5 Pro scores 94.1% on MMLU·Mar 29Grok 4.20 Multi-Agent Beta enters agent rankings·Mar 28DeepSeek V3.2 output price dropped · $0.38 per 1M tokens·Mar 287 new MCP servers added in dev-tools category·Mar 27Claude Sonnet 4.6 released by Anthropic·Mar 27Claude Opus 4.6 released by Anthropic·Mar 26OTIS Mock AIME 2024-2025 benchmark added·Mar 26Claude Opus 4.1 pricing increased · $15/$75 per 1M tokens·Mar 25Grok 4.20 Beta launched by xAI·Mar 25Inception added as a tracked provider·Mar 24DeepSeek R1 0528 posted 87.2% on GPQA Diamond·Mar 243 new MCP servers in AI/ML category·Mar 23GPT-4o Audio Preview marked as deprecated·Mar 23Mistral Medium 3.1 input price cut to $0.40 per 1M tokens·Mar 22DeepSeek V3.2 Speciale released·Mar 22WeirdML benchmark now tracked on BenchGecko·Mar 20Nemotron 3 Super (120B) launched by NVIDIA·Mar 20Gemini 2.5 Flash Lite priced at $0.10/$0.40 per 1M tokens·Mar 18Mistral Large 3 2512 released by Mistral AI·Mar 18Grok Code Fast 1 added to agent rankings·Mar 16Claude Sonnet 4.5 scores 91.7% on MMLU·Mar 1612 new MCP servers added across 5 categories·Mar 14GPT-5.4 Pro launched · OpenAI's new flagship·Mar 14GPT-5.4 standard tier released by OpenAI·Mar 12Grok 3 Mini marked as deprecated by xAI·Mar 12Llama 3.3 Nemotron Super 49B pricing dropped·Mar 10Liquid added as a tracked provider·Mar 10MiniMax M2.7 released by MiniMax·Mar 8Grok 4 posted 89.4% on GPQA Diamond·Mar 8LAMBADA benchmark scores now tracked·Mar 5Gemini 2.5 Flash output price reduced to $2.50 per 1M tokens·Mar 5Mercury 2 launched by Inception·Mar 3Qwen3.5-Flash released by Alibaba Qwen·Mar 35 new MCP servers added · finance and auth categories·

AI 경제를, 추적합니다.

오늘의 AI · Claude Mythos Preview · Anthropic's most capable model arrives

펄스32·불안정

버블278%·불안정

GPT-5.5 Pro+4.0

Open Source16.2%

프로바이더 상태 · 24시간전체 상태 →

순위

Qwen3.5 397B A17B

DeepSeek V3.2 Speciale

GPT-5.1-Codex-Max

Gemini 3.1 Pro Preview

Claude Opus 4.6 (Fast)

바 너비 · 평균 벤치마크 점수 · 색상 · 카테고리

화제 아레나

전체 펄스 보기 →

Claude Mythos Preview

Claude Opus 4.6

DeepSeek V3.2 Speciale

타일 크기 · 점유율 · 색상 · 7일 추세 (녹색 상승, 적색 하락)

The Pulse

이코노미 →

펄스

32

frothy

7d · +3 pts

버블 지수 · 구성 요소

Valuation Premiumhealthy+2.1

Funding Accelerationhealthy+1.5

Concentration Riskhealthy0

Revenue Qualityhealthy+1.4

Capex Gaphealthy+0.3

최대 변동 · Valuation Premium 상승 2.1 pts

AI 버블 지수278%

건전과열 조짐과열버블

업데이트 Jun 7·방법론·리서치·무료 API·개발자

크로스 레이어 시그널 · 1 / 5

Step 3.5 Flash matches top-10 benchmark performance at 100% less cost than GPT-5.5 Pro.

최신 벤치마크 변동

Claude Mythos Preview

Qwen3.5 397B A17B

DeepSeek V3.2 Speciale

칩 효율 경쟁

오늘의 AI

Claude Mythos Preview · Anthropic's most capable model arrives Mar 31

GPT-5.4 Nano launched on OpenAI Mar 31

GPT-5.4 Mini joins the OpenAI lineup Mar 30

Claude Opus 4.5 input price dropped · $5.00 per 1M tokens Mar 30

Mistral Small 4 available via Mistral AI Mar 29

Gemini 2.5 Pro scores 94.1% on MMLU Mar 29

Grok 4.20 Multi-Agent Beta enters agent rankings Mar 28

DeepSeek V3.2 output price dropped · $0.38 per 1M tokens Mar 287 new MCP servers added in dev-tools category Mar 27

Claude Sonnet 4.6 released by Anthropic Mar 27

Claude Opus 4.6 released by Anthropic Mar 26OTIS Mock AIME 2024-2025 benchmark added

추가 지표

Pulse rose +3 this week · GPT-5.5 Pro drove benchmark velocity.

AI Bubble Index

frothy · valuation premium leading the move.

Mindshare Pulse

Narrative energy spread across models · no single winner.

AICDI · Compute

Data-center intensity climbing · HBM bookings tight.

FCI · Foundries

TSMC N3 utilisation above 90% · queue deepening.

HBM3E scarcity driving GPU street prices up.

Lead times stretching past 52 weeks · supply cliff watch.

Capex / Rev Gap

Hyperscaler capex outpacing AI revenue by 3.4× · widening.

The Matrix · 상위 20개 모델

전체 매트릭스 →

#					벤치마크
1	GPT-5.5 Pro	99.9	$30.00	400K	3
2	Claude Mythos Preview	99.8	—	1000K	14
3	Qwen3.5 397B A17B	96.3	$0.39	262K	11
4	DeepSeek V3.2 Speciale	95.2	$0.40	164K	9
5	GPT-5.4 Pro	93.0	$30.00	1050K	8
6	GPT-5.1-Codex-Max	91.2	$1.25	400K	8
7	Gemini 3.1 Pro Preview	90.0	$2.00	1049K	23
8	Step 3.5 Flash	89.5	$0.10	262K	10
9	GPT-5 Chat	89.0	$1.25	128K	7
10	Qwen3.6 Plus	88.7	$0.33	1000K	11
11	DeepSeek R1 Distill Qwen 14B	88.3	—	—	11
12	HA Qwen2.5 72B Instruct Abliterated	87.5	—	—	6
13	GLM 5.1	87.0	$1.05	203K	12
14	GPT-5.2-Codex	85.4	$1.75	400K	9
15	Claude Instant	84.6	—	—	4
16	DeepSeek-V2 (MoE-236B, May 2024)	84.4	—	—	7
17	GPT-5.4	83.4	$2.50	1050K	16
18	Claude Opus 4.6 (Fast)	83.3	$30.00	1000K	12
19	GPT-5.1-Codex	82.8	$1.25	400K	8
20	MiMo-V2-Flash	81.7	$0.09	262K	11

스택 · 11개 데이터 레이어

벤치마크, 가격, 컨텍스트 · 모든 프론티어 모델

프로바이더

모든 AI 추론 프로바이더의 가용성 매트릭스

SWE-bench · MLE-bench · OSWorld 등

모든 주요 벤치마크의 점수 변화

리서치 라이브러리 · 방법론 · 노트 · 소스 맵

버블 지수 · 밸류에이션 · 펀딩 · 시가총액

Kaito 스타일 모든 시그널 어텐션 추적

칩 · 파운드리 · 메모리 · 시스템 · 에너지

차익 거래 탐색기 · 대체 모델 탐색기 · 무료 등급 추적기

251개 용어 · 글로서리 · 학습 경로

유니버설 비교 · 모델 · 에이전트 · 프로바이더

AI 학습

전체 경로 →

경로 · 7 용어

The AI Bubble Explained

Seven terms that decode whether AI is overpriced, fairly priced, or criminally underpriced. Read in order.

경로 · 6 용어

Pick an AI Model

Six terms to go from "I need an AI" to "here is the cheapest model that meets my spec."

경로 · 7 용어

From Sand to Model

The AI supply chain in 7 terms · foundry, memory, chip, system, datacenter, provider, API.

검색 297 AI 용어 · 트랜스포머에서 어텐션 프리미엄까지열기 →

주요 지표

AI 생태계 건전성 · 0-100 복합 지수

전체 차트 보기 →

AI 버블 지수

현재 수치 vs 닷컴 피크

전체 차트 보기 →

화제 아레나

모델 간 점유율

전체 차트 보기 →

평균 벤치마크 점수 기준 상위 모델

전체 차트 보기 →

메모리 공급 긴장 지수

전체 차트 보기 →

급증하는 Capex

하이퍼스케일러 AI capex 궤적

전체 차트 보기 →

방법론 · FAQ · 최신성

전체 방법론 →

BenchGecko 데이터는 얼마나 자주 업데이트됩니까?›

모델 및 벤치마크 데이터는 1차 출처에서 매일 갱신합니다. 가격은 모든 프로바이더 API에서 순환 방식으로 수집합니다. 화제 시그널은 주간 단위로 집계합니다. 펄스는 매일 00:00 UTC에 재산출합니다.

펄스란 무엇입니까?›

AI 경제 건전성의 0-100 복합 점수입니다. 역 버블 지수, 벤치마크 속도, 가격 압축, 화제 다양성, 공급망 긴장을 하나의 숫자로 결합합니다. 낮을수록 건전합니다.

벤치마크 점수는 어떻게 정규화됩니까?›

모든 벤치마크는 점수가 매겨진 전체 모델 세트에 대해 min-max 정규화합니다. 순위는 모델당 3개 이상 벤치마크에 걸쳐 정규화된 점수를 평균하여 단일 테스트의 과대 반영을 방지합니다.

가격 데이터의 출처는 어디입니까?›

프로바이더 API 직접 응답 · OpenRouter, OpenAI, Anthropic, Google, xAI, DeepSeek, Mistral 등. 모든 스냅샷은 모델 상세 페이지에 출처 표기와 함께 캐시됩니다.

BenchGecko 데이터를 인용할 수 있습니까?›

가능합니다. 모든 페이지에 APA, MLA, BibTeX, Chicago, 일반 텍스트 형식의 공유 및 인용 바를 제공합니다. 무료 API 등급에서는 출처 표기가 필수이며, 모든 곳에서 권장합니다.

출처 ·OpenRouterEpoch AISWE-benchMCP RegistryChatbot ArenaHuggingFaceLiveBenchArtificial AnalysisSEALAider

2시간 전 업데이트 · 10개 이상의 권위 있는 출처 · 편집 콘텐츠 없음·Learn · Glossary·리서치·Developers