LIVE268개 제공업체의 976개 AI 모델 추적 중.

BenchGecko베타

모델976·제공업체268·벤치마크128·기업71·에이전트165·1위Qwen3 VL 235B A22B Instruct · 1415.8%·업데이트1시간 전·데이터 포인트2,902·MCP 서버4,923

리더보드/Gemini 1.5 Pro (Feb 2024)

Gemini 1.5 Pro (Feb 2024)

제공 Google DeepMind · 출시일 2024-01-01

41.3

평균 점수

N/A

입력 가격

N/A

출력 가격

N/A

컨텍스트 윈도우

text

유형

Tested on 20 benchmarks with 41.3% average. Top scores: Chatbot Arena Elo — Overall (1322.5%), HELM — IFEval (83.7%), HELM — WildBench (81.3%).

벤치마크 점수

벤치마크	카테고리	점수	Bar
Chatbot Arena Elo — Overall	arena	1322.5
HELM — IFEval	language	83.7
HELM — WildBench	reasoning	81.3
BBH	reasoning	78.7
MMLU	knowledge	76.9
HELM — MMLU-Pro	knowledge	73.7
VideoMME	multimodal	66.7
Aider — Code Editing	coding	57.1
HELM — GPQA	knowledge	53.4
MATH level 5	math	40.8
HELM — Omni-MATH	math	36.4
CadEval	coding	34.0
GPQA diamond	knowledge	27.8
WeirdML	coding	22.2
Balrog	knowledge	21.0
SimpleBench	reasoning	12.5
Cybench	coding	7.5
OTIS Mock AIME 2024-2025	math	6.7
The Agent Company	agentic	3.4
ARC-AGI-2	reasoning	0.8

유사 모델

Claude Opus 4.1

Devstral 2 2512