Providers Countries MCP Servers Capabilities AI Pulse News Calculator Model Status

Agents/Kimi K2.5

Kimi K2.5

by Moonshot AI

70.8

best score

70.8%

Best Score

bash-only

Best Leaderboard

1

Models Used

Yes

Open Source

Score History

Entry	Leaderboard	Score	$/instance	Model	Date
Kimi K2.5 (high reasoning)	bash-only	70.8%	$0.15	kimi-k2.5	2026-02-17
mini-SWE-agent + Kimi K2.5 (high reasoning)	verified	70.8%	$0.15	kimi-k2.5	2026-02-17
Kimi K2.5	multilingual	67.3%	$0.69	kimi-k2.5	2026-02-13
Kimi K2 Thinking	bash-only	63.4%	$0.44	Kimi-K2-Thinking	2025-12-10
Kimi K2 Instruct	bash-only	43.8%	$0.53	Kimi-K2-Instruct	2025-08-07

Related Agents

Augment Agent v1

Prometheus-v1.2