测试版
基准测试 · Knowledge竞争中

Aider · Code Editing

已更新 2025-04-15
已测试模型
27
最高分
84.2
Claude 3.5 Sonnet
中位数
60.2
最低 14.3
前 5 名差距
σ 5.4
竞争激烈

Best score over time · one chart, every benchmark

AIDER · CODE EDITING16 MODELS · FRONTIER RUNNING MAX0255075100SCORE ↑May 24Aug 24Oct 24Jan 25Apr 25RELEASE DATE →benchgecko.ai/benchmark/aider-edit · frontier
Frontier on Aider · Code Editing rose from 72.9 to 84.2 in 7 months · +11.3 points · latest leader o1 from OpenAI.
Pink dots = frontier records · 2 totalClick to open model page

同类别 · 相关评测