实时正在追踪来自268家提供商的976个AI模型。

BenchGecko测试版

模型976·提供商268·基准测试128·公司71·智能体165·榜首Qwen3 VL 235B A22B Instruct · 1415.8%·已更新1小时前·数据点2,902·MCP服务器4,923

排行榜/GPT-4.1 Nano

GPT-4.1 Nano

来自 OpenAI · 发布于 2025-04-14

35.2

平均分

$0.10/1M

输入价格

$0.40/1M

输出价格

1.0M tokens (~524 books)

上下文窗口

multimodal

类型

Tested on 14 benchmarks with 35.2% average. Top scores: HELM — IFEval (84.3%), HELM — WildBench (81.1%), MATH level 5 (70.0%).

基准测试分数

基准测试	类别	分数	Bar
HELM — IFEval	language	84.3
HELM — WildBench	reasoning	81.1
MATH level 5	math	70.0
HELM — MMLU-Pro	knowledge	55.0
HELM — GPQA	knowledge	50.7
HELM — Omni-MATH	math	36.7
GPQA diamond	knowledge	31.9
OTIS Mock AIME 2024-2025	math	28.8
Fiction.LiveBench	knowledge	25.0
WeirdML	coding	19.0
Aider polyglot	coding	8.9
FrontierMath-2025-02-28-Private	math	1.0
ARC-AGI-2	reasoning	0.1
ARC-AGI	reasoning	0.1

相似模型

Qwen2.5 7B Instruct

GPT-4o (2024-08-06)

OpenAI GPT-4.1 时间线

GPT-4.1Apr 2025

$2.00/M in1.0Mctx22 benchmarks

GPT-4.1 MiniApr 2025

$0.40/M in(-1.60)1.0Mctx16 benchmarks

GPT-4.1 NanoApr 2025

$0.10/M in(-0.30)1.0Mctx14 benchmarks