How much does gpt-oss-120b (free) cost?

gpt-oss-120b (free) costs $0.00 per million input tokens and $0.00 per million output tokens. For a typical conversation (~2,000 tokens), that's approximately $0.000 per message.

What benchmarks has gpt-oss-120b (free) been tested on?

gpt-oss-120b (free) has been evaluated on 10 benchmarks. Top scores: OpenCompass — AIME2025: 93.4, OpenCompass — IFEval: 90.2, OpenCompass — MMLU-Pro: 79.7.

Is gpt-oss-120b (free) open source?

Yes, gpt-oss-120b (free) is open source.

How does gpt-oss-120b (free) compare to Gemini 3 Pro?

gpt-oss-120b (free) has an average score of 74.2 while Gemini 3 Pro scores 74.0. gpt-oss-120b (free) outperforms Gemini 3 Pro overall. See full comparison →

Home/Models/gpt-oss-120b (free)

gpt-oss-120b (free)

Name: gpt-oss-120b (free)
Author: OpenAI

by OpenAI · Released Aug 2025

Open Source

74.2

avg score

Rank #37

Compare

Better than 86% of all models

Context

131K tokens (~66 books)

Input $/1M

Free

Output $/1M

Free

Type

text

License

Open Source

Benchmarks

10 tested

Data updated today

About

gpt-oss-120b is an open-weight, 117B-parameter Mixture-of-Experts (MoE) language model from OpenAI designed for high-reasoning, agentic, and general-purpose production use cases. It activates 5.1B parameters per forward pass and is optimized...

Tested on 10 benchmarks with 68.7% average. Top scores: OpenCompass — AIME2025 (93.4%), OpenCompass — IFEval (90.2%), OpenCompass — MMLU-Pro (79.7%).

Capabilities

coding

60.1

#51 globally

math

93.4

#4 globally

knowledge

59.0

#67 globally

speed

37.5

#65 globally

language

90.2

#12 globally

Benchmark Scores

Compare All

Tested on 10 benchmarks · Ranked across 5 categories

Score Distribution (all 274 models)

0255075100

▲ You are here

codingCompare coding →

OpenCompass — LiveCodeBenchV6

OpenCompass Live Code Bench v6. Fresh competitive programming problems to evaluate code generation without memorization.

78.4—

Aider polyglot

Multi-language code editing from Aider. Tests editing ability across Python, JavaScript, TypeScript, Java, C++, Go, Rust, and more.

41.8—

mathCompare math →

OpenCompass — AIME2025

OpenCompass evaluation on AIME 2025 problems. Tests mathematical reasoning on fresh competition problems.

93.4—

knowledgeCompare knowledge →

OpenCompass — MMLU-Pro

OpenCompass MMLU-Pro evaluation. Harder knowledge test with more answer choices.

79.7—

OpenCompass — GPQA-Diamond

OpenCompass evaluation of GPQA Diamond. PhD-level science questions from the hardest subset.

78.9—

OpenCompass — HLE

OpenCompass evaluation of Humanitys Last Exam. Expert-level cross-discipline knowledge test.

18.3—

Quick compare:

vs Gemini 3 Pro

vs Grok 4.3

vs Muse Spark

Excellent (85+) Good (70-85) Average (50-70) Below (<50)

Similar Models

Links

Info

OpenAI Pricing explorer Developers · API

Research

Documentation

Community

Source Code

BenchGecko API

gpt-oss-120b-free

Specifications

Typetext
Context131K tokens (~66 books)
ReleasedAug 2025
LicenseOpen Source
StatusActive
Cost / Message~$0.000

Available On

OpenAIFree

Frequently Asked Questions

gpt-oss-120b (free) is an open-source text AI model by OpenAI, released in August 2025. It has an average benchmark score of 74.2. Context window: 131K tokens.

Benchmarks

OpenCompass — AIME2025 OpenCompass — IFEval OpenCompass — MMLU-Pro OpenCompass — GPQA-Diamond OpenCompass — LiveCodeBenchV6

OpenAI · Provider OpenAI · Economy All Models Compare Models Pricing Developers · API Context Window · Glossary

gpt-oss-120b (free)

Frequently Asked Questions

Related Models

Benchmarks

Related Pages