Beta
Home/Comparar/Llama 2-13B vs GPT-3.5 Turbo (older v0613)

Llama 2-13B vs GPT-3.5 Turbo (older v0613)

Lado a lado. Cada métrica. Cada benchmark.

Meta
42.5
puntuación promedio
0/10
benchmarks
OpenAI
45.8
puntuación promedio
10/10
benchmarks
TipoLlama 2-13BGPT-3.5 Turbo (older v0613)
ProviderMeta logoMetaOpenAI logoOpenAI
puntuación promedio42.545.8
Precio de entrada-$1.00
Precio de salida-$2.00
Ventana de contexto-4K tokens (~2 books)
Publicado el2024-01-012024-01-25
Código abiertoOpen SourceProprietary

10 benchmarks · Llama 2-13B: 0, GPT-3.5 Turbo (older v0613): 10

BenchmarkCategoríaLlama 2-13BGPT-3.5 Turbo (older v0613)
ARC AI2knowledge47.183.2
BBHreasoning44.348.8
CSQA2knowledge0.114.0
GPQA diamondknowledge1.82.9
GSM8Kmath36.957.8
MATH level 5math3.311.6
MMLUknowledge40.856.4
OpenBookQAknowledge42.781.3
TriviaQAknowledge79.685.8
Winograndeknowledge45.663.2