GPT-3.5 Turbo (older v0613)
開発元 OpenAI · リリース日 2024-01-25
45.8
平均スコア
$1.00/1M
入力料金
$2.00/1M
出力料金
4K tokens (~2 books)
コンテキストウィンドウ
text
タイプ
Tested on 13 benchmarks with 45.8% average. Top scores: TriviaQA (85.8%), ARC AI2 (83.2%), OpenBookQA (81.3%).
ベンチマークスコア
| ベンチマーク | カテゴリ | スコア | Bar |
|---|---|---|---|
| TriviaQA | knowledge | 85.8 | |
| ARC AI2 | knowledge | 83.2 | |
| OpenBookQA | knowledge | 81.3 | |
| Winogrande | knowledge | 63.2 | |
| GSM8K | math | 57.8 | |
| MMLU | knowledge | 56.4 | |
| Aider — Code Editing | coding | 50.4 | |
| BBH | reasoning | 48.8 | |
| ANLI | knowledge | 37.1 | |
| CSQA2 | knowledge | 14.0 | |
| MATH level 5 | math | 11.6 | |
| WeirdML | coding | 3.5 | |
| GPQA diamond | knowledge | 2.9 |