MedicalBenchmark
OpenAI: GPT-3.5 Turbo (older v0613) provider

GPT-3.5 Turbo (older v0613)

114

#114 de 319 models al ranking general

Rendiment acumulat en 3 exàmens MIR

Puntuació neta

533.66 pts

Certesa

91.5%

Correctes / Incorrectes

549 / 46

Cost total

$0.88

Rendiment General

(vs. mitjana)
Certesa

91.5%

avg: 80.6%

Puntuació neta

533.66 pts

avg: 453.30 pts

Encerts

549

avg: 483

Errors

46

avg: 90

Cost total

$0.88

avg: $9.58

Temps mitjà de resposta

7.5s

avg: 17.9s

Tokens sortints

310K

avg: 1.3M

Tokens de raonament

0

avg: 898K

Confiança mitjana

99.0%

avg: 95.4%

Desglossament per Examen

MIR 2024
84
Correctes
189
Incorrectes
10
Certesa
94.5%
Puntuació neta
185.66
MIR 2025
142
Correctes
173
Incorrectes
24
Certesa
86.5%
Puntuació neta
165.00
MIR 2026
105
Correctes
187
Incorrectes
12
Certesa
93.5%
Puntuació neta
183.00