MedicalBenchmark
OpenAI: GPT-4o provider

GPT-4o

126

#126 de 319 models al ranking general

Rendiment acumulat en 3 exàmens MIR

Puntuació neta

526.33 pts

Certesa

89.7%

Correctes / Incorrectes

538 / 35

Cost total

$3.05

Rendiment General

(vs. mitjana)
Certesa

89.7%

avg: 80.6%

Puntuació neta

526.33 pts

avg: 453.30 pts

Encerts

538

avg: 483

Errors

35

avg: 90

Cost total

$3.05

avg: $9.58

Temps mitjà de resposta

7.5s

avg: 17.9s

Tokens eixints

231K

avg: 1.3M

Tokens de raonament

0

avg: 898K

Confiança mitjana

97.8%

avg: 95.4%

Desglossament per Examen

MIR 2024
113
Correctes
184
Incorrectes
7
Certesa
92.0%
Puntuació neta
181.66
MIR 2025
150
Correctes
171
Incorrectes
21
Certesa
85.5%
Puntuació neta
164.00
MIR 2026
114
Correctes
183
Incorrectes
7
Certesa
91.5%
Puntuació neta
180.66