MedicalBenchmark
OpenAI: GPT-4 provider

GPT-4

155

#155 de 319 models al ranking general

Rendiment acumulat en 3 exàmens MIR

Puntuació neta

507.00 pts

Certesa

87.7%

Correctes / Incorrectes

526 / 57

Cost total

$25.07

Rendiment General

(vs. mitjana)
Certesa

87.7%

avg: 80.6%

Puntuació neta

507.00 pts

avg: 453.30 pts

Encerts

526

avg: 483

Errors

57

avg: 90

Cost total

$25.07

avg: $9.58

Temps mitjà de resposta

11.1s

avg: 17.9s

Tokens eixints

272K

avg: 1.3M

Tokens de raonament

0

avg: 898K

Confiança mitjana

96.4%

avg: 95.4%

Desglossament per Examen

MIR 2024
157
Correctes
178
Incorrectes
15
Certesa
89.0%
Puntuació neta
173.00
MIR 2025
127
Correctes
175
Incorrectes
21
Certesa
87.5%
Puntuació neta
168.00
MIR 2026
179
Correctes
173
Incorrectes
21
Certesa
86.5%
Puntuació neta
166.00