MedicalBenchmark
OpenAI: o4 Mini Deep Research provider

o4 Mini Deep Research

38

#38 de 319 models al ranking general

Rendiment acumulat en 3 exàmens MIR

Puntuació neta

568.00 pts

Certesa

96.0%

Correctes / Incorrectes

576 / 24

Cost total

$107.19

Rendiment General

(vs. mitjana)
Certesa

96.0%

avg: 80.6%

Puntuació neta

568.00 pts

avg: 453.30 pts

Encerts

576

avg: 483

Errors

24

avg: 90

Cost total

$107.19

avg: $9.58

Temps mitjà de resposta

94.6s

avg: 17.9s

Tokens eixints

4.9M

avg: 1.3M

Tokens de raonament

4.6M

avg: 898K

Confiança mitjana

100.0%

avg: 95.4%

Desglossament per Examen

MIR 2024
78
Correctes
190
Incorrectes
10
Certesa
95.0%
Puntuació neta
186.66
MIR 2025
33
Correctes
190
Incorrectes
10
Certesa
95.0%
Puntuació neta
186.66
MIR 2026
32
Correctes
196
Incorrectes
4
Certesa
98.0%
Puntuació neta
194.66