MedicalBenchmark
OpenAI: o3 Deep Research provider

o3 Deep Research

23

#23 de 319 models al ranking general

Rendiment acumulat en 3 exàmens MIR

Puntuació neta

576.00 pts

Certesa

97.0%

Correctes / Incorrectes

582 / 18

Cost total

$502.80

Rendiment General

(vs. mitjana)
Certesa

97.0%

avg: 80.6%

Puntuació neta

576.00 pts

avg: 453.30 pts

Encerts

582

avg: 483

Errors

18

avg: 90

Cost total

$502.80

avg: $9.58

Temps mitjà de resposta

172.3s

avg: 17.9s

Tokens eixints

5.5M

avg: 1.3M

Tokens de raonament

5.0M

avg: 898K

Confiança mitjana

100.0%

avg: 95.4%

Desglossament per Examen

MIR 2024
14
Correctes
195
Incorrectes
5
Certesa
97.5%
Puntuació neta
193.33
MIR 2025
37
Correctes
189
Incorrectes
11
Certesa
94.5%
Puntuació neta
185.33
MIR 2026
16
Correctes
198
Incorrectes
2
Certesa
99.0%
Puntuació neta
197.33