MedicalBenchmark
OpenAI: o3 Deep Research provider

o3 Deep Research

23

#23 de 319 modelos en el ranking general

Rendimiento acumulado en 3 exámenes MIR

Puntuación neta

576.00 pts

Certeza

97.0%

Correctas / Incorrectas

582 / 18

Coste total

$502.80

Rendimiento General

(vs. media)
Certeza

97.0%

avg: 80.6%

Puntuación neta

576.00 pts

avg: 453.30 pts

Aciertos

582

avg: 483

Fallos

18

avg: 90

Coste total

$502.80

avg: $9.58

Tiempo promedio de respuesta

172.3s

avg: 17.9s

Tokens salientes

5.5M

avg: 1.3M

Tokens de razonamiento

5.0M

avg: 898K

Confianza promedio

100.0%

avg: 95.4%

Desglose por Examen

MIR 2024
14
Correctas
195
Incorrectas
5
Certeza
97.5%
Puntuación neta
193.33
MIR 2025
37
Correctas
189
Incorrectas
11
Certeza
94.5%
Puntuación neta
185.33
MIR 2026
16
Correctas
198
Incorrectas
2
Certeza
99.0%
Puntuación neta
197.33