MedicalBenchmark
OpenAI: o3 Deep Research provider

o3 Deep Research

23

#23 de 319 modelos no ranking xeral

Rendemento acumulado en 3 exames MIR

Puntuación neta

576.00 pts

Certeza

97.0%

Correctas / Incorrectas

582 / 18

Custo total

$502.80

Rendemento Xeral

(vs. media)
Certeza

97.0%

avg: 80.6%

Puntuación neta

576.00 pts

avg: 453.30 pts

Acertos

582

avg: 483

Erros

18

avg: 90

Custo total

$502.80

avg: $9.58

Tempo promedio de resposta

172.3s

avg: 17.9s

Tokens saíntes

5.5M

avg: 1.3M

Tokens de razoamento

5.0M

avg: 898K

Confianza promedia

100.0%

avg: 95.4%

Desagregación por Exame

MIR 2024
14
Correctas
195
Incorrectas
5
Certeza
97.5%
Puntuación neta
193.33
MIR 2025
37
Correctas
189
Incorrectas
11
Certeza
94.5%
Puntuación neta
185.33
MIR 2026
16
Correctas
198
Incorrectas
2
Certeza
99.0%
Puntuación neta
197.33