MedicalBenchmark
OpenAI: GPT-5 Chat provider

GPT-5 Chat

42

#42 de 319 modelos no ranking xeral

Rendemento acumulado en 3 exames MIR

Puntuación neta

565.66 pts

Certeza

95.7%

Correctas / Incorrectas

574 / 25

Custo total

$3.28

Rendemento Xeral

(vs. media)
Certeza

95.7%

avg: 80.6%

Puntuación neta

565.66 pts

avg: 453.30 pts

Acertos

574

avg: 483

Erros

25

avg: 90

Custo total

$3.28

avg: $9.58

Tempo promedio de resposta

4.0s

avg: 17.9s

Tokens saíntes

292K

avg: 1.3M

Tokens de razoamento

0

avg: 898K

Confianza promedia

99.7%

avg: 95.4%

Desagregación por Exame

MIR 2024
9
Correctas
195
Incorrectas
5
Certeza
97.5%
Puntuación neta
193.33
MIR 2025
70
Correctas
184
Incorrectas
15
Certeza
92.0%
Puntuación neta
179.00
MIR 2026
35
Correctas
195
Incorrectas
5
Certeza
97.5%
Puntuación neta
193.33