MedicalBenchmark
OpenAI: GPT-4 provider

GPT-4

155

#155 de 319 modelos no ranking xeral

Rendemento acumulado en 3 exames MIR

Puntuación neta

507.00 pts

Certeza

87.7%

Correctas / Incorrectas

526 / 57

Custo total

$25.07

Rendemento Xeral

(vs. media)
Certeza

87.7%

avg: 80.6%

Puntuación neta

507.00 pts

avg: 453.30 pts

Acertos

526

avg: 483

Erros

57

avg: 90

Custo total

$25.07

avg: $9.58

Tempo promedio de resposta

11.1s

avg: 17.9s

Tokens saíntes

272K

avg: 1.3M

Tokens de razoamento

0

avg: 898K

Confianza promedia

96.4%

avg: 95.4%

Desagregación por Exame

MIR 2024
157
Correctas
178
Incorrectas
15
Certeza
89.0%
Puntuación neta
173.00
MIR 2025
127
Correctas
175
Incorrectas
21
Certeza
87.5%
Puntuación neta
168.00
MIR 2026
179
Correctas
173
Incorrectas
21
Certeza
86.5%
Puntuación neta
166.00