MedicalBenchmark
OpenAI: gpt-oss-safeguard-20b provider

gpt-oss-safeguard-20b

159

#159 de 319 modelos en el ranking general

Rendimiento acumulado en 3 exámenes MIR

Puntuación neta

502.33 pts

Certeza

87.7%

Correctas / Incorrectas

526 / 71

Coste total

$0.20

Rendimiento General

(vs. media)
Certeza

87.7%

avg: 80.6%

Puntuación neta

502.33 pts

avg: 453.30 pts

Aciertos

526

avg: 483

Fallos

71

avg: 90

Coste total

$0.20

avg: $9.58

Tiempo promedio de respuesta

2.0s

avg: 17.9s

Tokens salientes

608K

avg: 1.3M

Tokens de razonamiento

356K

avg: 898K

Confianza promedio

99.3%

avg: 95.4%

Desglose por Examen

MIR 2024
171
Correctas
177
Incorrectas
22
Certeza
88.5%
Puntuación neta
169.66
MIR 2025
152
Correctas
172
Incorrectas
28
Certeza
86.0%
Puntuación neta
162.66
MIR 2026
162
Correctas
177
Incorrectas
21
Certeza
88.5%
Puntuación neta
170.00