MedicalBenchmark

gpt-oss-safeguard-20b

159

#159 de 319 modelos en el ranking general

Rendimiento acumulado en 3 exámenes MIR

Puntuación neta

502.33 pts

Certeza

87.7%

Correctas / Incorrectas

526 / 71

Coste total

$0.20

Rendimiento General

(vs. media)

Certeza

87.7%

avg: 80.6%

Puntuación neta

502.33 pts

avg: 453.30 pts

Aciertos

526

avg: 483

Fallos

71

avg: 90

Coste total

$0.20

avg: $9.58

Tiempo promedio de respuesta

2.0s

avg: 17.9s

Tokens salientes

608K

avg: 1.3M

Tokens de razonamiento

356K

avg: 898K

Confianza promedio

99.3%

avg: 95.4%

Desglose por Examen

Examen	Posición	Correctas	Incorrectas	Certeza	Puntuación neta	Coste total
MIR 2024	171	177	22	88.5%	169.66	$0.07	Ver detalle
MIR 2025	152	172	28	86.0%	162.66	$0.07	Ver detalle
MIR 2026	162	177	21	88.5%	170.00	$0.06	Ver detalle

MIR 2024

171

Correctas

177

Incorrectas

22

Certeza

88.5%

Puntuación neta

169.66

MIR 2025

152

Correctas

172

Incorrectas

28

Certeza

86.0%

Puntuación neta

162.66

MIR 2026

162

Correctas

177

Incorrectas

21

Certeza

88.5%

Puntuación neta

170.00