gpt-oss-safeguard-20b
159
#159 de 319 modelos no ranking xeral
Rendemento acumulado en 3 exames MIR
Puntuación neta
502.33 pts
Certeza
87.7%
Correctas / Incorrectas
526 / 71
Custo total
$0.20
Rendemento Xeral
(vs. media)Certeza
87.7%
avg: 80.6%
Puntuación neta
502.33 pts
avg: 453.30 pts
Acertos
526
avg: 483
Erros
71
avg: 90
Custo total
$0.20
avg: $9.58
Tempo promedio de resposta
2.0s
avg: 17.9s
Tokens saíntes
608K
avg: 1.3M
Tokens de razoamento
356K
avg: 898K
Confianza promedia
99.3%
avg: 95.4%
Desagregación por Exame
| Exame | Posición | Correctas | Incorrectas | Certeza | Puntuación neta | Custo total | |
|---|---|---|---|---|---|---|---|
| MIR 2024 | 171 | 177 | 22 | 88.5% | 169.66 | $0.07 | Ver detalle |
| MIR 2025 | 152 | 172 | 28 | 86.0% | 162.66 | $0.07 | Ver detalle |
| MIR 2026 | 162 | 177 | 21 | 88.5% | 170.00 | $0.06 | Ver detalle |