gpt-oss-safeguard-20b
159
#159 de 319 models al ranking general
Rendiment acumulat en 3 exàmens MIR
Puntuació neta
502.33 pts
Certesa
87.7%
Correctes / Incorrectes
526 / 71
Cost total
$0.20
Rendiment General
(vs. mitjana)Certesa
87.7%
avg: 80.6%
Puntuació neta
502.33 pts
avg: 453.30 pts
Encerts
526
avg: 483
Errors
71
avg: 90
Cost total
$0.20
avg: $9.58
Temps mitjà de resposta
2.0s
avg: 17.9s
Tokens sortints
608K
avg: 1.3M
Tokens de raonament
356K
avg: 898K
Confiança mitjana
99.3%
avg: 95.4%
Desglossament per Examen
| Examen | Posició | Correctes | Incorrectes | Certesa | Puntuació neta | Cost total | |
|---|---|---|---|---|---|---|---|
| MIR 2024 | 171 | 177 | 22 | 88.5% | 169.66 | $0.07 | Veure detall |
| MIR 2025 | 152 | 172 | 28 | 86.0% | 162.66 | $0.07 | Veure detall |
| MIR 2026 | 162 | 177 | 21 | 88.5% | 170.00 | $0.06 | Veure detall |