gpt-oss-safeguard-20b
159
#159 de 319 modelos no ranking geral
Desempenho acumulado em 3 exames MIR
Pontuação líquida
502.33 pts
Exatidão
87.7%
Corretas / Incorretas
526 / 71
Custo total
$0.20
Desempenho Geral
(vs. média)Exatidão
87.7%
avg: 80.6%
Pontuação líquida
502.33 pts
avg: 453.30 pts
Acertos
526
avg: 483
Erros
71
avg: 90
Custo total
$0.20
avg: $9.58
Tempo médio de resposta
2.0s
avg: 17.9s
Tokens de saída
608K
avg: 1.3M
Tokens de raciocínio
356K
avg: 898K
Confiança média
99.3%
avg: 95.4%
Desagregação por Exame
| Exame | Posição | Corretas | Incorretas | Exatidão | Pontuação líquida | Custo total | |
|---|---|---|---|---|---|---|---|
| MIR 2024 | 171 | 177 | 22 | 88.5% | 169.66 | $0.07 | Ver detalhe |
| MIR 2025 | 152 | 172 | 28 | 86.0% | 162.66 | $0.07 | Ver detalhe |
| MIR 2026 | 162 | 177 | 21 | 88.5% | 170.00 | $0.06 | Ver detalhe |