Llama 3.1 8B Instruct
298
#298 de 319 modelos no ranking geral
Desempenho acumulado em 3 exames MIR
Pontuação líquida
160.33 pts
Exatidão
39.8%
Corretas / Incorretas
239 / 236
Custo total
$0.06
Desempenho Geral
(vs. média)Exatidão
39.8%
avg: 80.6%
Pontuação líquida
160.33 pts
avg: 453.30 pts
Acertos
239
avg: 483
Erros
236
avg: 90
Custo total
$0.06
avg: $9.58
Tempo médio de resposta
25.0s
avg: 17.9s
Tokens de saída
784K
avg: 1.3M
Tokens de raciocínio
0
avg: 898K
Confiança média
79.1%
avg: 95.4%
Desagregação por Exame
| Exame | Posição | Corretas | Incorretas | Exatidão | Pontuação líquida | Custo total | |
|---|---|---|---|---|---|---|---|
| MIR 2024 | 303 | 74 | 90 | 37.0% | 44.00 | $0.02 | Ver detalhe |
| MIR 2025 | 290 | 79 | 78 | 39.5% | 53.00 | $0.02 | Ver detalhe |
| MIR 2026 | 299 | 86 | 68 | 43.0% | 63.33 | $0.02 | Ver detalhe |