Llama 3.1 Euryale 70B v2.2
254
#254 de 319 modelos no ranking geral
Desempenho acumulado em 3 exames MIR
Pontuação líquida
379.33 pts
Exatidão
70.3%
Corretas / Incorretas
422 / 128
Custo total
$0.55
Desempenho Geral
(vs. média)Exatidão
70.3%
avg: 80.6%
Pontuação líquida
379.33 pts
avg: 453.30 pts
Acertos
422
avg: 483
Erros
128
avg: 90
Custo total
$0.55
avg: $9.58
Tempo médio de resposta
21.2s
avg: 17.9s
Tokens de saída
369K
avg: 1.3M
Tokens de raciocínio
0
avg: 898K
Confiança média
90.5%
avg: 95.4%
Desagregação por Exame
| Exame | Posição | Corretas | Incorretas | Exatidão | Pontuação líquida | Custo total | |
|---|---|---|---|---|---|---|---|
| MIR 2024 | 258 | 140 | 45 | 70.0% | 125.00 | $0.18 | Ver detalhe |
| MIR 2025 | 251 | 137 | 49 | 68.5% | 120.66 | $0.18 | Ver detalhe |
| MIR 2026 | 252 | 145 | 34 | 72.5% | 133.66 | $0.20 | Ver detalhe |