MedicalBenchmark
Meta: Llama 3.2 11B Vision Instruct provider

Llama 3.2 11B Vision Instruct

305

#305 de 319 modelos no ranking geral

Desempenho acumulado em 3 exames MIR

Pontuação líquida

127.00 pts

Exatidão

28.8%

Corretas / Incorretas

173 / 138

Custo total

$0.12

Desempenho Geral

(vs. média)
Exatidão

28.8%

avg: 80.6%

Pontuação líquida

127.00 pts

avg: 453.30 pts

Acertos

173

avg: 483

Erros

138

avg: 90

Custo total

$0.12

avg: $9.58

Tempo médio de resposta

51.5s

avg: 17.9s

Tokens de saída

639K

avg: 1.3M

Tokens de raciocínio

0

avg: 898K

Confiança média

52.5%

avg: 95.4%

Desagregação por Exame

MIR 2024
302
Corretas
61
Incorretas
49
Exatidão
30.5%
Pontuação líquida
44.66
MIR 2025
304
Corretas
46
Incorretas
47
Exatidão
23.0%
Pontuação líquida
30.33
MIR 2026
306
Corretas
66
Incorretas
42
Exatidão
33.0%
Pontuação líquida
52.00