MedicalBenchmark
Sao10K: Llama 3 8B Lunaris provider

Llama 3 8B Lunaris

288

#288 de 319 models al ranking general

Rendiment acumulat en 3 exàmens MIR

Puntuació neta

198.00 pts

Certesa

47.7%

Correctes / Incorrectes

286 / 264

Cost total

$0.02

Rendiment General

(vs. mitjana)
Certesa

47.7%

avg: 80.6%

Puntuació neta

198.00 pts

avg: 453.30 pts

Encerts

286

avg: 483

Errors

264

avg: 90

Cost total

$0.02

avg: $9.58

Temps mitjà de resposta

4.8s

avg: 17.9s

Tokens sortints

213K

avg: 1.3M

Tokens de raonament

0

avg: 898K

Confiança mitjana

89.9%

avg: 95.4%

Desglossament per Examen

MIR 2024
297
Correctes
88
Incorrectes
104
Certesa
44.0%
Puntuació neta
53.33
MIR 2025
289
Correctes
86
Incorrectes
92
Certesa
43.0%
Puntuació neta
55.33
MIR 2026
285
Correctes
112
Incorrectes
68
Certesa
56.0%
Puntuació neta
89.33