MedicalBenchmark
Sao10K: Llama 3.1 70B Hanami x1 provider

Llama 3.1 70B Hanami x1

236

#236 de 319 models al ranking general

Rendiment acumulat en 3 exàmens MIR

Puntuació neta

431.00 pts

Certesa

77.5%

Correctes / Incorrectes

465 / 102

Cost total

$1.87

Rendiment General

(vs. mitjana)
Certesa

77.5%

avg: 80.6%

Puntuació neta

431.00 pts

avg: 453.30 pts

Encerts

465

avg: 483

Errors

102

avg: 90

Cost total

$1.87

avg: $9.58

Temps mitjà de resposta

31.4s

avg: 17.9s

Tokens sortints

315K

avg: 1.3M

Tokens de raonament

0

avg: 898K

Confiança mitjana

92.7%

avg: 95.4%

Desglossament per Examen

MIR 2024
242
Correctes
155
Incorrectes
34
Certesa
77.5%
Puntuació neta
143.66
MIR 2025
241
Correctes
147
Incorrectes
46
Certesa
73.5%
Puntuació neta
131.66
MIR 2026
219
Correctes
163
Incorrectes
22
Certesa
81.5%
Puntuació neta
155.66