MedicalBenchmark
Meta: Llama 3 8B Instruct provider

Llama 3 8B Instruct

294

#294 319 modeloetatik sailkapen orokorrean

3 MIR azterketatan metatutako errendimendua

Puntuazio garbia

176.66 pts

Ziurtasuna

44.0%

Zuzenak / Okerrak

264 / 262

Kostu osoa

$0.03

Errendimendu Orokorra

(vs. batez bestekoa)
Ziurtasuna

44.0%

avg: 80.6%

Puntuazio garbia

176.66 pts

avg: 453.30 pts

Zuzenak

264

avg: 483

Okerrak

262

avg: 90

Kostu osoa

$0.03

avg: $9.58

Batez besteko erantzun-denbora

11.6s

avg: 17.9s

Irteerako tokenak

390K

avg: 1.3M

Arrazonamendu tokenak

0

avg: 898K

Batez besteko konfiantza

85.5%

avg: 95.4%

Azterketaren araberako banaketa

MIR 2024
288
Zuzenak
93
Okerrak
83
Ziurtasuna
46.5%
Puntuazio garbia
65.33
MIR 2025
300
Zuzenak
72
Okerrak
101
Ziurtasuna
36.0%
Puntuazio garbia
38.33
MIR 2026
291
Zuzenak
99
Okerrak
78
Ziurtasuna
49.5%
Puntuazio garbia
73.00