MedicalBenchmark
Sao10k: Llama 3 Euryale 70B v2.1 provider

Llama 3 Euryale 70B v2.1

252

#252 319 modeloetatik sailkapen orokorrean

3 MIR azterketatan metatutako errendimendua

Puntuazio garbia

382.66 pts

Ziurtasuna

71.7%

Zuzenak / Okerrak

430 / 142

Kostu osoa

$0.83

Errendimendu Orokorra

(vs. batez bestekoa)
Ziurtasuna

71.7%

avg: 80.6%

Puntuazio garbia

382.66 pts

avg: 453.30 pts

Zuzenak

430

avg: 483

Okerrak

142

avg: 90

Kostu osoa

$0.83

avg: $9.58

Batez besteko erantzun-denbora

9.0s

avg: 17.9s

Irteerako tokenak

267K

avg: 1.3M

Arrazonamendu tokenak

0

avg: 898K

Batez besteko konfiantza

94.3%

avg: 95.4%

Azterketaren araberako banaketa

MIR 2024
252
Zuzenak
149
Okerrak
41
Ziurtasuna
74.5%
Puntuazio garbia
135.33
MIR 2025
262
Zuzenak
124
Okerrak
64
Ziurtasuna
62.0%
Puntuazio garbia
102.66
MIR 2026
240
Zuzenak
157
Okerrak
37
Ziurtasuna
78.5%
Puntuazio garbia
144.66