Llama 3.1 Euryale 70B v2.2
254
#254 319 modeloetatik sailkapen orokorrean
3 MIR azterketatan metatutako errendimendua
Puntuazio garbia
379.33 pts
Ziurtasuna
70.3%
Zuzenak / Okerrak
422 / 128
Kostu osoa
$0.55
Errendimendu Orokorra
(vs. batez bestekoa)Ziurtasuna
70.3%
avg: 80.6%
Puntuazio garbia
379.33 pts
avg: 453.30 pts
Zuzenak
422
avg: 483
Okerrak
128
avg: 90
Kostu osoa
$0.55
avg: $9.58
Batez besteko erantzun-denbora
21.2s
avg: 17.9s
Irteerako tokenak
369K
avg: 1.3M
Arrazonamendu tokenak
0
avg: 898K
Batez besteko konfiantza
90.5%
avg: 95.4%
Azterketaren araberako banaketa
| Azterketa | Posizioa | Zuzenak | Okerrak | Ziurtasuna | Puntuazio garbia | Kostu osoa | |
|---|---|---|---|---|---|---|---|
| MIR 2024 | 258 | 140 | 45 | 70.0% | 125.00 | $0.18 | Ikusi xehetasuna |
| MIR 2025 | 251 | 137 | 49 | 68.5% | 120.66 | $0.18 | Ikusi xehetasuna |
| MIR 2026 | 252 | 145 | 34 | 72.5% | 133.66 | $0.20 | Ikusi xehetasuna |