Llama 3.1 70B Hanami x1
236
#236 319 modeloetatik sailkapen orokorrean
3 MIR azterketatan metatutako errendimendua
Puntuazio garbia
431.00 pts
Ziurtasuna
77.5%
Zuzenak / Okerrak
465 / 102
Kostu osoa
$1.87
Errendimendu Orokorra
(vs. batez bestekoa)Ziurtasuna
77.5%
avg: 80.6%
Puntuazio garbia
431.00 pts
avg: 453.30 pts
Zuzenak
465
avg: 483
Okerrak
102
avg: 90
Kostu osoa
$1.87
avg: $9.58
Batez besteko erantzun-denbora
31.4s
avg: 17.9s
Irteerako tokenak
315K
avg: 1.3M
Arrazonamendu tokenak
0
avg: 898K
Batez besteko konfiantza
92.7%
avg: 95.4%
Azterketaren araberako banaketa
| Azterketa | Posizioa | Zuzenak | Okerrak | Ziurtasuna | Puntuazio garbia | Kostu osoa | |
|---|---|---|---|---|---|---|---|
| MIR 2024 | 242 | 155 | 34 | 77.5% | 143.66 | $0.63 | Ikusi xehetasuna |
| MIR 2025 | 241 | 147 | 46 | 73.5% | 131.66 | $0.63 | Ikusi xehetasuna |
| MIR 2026 | 219 | 163 | 22 | 81.5% | 155.66 | $0.61 | Ikusi xehetasuna |