Llama 3 70B Instruct
237
#237 319 modeloetatik sailkapen orokorrean
3 MIR azterketatan metatutako errendimendua
Puntuazio garbia
426.66 pts
Ziurtasuna
78.0%
Zuzenak / Okerrak
468 / 124
Kostu osoa
$0.31
Errendimendu Orokorra
(vs. batez bestekoa)Ziurtasuna
78.0%
avg: 80.6%
Puntuazio garbia
426.66 pts
avg: 453.30 pts
Zuzenak
468
avg: 483
Okerrak
124
avg: 90
Kostu osoa
$0.31
avg: $9.58
Batez besteko erantzun-denbora
13.8s
avg: 17.9s
Irteerako tokenak
217K
avg: 1.3M
Arrazonamendu tokenak
0
avg: 898K
Batez besteko konfiantza
97.9%
avg: 95.4%
Azterketaren araberako banaketa
| Azterketa | Posizioa | Zuzenak | Okerrak | Ziurtasuna | Puntuazio garbia | Kostu osoa | |
|---|---|---|---|---|---|---|---|
| MIR 2024 | 239 | 158 | 40 | 79.0% | 144.66 | $0.10 | Ikusi xehetasuna |
| MIR 2025 | 243 | 147 | 51 | 73.5% | 130.00 | $0.10 | Ikusi xehetasuna |
| MIR 2026 | 233 | 163 | 33 | 81.5% | 152.00 | $0.10 | Ikusi xehetasuna |