Llama 3.1 8B Instruct
298
#298 319 modeloetatik sailkapen orokorrean
3 MIR azterketatan metatutako errendimendua
Puntuazio garbia
160.33 pts
Ziurtasuna
39.8%
Zuzenak / Okerrak
239 / 236
Kostu osoa
$0.06
Errendimendu Orokorra
(vs. batez bestekoa)Ziurtasuna
39.8%
avg: 80.6%
Puntuazio garbia
160.33 pts
avg: 453.30 pts
Zuzenak
239
avg: 483
Okerrak
236
avg: 90
Kostu osoa
$0.06
avg: $9.58
Batez besteko erantzun-denbora
25.0s
avg: 17.9s
Irteerako tokenak
784K
avg: 1.3M
Arrazonamendu tokenak
0
avg: 898K
Batez besteko konfiantza
79.1%
avg: 95.4%
Azterketaren araberako banaketa
| Azterketa | Posizioa | Zuzenak | Okerrak | Ziurtasuna | Puntuazio garbia | Kostu osoa | |
|---|---|---|---|---|---|---|---|
| MIR 2024 | 303 | 74 | 90 | 37.0% | 44.00 | $0.02 | Ikusi xehetasuna |
| MIR 2025 | 290 | 79 | 78 | 39.5% | 53.00 | $0.02 | Ikusi xehetasuna |
| MIR 2026 | 299 | 86 | 68 | 43.0% | 63.33 | $0.02 | Ikusi xehetasuna |