Llama 3 8B Instruct
294
#294 319 modeloetatik sailkapen orokorrean
3 MIR azterketatan metatutako errendimendua
Puntuazio garbia
176.66 pts
Ziurtasuna
44.0%
Zuzenak / Okerrak
264 / 262
Kostu osoa
$0.03
Errendimendu Orokorra
(vs. batez bestekoa)Ziurtasuna
44.0%
avg: 80.6%
Puntuazio garbia
176.66 pts
avg: 453.30 pts
Zuzenak
264
avg: 483
Okerrak
262
avg: 90
Kostu osoa
$0.03
avg: $9.58
Batez besteko erantzun-denbora
11.6s
avg: 17.9s
Irteerako tokenak
390K
avg: 1.3M
Arrazonamendu tokenak
0
avg: 898K
Batez besteko konfiantza
85.5%
avg: 95.4%
Azterketaren araberako banaketa
| Azterketa | Posizioa | Zuzenak | Okerrak | Ziurtasuna | Puntuazio garbia | Kostu osoa | |
|---|---|---|---|---|---|---|---|
| MIR 2024 | 288 | 93 | 83 | 46.5% | 65.33 | $0.01 | Ikusi xehetasuna |
| MIR 2025 | 300 | 72 | 101 | 36.0% | 38.33 | $0.01 | Ikusi xehetasuna |
| MIR 2026 | 291 | 99 | 78 | 49.5% | 73.00 | $0.01 | Ikusi xehetasuna |