Llama 3.1 Nemotron 70B Instruct
194
#194 319 modeloetatik sailkapen orokorrean
3 MIR azterketatan metatutako errendimendua
Puntuazio garbia
478.66 pts
Ziurtasuna
84.2%
Zuzenak / Okerrak
505 / 79
Kostu osoa
$0.87
Errendimendu Orokorra
(vs. batez bestekoa)Ziurtasuna
84.2%
avg: 80.6%
Puntuazio garbia
478.66 pts
avg: 453.30 pts
Zuzenak
505
avg: 483
Okerrak
79
avg: 90
Kostu osoa
$0.87
avg: $9.58
Batez besteko erantzun-denbora
14.4s
avg: 17.9s
Irteerako tokenak
432K
avg: 1.3M
Arrazonamendu tokenak
0
avg: 898K
Batez besteko konfiantza
96.1%
avg: 95.4%
Azterketaren araberako banaketa
| Azterketa | Posizioa | Zuzenak | Okerrak | Ziurtasuna | Puntuazio garbia | Kostu osoa | |
|---|---|---|---|---|---|---|---|
| MIR 2024 | 214 | 165 | 30 | 82.5% | 155.00 | $0.29 | Ikusi xehetasuna |
| MIR 2025 | 206 | 160 | 33 | 80.0% | 149.00 | $0.30 | Ikusi xehetasuna |
| MIR 2026 | 145 | 180 | 16 | 90.0% | 174.66 | $0.29 | Ikusi xehetasuna |