Llama 3.3 70B Instruct
195
#195 319 modeloetatik sailkapen orokorrean
3 MIR azterketatan metatutako errendimendua
Puntuazio garbia
478.33 pts
Ziurtasuna
84.0%
Zuzenak / Okerrak
504 / 77
Kostu osoa
$0.28
Errendimendu Orokorra
(vs. batez bestekoa)Ziurtasuna
84.0%
avg: 80.6%
Puntuazio garbia
478.33 pts
avg: 453.30 pts
Zuzenak
504
avg: 483
Okerrak
77
avg: 90
Kostu osoa
$0.28
avg: $9.58
Batez besteko erantzun-denbora
14.1s
avg: 17.9s
Irteerako tokenak
322K
avg: 1.3M
Arrazonamendu tokenak
0
avg: 898K
Batez besteko konfiantza
94.9%
avg: 95.4%
Azterketaren araberako banaketa
| Azterketa | Posizioa | Zuzenak | Okerrak | Ziurtasuna | Puntuazio garbia | Kostu osoa | |
|---|---|---|---|---|---|---|---|
| MIR 2024 | 201 | 171 | 27 | 85.5% | 162.00 | $0.09 | Ikusi xehetasuna |
| MIR 2025 | 203 | 161 | 32 | 80.5% | 150.33 | $0.10 | Ikusi xehetasuna |
| MIR 2026 | 177 | 172 | 18 | 86.0% | 166.00 | $0.09 | Ikusi xehetasuna |