Qwen2.5 72B Instruct
184
#184 319 modeloetatik sailkapen orokorrean
3 MIR azterketatan metatutako errendimendua
Puntuazio garbia
487.33 pts
Ziurtasuna
85.7%
Zuzenak / Okerrak
514 / 80
Kostu osoa
$0.18
Errendimendu Orokorra
(vs. batez bestekoa)Ziurtasuna
85.7%
avg: 80.6%
Puntuazio garbia
487.33 pts
avg: 453.30 pts
Zuzenak
514
avg: 483
Okerrak
80
avg: 90
Kostu osoa
$0.18
avg: $9.58
Batez besteko erantzun-denbora
12.6s
avg: 17.9s
Irteerako tokenak
345K
avg: 1.3M
Arrazonamendu tokenak
0
avg: 898K
Batez besteko konfiantza
98.0%
avg: 95.4%
Azterketaren araberako banaketa
| Azterketa | Posizioa | Zuzenak | Okerrak | Ziurtasuna | Puntuazio garbia | Kostu osoa | |
|---|---|---|---|---|---|---|---|
| MIR 2024 | 180 | 176 | 24 | 88.0% | 168.00 | $0.06 | Ikusi xehetasuna |
| MIR 2025 | 180 | 167 | 33 | 83.5% | 156.00 | $0.06 | Ikusi xehetasuna |
| MIR 2026 | 195 | 171 | 23 | 85.5% | 163.33 | $0.06 | Ikusi xehetasuna |