Qwen2.5 VL 32B Instruct
243
#243 319 modeloetatik sailkapen orokorrean
3 MIR azterketatan metatutako errendimendua
Puntuazio garbia
416.33 pts
Ziurtasuna
76.7%
Zuzenak / Okerrak
460 / 131
Kostu osoa
$0.59
Errendimendu Orokorra
(vs. batez bestekoa)Ziurtasuna
76.7%
avg: 80.6%
Puntuazio garbia
416.33 pts
avg: 453.30 pts
Zuzenak
460
avg: 483
Okerrak
131
avg: 90
Kostu osoa
$0.59
avg: $9.58
Batez besteko erantzun-denbora
30.9s
avg: 17.9s
Irteerako tokenak
633K
avg: 1.3M
Arrazonamendu tokenak
0
avg: 898K
Batez besteko konfiantza
97.9%
avg: 95.4%
Azterketaren araberako banaketa
| Azterketa | Posizioa | Zuzenak | Okerrak | Ziurtasuna | Puntuazio garbia | Kostu osoa | |
|---|---|---|---|---|---|---|---|
| MIR 2024 | 241 | 157 | 39 | 78.5% | 144.00 | $0.16 | Ikusi xehetasuna |
| MIR 2025 | 236 | 151 | 49 | 75.5% | 134.66 | $0.28 | Ikusi xehetasuna |
| MIR 2026 | 250 | 152 | 43 | 76.0% | 137.66 | $0.15 | Ikusi xehetasuna |