Qwen3 VL 32B Instruct
131
#131 319 modeloetatik sailkapen orokorrean
3 MIR azterketatan metatutako errendimendua
Puntuazio garbia
523.33 pts
Ziurtasuna
90.2%
Zuzenak / Okerrak
541 / 53
Kostu osoa
$0.91
Errendimendu Orokorra
(vs. batez bestekoa)Ziurtasuna
90.2%
avg: 80.6%
Puntuazio garbia
523.33 pts
avg: 453.30 pts
Zuzenak
541
avg: 483
Okerrak
53
avg: 90
Kostu osoa
$0.91
avg: $9.58
Batez besteko erantzun-denbora
16.0s
avg: 17.9s
Irteerako tokenak
503K
avg: 1.3M
Arrazonamendu tokenak
0
avg: 898K
Batez besteko konfiantza
98.7%
avg: 95.4%
Azterketaren araberako banaketa
| Azterketa | Posizioa | Zuzenak | Okerrak | Ziurtasuna | Puntuazio garbia | Kostu osoa | |
|---|---|---|---|---|---|---|---|
| MIR 2024 | 117 | 185 | 14 | 92.5% | 180.33 | $0.30 | Ikusi xehetasuna |
| MIR 2025 | 151 | 172 | 25 | 86.0% | 163.66 | $0.31 | Ikusi xehetasuna |
| MIR 2026 | 124 | 184 | 14 | 92.0% | 179.33 | $0.30 | Ikusi xehetasuna |