Qwen3 VL 8B Instruct
246
#246 319 modeloetatik sailkapen orokorrean
3 MIR azterketatan metatutako errendimendua
Puntuazio garbia
410.33 pts
Ziurtasuna
75.5%
Zuzenak / Okerrak
453 / 128
Kostu osoa
$0.45
Errendimendu Orokorra
(vs. batez bestekoa)Ziurtasuna
75.5%
avg: 80.6%
Puntuazio garbia
410.33 pts
avg: 453.30 pts
Zuzenak
453
avg: 483
Okerrak
128
avg: 90
Kostu osoa
$0.45
avg: $9.58
Batez besteko erantzun-denbora
15.4s
avg: 17.9s
Irteerako tokenak
698K
avg: 1.3M
Arrazonamendu tokenak
0
avg: 898K
Batez besteko konfiantza
95.7%
avg: 95.4%
Azterketaren araberako banaketa
| Azterketa | Posizioa | Zuzenak | Okerrak | Ziurtasuna | Puntuazio garbia | Kostu osoa | |
|---|---|---|---|---|---|---|---|
| MIR 2024 | 243 | 155 | 40 | 77.5% | 141.66 | $0.19 | Ikusi xehetasuna |
| MIR 2025 | 245 | 144 | 47 | 72.0% | 128.33 | $0.12 | Ikusi xehetasuna |
| MIR 2026 | 245 | 154 | 41 | 77.0% | 140.33 | $0.15 | Ikusi xehetasuna |