Qwen2.5 VL 72B Instruct
181
#181 319 modeloetatik sailkapen orokorrean
3 MIR azterketatan metatutako errendimendua
Puntuazio garbia
490.00 pts
Ziurtasuna
86.0%
Zuzenak / Okerrak
516 / 78
Kostu osoa
$0.35
Errendimendu Orokorra
(vs. batez bestekoa)Ziurtasuna
86.0%
avg: 80.6%
Puntuazio garbia
490.00 pts
avg: 453.30 pts
Zuzenak
516
avg: 483
Okerrak
78
avg: 90
Kostu osoa
$0.35
avg: $9.58
Batez besteko erantzun-denbora
17.2s
avg: 17.9s
Irteerako tokenak
312K
avg: 1.3M
Arrazonamendu tokenak
0
avg: 898K
Batez besteko konfiantza
98.0%
avg: 95.4%
Azterketaren araberako banaketa
| Azterketa | Posizioa | Zuzenak | Okerrak | Ziurtasuna | Puntuazio garbia | Kostu osoa | |
|---|---|---|---|---|---|---|---|
| MIR 2024 | 151 | 180 | 18 | 90.0% | 174.00 | $0.12 | Ikusi xehetasuna |
| MIR 2025 | 196 | 164 | 35 | 82.0% | 152.33 | $0.12 | Ikusi xehetasuna |
| MIR 2026 | 193 | 172 | 25 | 86.0% | 163.66 | $0.11 | Ikusi xehetasuna |