Qwen2.5-VL 7B Instruct
290
#290 319 modeloetatik sailkapen orokorrean
3 MIR azterketatan metatutako errendimendua
Puntuazio garbia
187.00 pts
Ziurtasuna
43.5%
Zuzenak / Okerrak
261 / 222
Kostu osoa
$0.12
Errendimendu Orokorra
(vs. batez bestekoa)Ziurtasuna
43.5%
avg: 80.6%
Puntuazio garbia
187.00 pts
avg: 453.30 pts
Zuzenak
261
avg: 483
Okerrak
222
avg: 90
Kostu osoa
$0.12
avg: $9.58
Batez besteko erantzun-denbora
6.3s
avg: 17.9s
Irteerako tokenak
310K
avg: 1.3M
Arrazonamendu tokenak
0
avg: 898K
Batez besteko konfiantza
77.1%
avg: 95.4%
Azterketaren araberako banaketa
| Azterketa | Posizioa | Zuzenak | Okerrak | Ziurtasuna | Puntuazio garbia | Kostu osoa | |
|---|---|---|---|---|---|---|---|
| MIR 2024 | 292 | 90 | 88 | 45.0% | 60.66 | $0.04 | Ikusi xehetasuna |
| MIR 2025 | 288 | 83 | 73 | 41.5% | 58.66 | $0.04 | Ikusi xehetasuna |
| MIR 2026 | 295 | 88 | 61 | 44.0% | 67.66 | $0.04 | Ikusi xehetasuna |