Qwen3 235B A22B Instruct 2507
123
#123 319 modeloetatik sailkapen orokorrean
3 MIR azterketatan metatutako errendimendua
Puntuazio garbia
529.66 pts
Ziurtasuna
91.0%
Zuzenak / Okerrak
546 / 49
Kostu osoa
$0.35
Errendimendu Orokorra
(vs. batez bestekoa)Ziurtasuna
91.0%
avg: 80.6%
Puntuazio garbia
529.66 pts
avg: 453.30 pts
Zuzenak
546
avg: 483
Okerrak
49
avg: 90
Kostu osoa
$0.35
avg: $9.58
Batez besteko erantzun-denbora
21.4s
avg: 17.9s
Irteerako tokenak
481K
avg: 1.3M
Arrazonamendu tokenak
0
avg: 898K
Batez besteko konfiantza
98.9%
avg: 95.4%
Azterketaren araberako banaketa
| Azterketa | Posizioa | Zuzenak | Okerrak | Ziurtasuna | Puntuazio garbia | Kostu osoa | |
|---|---|---|---|---|---|---|---|
| MIR 2024 | 137 | 183 | 15 | 91.5% | 178.00 | $0.10 | Ikusi xehetasuna |
| MIR 2025 | 132 | 175 | 24 | 87.5% | 167.00 | $0.15 | Ikusi xehetasuna |
| MIR 2026 | 92 | 188 | 10 | 94.0% | 184.66 | $0.10 | Ikusi xehetasuna |