Qwen3 235B A22B Thinking 2507
41
#41 319 modeloetatik sailkapen orokorrean
3 MIR azterketatan metatutako errendimendua
Puntuazio garbia
565.66 pts
Ziurtasuna
95.7%
Zuzenak / Okerrak
574 / 25
Kostu osoa
$1.73
Errendimendu Orokorra
(vs. batez bestekoa)Ziurtasuna
95.7%
avg: 80.6%
Puntuazio garbia
565.66 pts
avg: 453.30 pts
Zuzenak
574
avg: 483
Okerrak
25
avg: 90
Kostu osoa
$1.73
avg: $9.58
Batez besteko erantzun-denbora
91.2s
avg: 17.9s
Irteerako tokenak
1.2M
avg: 1.3M
Arrazonamendu tokenak
862K
avg: 898K
Batez besteko konfiantza
99.5%
avg: 95.4%
Azterketaren araberako banaketa
| Azterketa | Posizioa | Zuzenak | Okerrak | Ziurtasuna | Puntuazio garbia | Kostu osoa | |
|---|---|---|---|---|---|---|---|
| MIR 2024 | 8 | 195 | 5 | 97.5% | 193.33 | $0.57 | Ikusi xehetasuna |
| MIR 2025 | 42 | 188 | 12 | 94.0% | 184.00 | $0.64 | Ikusi xehetasuna |
| MIR 2026 | 68 | 191 | 8 | 95.5% | 188.33 | $0.53 | Ikusi xehetasuna |