Qwen2.5 7B Instruct
280
#280 319 modeloetatik sailkapen orokorrean
3 MIR azterketatan metatutako errendimendua
Puntuazio garbia
248.66 pts
Ziurtasuna
53.3%
Zuzenak / Okerrak
320 / 214
Kostu osoa
$0.05
Errendimendu Orokorra
(vs. batez bestekoa)Ziurtasuna
53.3%
avg: 80.6%
Puntuazio garbia
248.66 pts
avg: 453.30 pts
Zuzenak
320
avg: 483
Okerrak
214
avg: 90
Kostu osoa
$0.05
avg: $9.58
Batez besteko erantzun-denbora
10.3s
avg: 17.9s
Irteerako tokenak
355K
avg: 1.3M
Arrazonamendu tokenak
0
avg: 898K
Batez besteko konfiantza
88.4%
avg: 95.4%
Azterketaren araberako banaketa
| Azterketa | Posizioa | Zuzenak | Okerrak | Ziurtasuna | Puntuazio garbia | Kostu osoa | |
|---|---|---|---|---|---|---|---|
| MIR 2024 | 285 | 100 | 81 | 50.0% | 73.00 | $0.02 | Ikusi xehetasuna |
| MIR 2025 | 285 | 93 | 73 | 46.5% | 68.66 | $0.02 | Ikusi xehetasuna |
| MIR 2026 | 276 | 127 | 60 | 63.5% | 107.00 | $0.02 | Ikusi xehetasuna |