Cogito V2 Preview Llama 70B
208
#208 319 modeloetatik sailkapen orokorrean
3 MIR azterketatan metatutako errendimendua
Puntuazio garbia
465.33 pts
Ziurtasuna
82.3%
Zuzenak / Okerrak
494 / 86
Kostu osoa
$0.48
Errendimendu Orokorra
(vs. batez bestekoa)Ziurtasuna
82.3%
avg: 80.6%
Puntuazio garbia
465.33 pts
avg: 453.30 pts
Zuzenak
494
avg: 483
Okerrak
86
avg: 90
Kostu osoa
$0.48
avg: $9.58
Batez besteko erantzun-denbora
7.8s
avg: 17.9s
Irteerako tokenak
250K
avg: 1.3M
Arrazonamendu tokenak
0
avg: 898K
Batez besteko konfiantza
95.8%
avg: 95.4%
Azterketaren araberako banaketa
| Azterketa | Posizioa | Zuzenak | Okerrak | Ziurtasuna | Puntuazio garbia | Kostu osoa | |
|---|---|---|---|---|---|---|---|
| MIR 2024 | 213 | 165 | 28 | 82.5% | 155.66 | $0.16 | Ikusi xehetasuna |
| MIR 2025 | 187 | 165 | 30 | 82.5% | 155.00 | $0.16 | Ikusi xehetasuna |
| MIR 2026 | 223 | 164 | 28 | 82.0% | 154.66 | $0.16 | Ikusi xehetasuna |