Claude 3.7 Sonnet (thinking)
50
#50 319 modeloetatik sailkapen orokorrean
3 MIR azterketatan metatutako errendimendua
Puntuazio garbia
561.66 pts
Ziurtasuna
95.2%
Zuzenak / Okerrak
571 / 28
Kostu osoa
$22.68
Errendimendu Orokorra
(vs. batez bestekoa)Ziurtasuna
95.2%
avg: 80.6%
Puntuazio garbia
561.66 pts
avg: 453.30 pts
Zuzenak
571
avg: 483
Okerrak
28
avg: 90
Kostu osoa
$22.68
avg: $9.58
Batez besteko erantzun-denbora
31.3s
avg: 17.9s
Irteerako tokenak
1.4M
avg: 1.3M
Arrazonamendu tokenak
912K
avg: 898K
Batez besteko konfiantza
99.7%
avg: 95.4%
Azterketaren araberako banaketa
| Azterketa | Posizioa | Zuzenak | Okerrak | Ziurtasuna | Puntuazio garbia | Kostu osoa | |
|---|---|---|---|---|---|---|---|
| MIR 2024 | 56 | 191 | 8 | 95.5% | 188.33 | $7.19 | Ikusi xehetasuna |
| MIR 2025 | 62 | 186 | 14 | 93.0% | 181.33 | $8.35 | Ikusi xehetasuna |
| MIR 2026 | 50 | 194 | 6 | 97.0% | 192.00 | $7.14 | Ikusi xehetasuna |