MedicalBenchmark
Qwen: Qwen-Turbo provider

Qwen-Turbo

233

#233 319 modeloetatik sailkapen orokorrean

3 MIR azterketatan metatutako errendimendua

Puntuazio garbia

433.00 pts

Ziurtasuna

78.3%

Zuzenak / Okerrak

470 / 111

Kostu osoa

$0.08

Errendimendu Orokorra

(vs. batez bestekoa)
Ziurtasuna

78.3%

avg: 80.6%

Puntuazio garbia

433.00 pts

avg: 453.30 pts

Zuzenak

470

avg: 483

Okerrak

111

avg: 90

Kostu osoa

$0.08

avg: $9.58

Batez besteko erantzun-denbora

7.6s

avg: 17.9s

Irteerako tokenak

339K

avg: 1.3M

Arrazonamendu tokenak

0

avg: 898K

Batez besteko konfiantza

96.0%

avg: 95.4%

Azterketaren araberako banaketa

MIR 2024
227
Zuzenak
163
Okerrak
32
Ziurtasuna
81.5%
Puntuazio garbia
152.33
MIR 2025
225
Zuzenak
153
Okerrak
41
Ziurtasuna
76.5%
Puntuazio garbia
139.33
MIR 2026
244
Zuzenak
154
Okerrak
38
Ziurtasuna
77.0%
Puntuazio garbia
141.33