MedicalBenchmark
Qwen: Qwen2.5 VL 32B Instruct provider

Qwen2.5 VL 32B Instruct

243

#243 319 modeloetatik sailkapen orokorrean

3 MIR azterketatan metatutako errendimendua

Puntuazio garbia

416.33 pts

Ziurtasuna

76.7%

Zuzenak / Okerrak

460 / 131

Kostu osoa

$0.59

Errendimendu Orokorra

(vs. batez bestekoa)
Ziurtasuna

76.7%

avg: 80.6%

Puntuazio garbia

416.33 pts

avg: 453.30 pts

Zuzenak

460

avg: 483

Okerrak

131

avg: 90

Kostu osoa

$0.59

avg: $9.58

Batez besteko erantzun-denbora

30.9s

avg: 17.9s

Irteerako tokenak

633K

avg: 1.3M

Arrazonamendu tokenak

0

avg: 898K

Batez besteko konfiantza

97.9%

avg: 95.4%

Azterketaren araberako banaketa

MIR 2024
241
Zuzenak
157
Okerrak
39
Ziurtasuna
78.5%
Puntuazio garbia
144.00
MIR 2025
236
Zuzenak
151
Okerrak
49
Ziurtasuna
75.5%
Puntuazio garbia
134.66
MIR 2026
250
Zuzenak
152
Okerrak
43
Ziurtasuna
76.0%
Puntuazio garbia
137.66