MedicalBenchmark

GPT-5.1-Codex-Mini

40

#40 319 modeloetatik sailkapen orokorrean

3 MIR azterketatan metatutako errendimendua

Puntuazio garbia

566.66 pts

Ziurtasuna

95.8%

Zuzenak / Okerrak

575 / 25

Kostu osoa

$0.61

Errendimendu Orokorra

(vs. batez bestekoa)

Ziurtasuna

95.8%

avg: 80.6%

Puntuazio garbia

566.66 pts

avg: 453.30 pts

Zuzenak

575

avg: 483

Okerrak

25

avg: 90

Kostu osoa

$0.61

avg: $9.58

Batez besteko erantzun-denbora

3.7s

avg: 17.9s

Irteerako tokenak

269K

avg: 1.3M

Arrazonamendu tokenak

139K

avg: 898K

Batez besteko konfiantza

100.0%

avg: 95.4%

Azterketaren araberako banaketa

Azterketa	Posizioa	Zuzenak	Okerrak	Ziurtasuna	Puntuazio garbia	Kostu osoa
MIR 2024	17	194	6	97.0%	192.00	$0.20	Ikusi xehetasuna
MIR 2025	40	188	12	94.0%	184.00	$0.22	Ikusi xehetasuna
MIR 2026	54	193	7	96.5%	190.66	$0.18	Ikusi xehetasuna

MIR 2024

17

Zuzenak

194

Okerrak

6

Ziurtasuna

97.0%

Puntuazio garbia

192.00

Ikusi xehetasuna

MIR 2025

40

Zuzenak

188

Okerrak

12

Ziurtasuna

94.0%

Puntuazio garbia

184.00

Ikusi xehetasuna

MIR 2026

54

Zuzenak

193

Okerrak

7

Ziurtasuna

96.5%

Puntuazio garbia

190.66

Ikusi xehetasuna