MedicalBenchmark

GPT-5.1-Codex

28

#28 319 modeloetatik sailkapen orokorrean

3 MIR azterketatan metatutako errendimendua

Puntuazio garbia

573.33 pts

Ziurtasuna

96.7%

Zuzenak / Okerrak

580 / 20

Kostu osoa

$1.96

Errendimendu Orokorra

(vs. batez bestekoa)

Ziurtasuna

96.7%

avg: 80.6%

Puntuazio garbia

573.33 pts

avg: 453.30 pts

Zuzenak

580

avg: 483

Okerrak

20

avg: 90

Kostu osoa

$1.96

avg: $9.58

Batez besteko erantzun-denbora

3.4s

avg: 17.9s

Irteerako tokenak

160K

avg: 1.3M

Arrazonamendu tokenak

64K

avg: 898K

Batez besteko konfiantza

99.4%

avg: 95.4%

Azterketaren araberako banaketa

Azterketa	Posizioa	Zuzenak	Okerrak	Ziurtasuna	Puntuazio garbia	Kostu osoa
MIR 2024	42	192	8	96.0%	189.33	$0.60	Ikusi xehetasuna
MIR 2025	21	192	8	96.0%	189.33	$0.74	Ikusi xehetasuna
MIR 2026	30	196	4	98.0%	194.66	$0.62	Ikusi xehetasuna

MIR 2024

42

Zuzenak

192

Okerrak

8

Ziurtasuna

96.0%

Puntuazio garbia

189.33

Ikusi xehetasuna

MIR 2025

21

Zuzenak

192

Okerrak

8

Ziurtasuna

96.0%

Puntuazio garbia

189.33

Ikusi xehetasuna

MIR 2026

30

Zuzenak

196

Okerrak

4

Ziurtasuna

98.0%

Puntuazio garbia

194.66

Ikusi xehetasuna