MedicalBenchmark

GPT-3.5 Turbo Instruct

281

#281 319 modeloetatik sailkapen orokorrean

3 MIR azterketatan metatutako errendimendua

Puntuazio garbia

248.33 pts

Ziurtasuna

55.3%

Zuzenak / Okerrak

332 / 251

Kostu osoa

$0.91

Errendimendu Orokorra

(vs. batez bestekoa)

Ziurtasuna

55.3%

avg: 80.6%

Puntuazio garbia

248.33 pts

avg: 453.30 pts

Zuzenak

332

avg: 483

Okerrak

251

avg: 90

Kostu osoa

$0.91

avg: $9.58

Batez besteko erantzun-denbora

3.7s

avg: 17.9s

Irteerako tokenak

241K

avg: 1.3M

Arrazonamendu tokenak

0

avg: 898K

Batez besteko konfiantza

96.5%

avg: 95.4%

Azterketaren araberako banaketa

Azterketa	Posizioa	Zuzenak	Okerrak	Ziurtasuna	Puntuazio garbia	Kostu osoa
MIR 2024	286	102	93	51.0%	71.00	$0.30	Ikusi xehetasuna
MIR 2025	278	106	88	53.0%	76.66	$0.31	Ikusi xehetasuna
MIR 2026	281	124	70	62.0%	100.66	$0.30	Ikusi xehetasuna

MIR 2024

286

Zuzenak

102

Okerrak

93

Ziurtasuna

51.0%

Puntuazio garbia

71.00

Ikusi xehetasuna

MIR 2025

278

Zuzenak

106

Okerrak

88

Ziurtasuna

53.0%

Puntuazio garbia

76.66

Ikusi xehetasuna

MIR 2026

281

Zuzenak

124

Okerrak

70

Ziurtasuna

62.0%

Puntuazio garbia

100.66

Ikusi xehetasuna