MedicalBenchmark

GPT-3.5 Turbo Instruct

281

#281 de 319 models al ranking general

Rendiment acumulat en 3 exàmens MIR

Puntuació neta

248.33 pts

Certesa

55.3%

Correctes / Incorrectes

332 / 251

Cost total

$0.91

Rendiment General

(vs. mitjana)

Certesa

55.3%

avg: 80.6%

Puntuació neta

248.33 pts

avg: 453.30 pts

Encerts

332

avg: 483

Errors

251

avg: 90

Cost total

$0.91

avg: $9.58

Temps mitjà de resposta

3.7s

avg: 17.9s

Tokens eixints

241K

avg: 1.3M

Tokens de raonament

0

avg: 898K

Confiança mitjana

96.5%

avg: 95.4%

Desglossament per Examen

Examen	Posició	Correctes	Incorrectes	Certesa	Puntuació neta	Cost total
MIR 2024	286	102	93	51.0%	71.00	$0.30	Vore detall
MIR 2025	278	106	88	53.0%	76.66	$0.31	Vore detall
MIR 2026	281	124	70	62.0%	100.66	$0.30	Vore detall

MIR 2024

286

Correctes

102

Incorrectes

93

Certesa

51.0%

Puntuació neta

71.00

MIR 2025

278

Correctes

106

Incorrectes

88

Certesa

53.0%

Puntuació neta

76.66

MIR 2026

281

Correctes

124

Incorrectes

70

Certesa

62.0%

Puntuació neta

100.66