MedicalBenchmark

Llama 3.1 8B Instruct

298

#298 de 319 modelos en el ranking general

Rendimiento acumulado en 3 exámenes MIR

Puntuación neta

160.33 pts

Certeza

39.8%

Correctas / Incorrectas

239 / 236

Coste total

$0.06

Rendimiento General

(vs. media)

Certeza

39.8%

avg: 80.6%

Puntuación neta

160.33 pts

avg: 453.30 pts

Aciertos

239

avg: 483

Fallos

236

avg: 90

Coste total

$0.06

avg: $9.58

Tiempo promedio de respuesta

25.0s

avg: 17.9s

Tokens salientes

784K

avg: 1.3M

Tokens de razonamiento

0

avg: 898K

Confianza promedio

79.1%

avg: 95.4%

Desglose por Examen

Examen	Posición	Correctas	Incorrectas	Certeza	Puntuación neta	Coste total
MIR 2024	303	74	90	37.0%	44.00	$0.02	Ver detalle
MIR 2025	290	79	78	39.5%	53.00	$0.02	Ver detalle
MIR 2026	299	86	68	43.0%	63.33	$0.02	Ver detalle

MIR 2024

303

Correctas

74

Incorrectas

90

Certeza

37.0%

Puntuación neta

44.00

MIR 2025

290

Correctas

79

Incorrectas

78

Certeza

39.5%

Puntuación neta

53.00

MIR 2026

299

Correctas

86

Incorrectas

68

Certeza

43.0%

Puntuación neta

63.33