MedicalBenchmark

Llama 3.3 70B Instruct

195

#195 de 319 modelos en el ranking general

Rendimiento acumulado en 3 exámenes MIR

Puntuación neta

478.33 pts

Certeza

84.0%

Correctas / Incorrectas

504 / 77

Coste total

$0.28

Rendimiento General

(vs. media)

Certeza

84.0%

avg: 80.6%

Puntuación neta

478.33 pts

avg: 453.30 pts

Aciertos

504

avg: 483

Fallos

77

avg: 90

Coste total

$0.28

avg: $9.58

Tiempo promedio de respuesta

14.1s

avg: 17.9s

Tokens salientes

322K

avg: 1.3M

Tokens de razonamiento

0

avg: 898K

Confianza promedio

94.9%

avg: 95.4%

Desglose por Examen

Examen	Posición	Correctas	Incorrectas	Certeza	Puntuación neta	Coste total
MIR 2024	201	171	27	85.5%	162.00	$0.09	Ver detalle
MIR 2025	203	161	32	80.5%	150.33	$0.10	Ver detalle
MIR 2026	177	172	18	86.0%	166.00	$0.09	Ver detalle

MIR 2024

201

Correctas

171

Incorrectas

27

Certeza

85.5%

Puntuación neta

162.00

MIR 2025

203

Correctas

161

Incorrectas

32

Certeza

80.5%

Puntuación neta

150.33

MIR 2026

177

Correctas

172

Incorrectas

18

Certeza

86.0%

Puntuación neta

166.00