MedicalBenchmark
Anthropic: Claude 3.7 Sonnet (thinking) provider

Claude 3.7 Sonnet (thinking)

50

#50 de 319 modelos en el ranking general

Rendimiento acumulado en 3 exámenes MIR

Puntuación neta

561.66 pts

Certeza

95.2%

Correctas / Incorrectas

571 / 28

Coste total

$22.68

Rendimiento General

(vs. media)
Certeza

95.2%

avg: 80.6%

Puntuación neta

561.66 pts

avg: 453.30 pts

Aciertos

571

avg: 483

Fallos

28

avg: 90

Coste total

$22.68

avg: $9.58

Tiempo promedio de respuesta

31.3s

avg: 17.9s

Tokens salientes

1.4M

avg: 1.3M

Tokens de razonamiento

912K

avg: 898K

Confianza promedio

99.7%

avg: 95.4%

Desglose por Examen

MIR 2024
56
Correctas
191
Incorrectas
8
Certeza
95.5%
Puntuación neta
188.33
MIR 2025
62
Correctas
186
Incorrectas
14
Certeza
93.0%
Puntuación neta
181.33
MIR 2026
50
Correctas
194
Incorrectas
6
Certeza
97.0%
Puntuación neta
192.00