MedicalBenchmark
Anthropic: Claude 3.7 Sonnet (thinking) provider

Claude 3.7 Sonnet (thinking)

50

#50 de 319 models al ranking general

Rendiment acumulat en 3 exàmens MIR

Puntuació neta

561.66 pts

Certesa

95.2%

Correctes / Incorrectes

571 / 28

Cost total

$22.68

Rendiment General

(vs. mitjana)
Certesa

95.2%

avg: 80.6%

Puntuació neta

561.66 pts

avg: 453.30 pts

Encerts

571

avg: 483

Errors

28

avg: 90

Cost total

$22.68

avg: $9.58

Temps mitjà de resposta

31.3s

avg: 17.9s

Tokens sortints

1.4M

avg: 1.3M

Tokens de raonament

912K

avg: 898K

Confiança mitjana

99.7%

avg: 95.4%

Desglossament per Examen

MIR 2024
56
Correctes
191
Incorrectes
8
Certesa
95.5%
Puntuació neta
188.33
MIR 2025
62
Correctes
186
Incorrectes
14
Certesa
93.0%
Puntuació neta
181.33
MIR 2026
50
Correctes
194
Incorrectes
6
Certesa
97.0%
Puntuació neta
192.00