MedicalBenchmark
Anthropic: Claude 3.7 Sonnet provider

Claude 3.7 Sonnet

61

#61 de 319 models al ranking general

Rendiment acumulat en 3 exàmens MIR

Puntuació neta

557.66 pts

Certesa

94.5%

Correctes / Incorrectes

567 / 28

Cost total

$7.46

Rendiment General

(vs. mitjana)
Certesa

94.5%

avg: 80.6%

Puntuació neta

557.66 pts

avg: 453.30 pts

Encerts

567

avg: 483

Errors

28

avg: 90

Cost total

$7.46

avg: $9.58

Temps mitjà de resposta

10.3s

avg: 17.9s

Tokens eixints

425K

avg: 1.3M

Tokens de raonament

0

avg: 898K

Confiança mitjana

99.1%

avg: 95.4%

Desglossament per Examen

MIR 2024
63
Correctes
191
Incorrectes
9
Certesa
95.5%
Puntuació neta
188.00
MIR 2025
61
Correctes
185
Incorrectes
11
Certesa
92.5%
Puntuació neta
181.33
MIR 2026
70
Correctes
191
Incorrectes
8
Certesa
95.5%
Puntuació neta
188.33