MedicalBenchmark
Anthropic: Claude 3.5 Sonnet provider

Claude 3.5 Sonnet

73

#73 de 319 modelos no ranking xeral

Rendemento acumulado en 3 exames MIR

Puntuación neta

552.66 pts

Certeza

94.0%

Correctas / Incorrectas

564 / 34

Custo total

$9.99

Rendemento Xeral

(vs. media)
Certeza

94.0%

avg: 80.6%

Puntuación neta

552.66 pts

avg: 453.30 pts

Acertos

564

avg: 483

Erros

34

avg: 90

Custo total

$9.99

avg: $9.58

Tempo promedio de resposta

11.1s

avg: 17.9s

Tokens saíntes

261K

avg: 1.3M

Tokens de razoamento

0

avg: 898K

Confianza promedia

99.4%

avg: 95.4%

Desagregación por Exame

MIR 2024
23
Correctas
194
Incorrectas
6
Certeza
97.0%
Puntuación neta
192.00
MIR 2025
78
Correctas
182
Incorrectas
17
Certeza
91.0%
Puntuación neta
176.33
MIR 2026
99
Correctas
188
Incorrectas
11
Certeza
94.0%
Puntuación neta
184.33