MedicalBenchmark
Anthropic: Claude 3.5 Sonnet provider

Claude 3.5 Sonnet

73

#73 de 319 modelos no ranking geral

Desempenho acumulado em 3 exames MIR

Pontuação líquida

552.66 pts

Exatidão

94.0%

Corretas / Incorretas

564 / 34

Custo total

$9.99

Desempenho Geral

(vs. média)
Exatidão

94.0%

avg: 80.6%

Pontuação líquida

552.66 pts

avg: 453.30 pts

Acertos

564

avg: 483

Erros

34

avg: 90

Custo total

$9.99

avg: $9.58

Tempo médio de resposta

11.1s

avg: 17.9s

Tokens de saída

261K

avg: 1.3M

Tokens de raciocínio

0

avg: 898K

Confiança média

99.4%

avg: 95.4%

Desagregação por Exame

MIR 2024
23
Corretas
194
Incorretas
6
Exatidão
97.0%
Pontuação líquida
192.00
MIR 2025
78
Corretas
182
Incorretas
17
Exatidão
91.0%
Pontuação líquida
176.33
MIR 2026
99
Corretas
188
Incorretas
11
Exatidão
94.0%
Pontuação líquida
184.33