MedicalBenchmark
Sao10K: Llama 3.1 Euryale 70B v2.2 provider

Llama 3.1 Euryale 70B v2.2

251

#251 de 319 modelosMIR 2025

Pontuação líquida

120.66 pts

Exatidão

68.5%

Corretas / Incorretas

137 / 49

Custo total

$0.18

Desempenho Geral

(vs. média)
Exatidão

68.5%

avg: 77.9%

Pontuação líquida

120.66 pts

avg: 143.96 pts

Acertos

137

avg: 156

Erros

49

avg: 35

Custo total

$0.18

avg: $3.36

Tempo médio de resposta

18.2s

avg: 19.0s

Tokens de saída

112K

avg: 430K

Tokens de raciocínio

0

avg: 306K

Confiança média

91.4%

avg: 95.2%

Desagregação por Disciplina

Alergologia
Acertos
3
Erros
1
Sem resposta
0
Exatidão
75.0%
Média
87.9%
Anestesiologia e Reanimação
Acertos
5
Erros
1
Sem resposta
0
Exatidão
83.3%
Média
82.3%
Cardiologia
Acertos
16
Erros
6
Sem resposta
0
Exatidão
72.7%
Média
78.6%
Cuidados Paliativos
Acertos
3
Erros
1
Sem resposta
0
Exatidão
75.0%
Média
78.6%
Dermatologia
Acertos
8
Erros
3
Sem resposta
1
Exatidão
66.7%
Média
69.4%
Doenças Infecciosas
Acertos
17
Erros
8
Sem resposta
2
Exatidão
63.0%
Média
74.9%
Endocrinologia e Nutrição
Acertos
10
Erros
5
Sem resposta
1
Exatidão
62.5%
Média
83.5%
Epidemiologia
Acertos
3
Erros
4
Sem resposta
0
Exatidão
42.9%
Média
69.1%
Estatística
Acertos
2
Erros
1
Sem resposta
0
Exatidão
66.7%
Média
76.6%
Farmacologia
Acertos
13
Erros
3
Sem resposta
1
Exatidão
76.5%
Média
74.1%
Gastrenterologia
Acertos
14
Erros
6
Sem resposta
1
Exatidão
66.7%
Média
74.1%
Genética
Acertos
3
Erros
2
Sem resposta
1
Exatidão
50.0%
Média
69.5%
Geriatria
Acertos
11
Erros
0
Sem resposta
0
Exatidão
100.0%
Média
77.5%
Ginecologia e Obstetrícia
Acertos
13
Erros
3
Sem resposta
3
Exatidão
68.4%
Média
86.7%
Hematologia
Acertos
8
Erros
3
Sem resposta
0
Exatidão
72.7%
Média
82.7%
Imunologia
Acertos
6
Erros
1
Sem resposta
2
Exatidão
66.7%
Média
83.3%
Medicina Legal e Bioética
Acertos
4
Erros
1
Sem resposta
0
Exatidão
80.0%
Média
68.4%
Nefrologia
Acertos
8
Erros
4
Sem resposta
2
Exatidão
57.1%
Média
84.8%
Neurologia
Acertos
12
Erros
5
Sem resposta
3
Exatidão
60.0%
Média
77.3%
Oftalmologia
Acertos
3
Erros
1
Sem resposta
1
Exatidão
60.0%
Média
74.2%
Oncologia Médica
Acertos
23
Erros
2
Sem resposta
0
Exatidão
92.0%
Média
87.2%
ORL
Acertos
6
Erros
2
Sem resposta
0
Exatidão
75.0%
Média
74.8%
Pediatria
Acertos
14
Erros
10
Sem resposta
2
Exatidão
53.8%
Média
71.9%
Planeamento e Gestão em Saúde
Acertos
2
Erros
0
Sem resposta
0
Exatidão
100.0%
Média
82.6%
Pneumologia
Acertos
12
Erros
2
Sem resposta
0
Exatidão
85.7%
Média
80.4%
Psiquiatria
Acertos
7
Erros
1
Sem resposta
0
Exatidão
87.5%
Média
83.0%
Radiologia-Urgências
Acertos
9
Erros
4
Sem resposta
1
Exatidão
64.3%
Média
69.4%
Reumatologia
Acertos
13
Erros
2
Sem resposta
0
Exatidão
86.7%
Média
76.6%
Traumatologia
Acertos
12
Erros
5
Sem resposta
1
Exatidão
66.7%
Média
79.3%
Urologia
Acertos
5
Erros
1
Sem resposta
1
Exatidão
71.4%
Média
80.7%

Desagregação por Tipo de Pergunta

Anatomia
Acertos
5
Erros
2
Sem resposta
0
Exatidão
71.4%
Média
78.6%
Bioestatística
Acertos
3
Erros
1
Sem resposta
0
Exatidão
75.0%
Média
79.8%
Diagnóstico
Acertos
63
Erros
17
Sem resposta
8
Exatidão
71.6%
Média
79.9%
Epidemiologia
Acertos
3
Erros
2
Sem resposta
0
Exatidão
60.0%
Média
76.7%
Ética
Acertos
2
Erros
1
Sem resposta
0
Exatidão
66.7%
Média
74.1%
Exames
Acertos
21
Erros
5
Sem resposta
1
Exatidão
77.8%
Média
77.9%
Farmacologia
Acertos
11
Erros
2
Sem resposta
0
Exatidão
84.6%
Média
83.3%
Fisiopatologia
Acertos
16
Erros
9
Sem resposta
2
Exatidão
59.3%
Média
76.1%
Interpretação
Acertos
21
Erros
14
Sem resposta
7
Exatidão
50.0%
Média
70.7%
Legal
Acertos
3
Erros
1
Sem resposta
0
Exatidão
75.0%
Média
64.6%
Prevenção
Acertos
5
Erros
5
Sem resposta
2
Exatidão
41.7%
Média
75.6%
Prognóstico
Acertos
6
Erros
1
Sem resposta
0
Exatidão
85.7%
Média
80.8%
Risco
Acertos
4
Erros
1
Sem resposta
0
Exatidão
80.0%
Média
85.2%
Tratamento
Acertos
56
Erros
20
Sem resposta
5
Exatidão
69.1%
Média
77.3%
#RespostaCorretaEstado
1BB
2A
3CC
4AB
5A
6CC
7DC
8CA
9AA
10D
11DD
12DD
13AB
14DD
15BAnulada
16CB
17AB
18CA
19CC
20AA
21BB
22CD
23C
24DD
25CC
26CAnulada
27DC
28CAnulada
29DD
30AB
31AD
32AA
33DD
34DD
35BB
36DD
37AC
38CC
39BD
40AA
41DD
42CC
43DB
44DD
45AD
46AA
47AA
48AA
49AD
50BB
51DC
52BB
53DD
54DB
55AA
56BAnulada
57CC
58BB
59DD
60A
61BA
62DD
63BB
64DD
65A
66AA
67BB
68DB
69CB
70AA
71DD
72AA
73BD
74CC
75AA
76BB
77BB
78BB
79C
80CC
81CC
82AD
83BB
84DD
85AC
86CC
87BA
88DD
89AB
90AA
91DB
92CC
93BB
94CC
95AA
96CC
97CD
98CC
99BA
100CC
101BB
102DD
103AA
104CC
105AA
106CC
107BB
108DD
109BB
110CC
111AA
112CC
113BB
114DD
115DD
116C
117AA
118DD
119BC
120BB
121DD
122CC
123CC
124CC
125DD
126BD
127BB
128DD
129AA
130DD
131BD
132A
133BB
134AC
135BB
136CC
137A
138DD
139DD
140DB
141AA
142AA
143BB
144BB
145CD
146CC
147BB
148BA
149AA
150DD
151AA
152AA
153BB
154BB
155AB
156CC
157AA
158CC
159BC
160A
161CA
162CAnulada
163DD
164AC
165AA
166CB
167AC
168DD
169DB
170BB
171CC
172CA
173A
174BB
175AB
176CC
177CC
178BA
179AD
180AA
181BB
182CC
183BB
184BB
185BB
186DAnulada
187C
188DD
189DD
190AA
191BB
192AA
193CC
194AA
195A
196AA
197BB
198CC
199DD
200CC
201BB
202AA
203DD
204DC
205BB
206CD
207AA
208AC
209CC
210BB