MedicalBenchmark
Sao10K: Llama 3.1 Euryale 70B v2.2 provider

Llama 3.1 Euryale 70B v2.2

226

#226 de 290 modelosMIR 2025

Pontuação líquida

118.00 pts

Exatidão

67.5%

Corretas / Incorretas

135 / 51

Custo total

$0.18

Desempenho Geral

(vs. média)
Exatidão

67.5%

avg: 75.9%

Pontuação líquida

118.00 pts

avg: 138.99 pts

Acertos

135

avg: 152

Erros

51

avg: 38

Custo total

$0.18

avg: $3.59

Tempo médio de resposta

18.2s

avg: 18.1s

Tokens de saída

112K

avg: 443K

Tokens de raciocínio

0

avg: 320K

Confiança média

91.4%

avg: 94.7%

Desagregação por Disciplina

Alergologia
Acertos
3
Erros
1
Sem resposta
0
Exatidão
75.0%
Média
86.9%
Anestesiologia e Reanimação
Acertos
5
Erros
1
Sem resposta
0
Exatidão
83.3%
Média
81.3%
Cardiologia
Acertos
16
Erros
6
Sem resposta
0
Exatidão
72.7%
Média
77.4%
Cuidados Paliativos
Acertos
3
Erros
1
Sem resposta
0
Exatidão
75.0%
Média
77.2%
Dermatologia
Acertos
8
Erros
4
Sem resposta
1
Exatidão
61.5%
Média
62.8%
Doenças Infecciosas
Acertos
17
Erros
9
Sem resposta
2
Exatidão
60.7%
Média
71.1%
Endocrinologia e Nutrição
Acertos
10
Erros
5
Sem resposta
1
Exatidão
62.5%
Média
82.5%
Epidemiologia
Acertos
3
Erros
4
Sem resposta
0
Exatidão
42.9%
Média
67.1%
Estatística
Acertos
2
Erros
1
Sem resposta
0
Exatidão
66.7%
Média
74.9%
Farmacologia
Acertos
13
Erros
3
Sem resposta
1
Exatidão
76.5%
Média
73.1%
Gastrenterologia
Acertos
14
Erros
6
Sem resposta
1
Exatidão
66.7%
Média
72.9%
Genética
Acertos
3
Erros
2
Sem resposta
1
Exatidão
50.0%
Média
68.2%
Geriatria
Acertos
10
Erros
1
Sem resposta
0
Exatidão
90.9%
Média
71.2%
Ginecologia e Obstetrícia
Acertos
13
Erros
3
Sem resposta
3
Exatidão
68.4%
Média
85.9%
Hematologia
Acertos
8
Erros
3
Sem resposta
0
Exatidão
72.7%
Média
81.8%
Imunologia
Acertos
6
Erros
1
Sem resposta
2
Exatidão
66.7%
Média
82.5%
Medicina Legal e Bioética
Acertos
4
Erros
1
Sem resposta
0
Exatidão
80.0%
Média
67.2%
Nefrologia
Acertos
8
Erros
5
Sem resposta
2
Exatidão
53.3%
Média
78.2%
Neurologia
Acertos
12
Erros
5
Sem resposta
3
Exatidão
60.0%
Média
76.2%
Oftalmologia
Acertos
3
Erros
1
Sem resposta
1
Exatidão
60.0%
Média
72.6%
Oncologia Médica
Acertos
23
Erros
2
Sem resposta
0
Exatidão
92.0%
Média
86.3%
ORL
Acertos
6
Erros
2
Sem resposta
0
Exatidão
75.0%
Média
73.8%
Pediatria
Acertos
14
Erros
9
Sem resposta
2
Exatidão
56.0%
Média
72.7%
Planeamento e Gestão em Saúde
Acertos
2
Erros
0
Sem resposta
0
Exatidão
100.0%
Média
81.6%
Pneumologia
Acertos
11
Erros
3
Sem resposta
0
Exatidão
78.6%
Média
73.0%
Psiquiatria
Acertos
7
Erros
1
Sem resposta
0
Exatidão
87.5%
Média
82.0%
Radiologia-Urgências
Acertos
9
Erros
4
Sem resposta
1
Exatidão
64.3%
Média
67.9%
Reumatologia
Acertos
12
Erros
2
Sem resposta
0
Exatidão
85.7%
Média
74.6%
Traumatologia
Acertos
12
Erros
5
Sem resposta
1
Exatidão
66.7%
Média
78.2%
Urologia
Acertos
5
Erros
1
Sem resposta
1
Exatidão
71.4%
Média
79.5%

Desagregação por Tipo de Pergunta

Anatomia
Acertos
5
Erros
2
Sem resposta
0
Exatidão
71.4%
Média
77.1%
Bioestatística
Acertos
3
Erros
1
Sem resposta
0
Exatidão
75.0%
Média
78.4%
Diagnóstico
Acertos
63
Erros
18
Sem resposta
8
Exatidão
70.8%
Média
77.9%
Epidemiologia
Acertos
3
Erros
2
Sem resposta
0
Exatidão
60.0%
Média
75.0%
Ética
Acertos
2
Erros
1
Sem resposta
0
Exatidão
66.7%
Média
72.0%
Exames
Acertos
20
Erros
5
Sem resposta
1
Exatidão
76.9%
Média
76.3%
Farmacologia
Acertos
11
Erros
2
Sem resposta
0
Exatidão
84.6%
Média
82.4%
Fisiopatologia
Acertos
15
Erros
10
Sem resposta
2
Exatidão
55.6%
Média
72.6%
Interpretação
Acertos
21
Erros
14
Sem resposta
7
Exatidão
50.0%
Média
69.3%
Legal
Acertos
3
Erros
1
Sem resposta
0
Exatidão
75.0%
Média
63.6%
Prevenção
Acertos
5
Erros
5
Sem resposta
2
Exatidão
41.7%
Média
74.5%
Prognóstico
Acertos
5
Erros
1
Sem resposta
0
Exatidão
83.3%
Média
77.8%
Risco
Acertos
4
Erros
1
Sem resposta
0
Exatidão
80.0%
Média
84.3%
Tratamento
Acertos
56
Erros
21
Sem resposta
5
Exatidão
68.3%
Média
75.2%
#RespostaCorretaEstado
1BB
2A
3CC
4AB
5A
6CC
7DC
8CA
9AA
10D
11DD
12DD
13AB
14DD
15B
16CB
17AB
18CA
19CC
20AA
21BB
22CD
23C
24DD
25CC
26CAnulada
27DC
28CAnulada
29DD
30AB
31AD
32AA
33DD
34DD
35BB
36DD
37AC
38CC
39BD
40AA
41DD
42CC
43DB
44DD
45AD
46AA
47AA
48AA
49AD
50BB
51DC
52BB
53DD
54DB
55AA
56BAnulada
57CC
58BB
59DD
60A
61BA
62DD
63BB
64DD
65A
66AA
67BB
68DB
69CB
70AA
71DD
72AA
73BD
74CC
75AA
76BB
77BB
78BB
79C
80CC
81CC
82AD
83BB
84DD
85AC
86CC
87BA
88DD
89AB
90AA
91DB
92CC
93BB
94CC
95AA
96CC
97CD
98CC
99BA
100CC
101BB
102DD
103AA
104CC
105AA
106CC
107BB
108DD
109BB
110CC
111AA
112CC
113BB
114DD
115DD
116C
117AA
118DD
119BC
120BB
121DD
122CC
123CC
124CC
125DD
126BD
127BB
128DD
129AA
130DD
131BD
132A
133BB
134AC
135BB
136CC
137A
138DD
139DD
140DB
141AA
142AA
143BB
144BB
145CD
146CC
147BB
148BA
149AA
150DA
151AA
152AA
153BB
154BB
155AB
156CC
157AA
158CC
159BC
160A
161CA
162C
163DD
164AC
165AA
166CB
167AC
168DD
169DB
170BB
171CC
172CA
173A
174BB
175AB
176CC
177CC
178BA
179AD
180AA
181BB
182CC
183BB
184BB
185BB
186DAnulada
187C
188DD
189DD
190AA
191BB
192AA
193CC
194AA
195A
196AA
197BB
198CC
199DD
200CC
201BB
202AA
203DD
204DC
205BB
206CD
207AA
208AC
209CC
210BB