MedicalBenchmark
Sao10K: Llama 3.1 Euryale 70B v2.2 provider

Llama 3.1 Euryale 70B v2.2

232

#232 de 291 modelosMIR 2024

Pontuação líquida

125.00 pts

Exatidão

70.0%

Corretas / Incorretas

140 / 45

Custo total

$0.18

Desempenho Geral

(vs. média)
Exatidão

70.0%

avg: 80.5%

Pontuação líquida

125.00 pts

avg: 150.85 pts

Acertos

140

avg: 161

Erros

45

avg: 30

Custo total

$0.18

avg: $3.32

Tempo médio de resposta

21.1s

avg: 16.4s

Tokens de saída

117K

avg: 427K

Tokens de raciocínio

0

avg: 310K

Confiança média

92.7%

avg: 95.4%

Desagregação por Disciplina

Alergologia
Acertos
2
Erros
1
Sem resposta
0
Exatidão
66.7%
Média
90.5%
Anestesiologia e Reanimação
Acertos
4
Erros
0
Sem resposta
0
Exatidão
100.0%
Média
87.1%
Cardiologia
Acertos
15
Erros
4
Sem resposta
2
Exatidão
71.4%
Média
79.7%
Cuidados Paliativos
Acertos
3
Erros
1
Sem resposta
0
Exatidão
75.0%
Média
88.2%
Dermatologia
Acertos
10
Erros
3
Sem resposta
1
Exatidão
71.4%
Média
80.2%
Doenças Infecciosas
Acertos
16
Erros
6
Sem resposta
1
Exatidão
69.6%
Média
81.8%
Endocrinologia e Nutrição
Acertos
16
Erros
3
Sem resposta
0
Exatidão
84.2%
Média
84.2%
Epidemiologia
Acertos
6
Erros
0
Sem resposta
2
Exatidão
75.0%
Média
89.3%
Estatística
Acertos
1
Erros
0
Sem resposta
2
Exatidão
33.3%
Média
91.1%
Farmacologia
Acertos
16
Erros
6
Sem resposta
1
Exatidão
69.6%
Média
85.4%
Gastrenterologia
Acertos
12
Erros
6
Sem resposta
4
Exatidão
54.5%
Média
70.5%
Genética
Acertos
6
Erros
1
Sem resposta
0
Exatidão
85.7%
Média
86.5%
Geriatria
Acertos
8
Erros
2
Sem resposta
0
Exatidão
80.0%
Média
86.9%
Ginecologia e Obstetrícia
Acertos
9
Erros
4
Sem resposta
1
Exatidão
64.3%
Média
81.2%
Hematologia
Acertos
7
Erros
6
Sem resposta
0
Exatidão
53.8%
Média
81.5%
Imunologia
Acertos
8
Erros
0
Sem resposta
0
Exatidão
100.0%
Média
89.1%
Medicina Legal e Bioética
Acertos
1
Erros
1
Sem resposta
0
Exatidão
50.0%
Média
91.7%
Nefrologia
Acertos
9
Erros
4
Sem resposta
0
Exatidão
69.2%
Média
80.8%
Neurologia
Acertos
17
Erros
5
Sem resposta
0
Exatidão
77.3%
Média
83.7%
Oftalmologia
Acertos
5
Erros
0
Sem resposta
0
Exatidão
100.0%
Média
80.0%
Oncologia Médica
Acertos
15
Erros
3
Sem resposta
3
Exatidão
71.4%
Média
80.2%
ORL
Acertos
5
Erros
1
Sem resposta
1
Exatidão
71.4%
Média
74.4%
Pediatria
Acertos
11
Erros
4
Sem resposta
2
Exatidão
64.7%
Média
82.0%
Planeamento e Gestão em Saúde
Acertos
1
Erros
0
Sem resposta
1
Exatidão
50.0%
Média
73.2%
Pneumologia
Acertos
12
Erros
5
Sem resposta
2
Exatidão
63.2%
Média
80.6%
Psiquiatria
Acertos
10
Erros
0
Sem resposta
0
Exatidão
100.0%
Média
89.5%
Radiologia-Urgências
Acertos
6
Erros
4
Sem resposta
4
Exatidão
42.9%
Média
64.9%
Reumatologia
Acertos
12
Erros
2
Sem resposta
0
Exatidão
85.7%
Média
81.4%
Traumatologia
Acertos
9
Erros
3
Sem resposta
3
Exatidão
60.0%
Média
74.5%
Urologia
Acertos
5
Erros
1
Sem resposta
0
Exatidão
83.3%
Média
78.2%

Desagregação por Tipo de Pergunta

Anatomia
Acertos
4
Erros
1
Sem resposta
1
Exatidão
66.7%
Média
79.8%
Bioestatística
Acertos
2
Erros
0
Sem resposta
3
Exatidão
40.0%
Média
90.7%
Diagnóstico
Acertos
54
Erros
13
Sem resposta
6
Exatidão
74.0%
Média
79.2%
Epidemiologia
Acertos
10
Erros
1
Sem resposta
1
Exatidão
83.3%
Média
81.2%
Ética
Acertos
0
Erros
1
Sem resposta
0
Exatidão
0.0%
Média
94.5%
Exames
Acertos
12
Erros
5
Sem resposta
4
Exatidão
57.1%
Média
73.9%
Farmacologia
Acertos
18
Erros
7
Sem resposta
0
Exatidão
72.0%
Média
84.0%
Fisiopatologia
Acertos
27
Erros
6
Sem resposta
0
Exatidão
81.8%
Média
85.4%
Interpretação
Acertos
18
Erros
13
Sem resposta
6
Exatidão
48.6%
Média
69.6%
Prevenção
Acertos
9
Erros
1
Sem resposta
2
Exatidão
75.0%
Média
89.8%
Prognóstico
Acertos
6
Erros
1
Sem resposta
0
Exatidão
85.7%
Média
83.9%
Risco
Acertos
11
Erros
2
Sem resposta
0
Exatidão
84.6%
Média
83.6%
Tratamento
Acertos
47
Erros
20
Sem resposta
4
Exatidão
66.2%
Média
81.3%
#RespostaCorretaEstado
1BB
2BD
3DB
4CC
5C
6BB
7DD
8CC
9CA
10DD
11D
12AA
13DC
14BA
15B
16BA
17CC
18BA
19BB
20DC
21D
22B
23AA
24A
25CC
26BB
27CC
28DA
29AB
30C
31DD
32AA
33CC
34DB
35DD
36DD
37AA
38AA
39CC
40BB
41C
42BD
43AA
44D
45D
46BB
47CC
48CC
49BB
50AC
51AA
52CD
53CC
54BB
55CC
56DD
57AA
58AA
59AA
60AA
61CA
62DD
63DD
64DAnulada
65DD
66CC
67CB
68BAnulada
69AA
70BB
71BB
72CD
73CB
74CC
75B
76AA
77DD
78CC
79AB
80AA
81CC
82CC
83BB
84CC
85AA
86AA
87BB
88DD
89BB
90AA
91DD
92DA
93AC
94BB
95DD
96BB
97BB
98BB
99A
100BB
101AA
102DD
103BB
104DD
105CB
106CC
107CC
108BB
109DD
110DD
111BB
112CC
113DAnulada
114DD
115AD
116BA
117DD
118DD
119AA
120CC
121AA
122BB
123CD
124AD
125CB
126DD
127AA
128DB
129DD
130CC
131AC
132D
133AA
134CC
135A
136DD
137AA
138CC
139AA
140CC
141BB
142CC
143BA
144DD
145AC
146AC
147CC
148AA
149AC
150DD
151AA
152AA
153DC
154BB
155BD
156CC
157CC
158DD
159DD
160BB
161BB
162BB
163BB
164DB
165AA
166CC
167AA
168BB
169CC
170CA
171AD
172BB
173CA
174BB
175AA
176CC
177AC
178DB
179CC
180BAnulada
181CB
182BD
183CC
184AA
185CC
186DD
187AA
188CC
189DD
190DD
191BB
192B
193DC
194CC
195CC
196BB
197AA
198BB
199CD
200AA
201BB
202DD
203BB
204DD
205BD
206CAnulada
207AA
208AA
209AB
210DD