MedicalBenchmark
Qwen: Qwen2.5-VL 7B Instruct provider

Qwen2.5-VL 7B Instruct

264

#264 de 291 modelosMIR 2024

Pontuação líquida

60.66 pts

Exatidão

45.0%

Corretas / Incorretas

90 / 88

Custo total

$0.04

Desempenho Geral

(vs. média)
Exatidão

45.0%

avg: 80.5%

Pontuação líquida

60.66 pts

avg: 150.85 pts

Acertos

90

avg: 161

Erros

88

avg: 30

Custo total

$0.04

avg: $3.32

Tempo médio de resposta

7.3s

avg: 16.4s

Tokens de saída

104K

avg: 427K

Tokens de raciocínio

0

avg: 310K

Confiança média

87.0%

avg: 95.4%

Desagregação por Disciplina

Alergologia
Acertos
2
Erros
1
Sem resposta
0
Exatidão
66.7%
Média
90.5%
Anestesiologia e Reanimação
Acertos
3
Erros
1
Sem resposta
0
Exatidão
75.0%
Média
87.1%
Cardiologia
Acertos
6
Erros
12
Sem resposta
3
Exatidão
28.6%
Média
79.7%
Cuidados Paliativos
Acertos
2
Erros
0
Sem resposta
2
Exatidão
50.0%
Média
88.2%
Dermatologia
Acertos
8
Erros
5
Sem resposta
1
Exatidão
57.1%
Média
80.2%
Doenças Infecciosas
Acertos
12
Erros
10
Sem resposta
1
Exatidão
52.2%
Média
81.8%
Endocrinologia e Nutrição
Acertos
10
Erros
9
Sem resposta
0
Exatidão
52.6%
Média
84.2%
Epidemiologia
Acertos
5
Erros
2
Sem resposta
1
Exatidão
62.5%
Média
89.3%
Estatística
Acertos
1
Erros
1
Sem resposta
1
Exatidão
33.3%
Média
91.1%
Farmacologia
Acertos
12
Erros
7
Sem resposta
4
Exatidão
52.2%
Média
85.4%
Gastrenterologia
Acertos
9
Erros
12
Sem resposta
1
Exatidão
40.9%
Média
70.5%
Genética
Acertos
3
Erros
3
Sem resposta
1
Exatidão
42.9%
Média
86.5%
Geriatria
Acertos
6
Erros
3
Sem resposta
1
Exatidão
60.0%
Média
86.9%
Ginecologia e Obstetrícia
Acertos
8
Erros
4
Sem resposta
2
Exatidão
57.1%
Média
81.2%
Hematologia
Acertos
5
Erros
4
Sem resposta
4
Exatidão
38.5%
Média
81.5%
Imunologia
Acertos
5
Erros
2
Sem resposta
1
Exatidão
62.5%
Média
89.1%
Medicina Legal e Bioética
Acertos
2
Erros
0
Sem resposta
0
Exatidão
100.0%
Média
91.7%
Nefrologia
Acertos
2
Erros
9
Sem resposta
2
Exatidão
15.4%
Média
80.8%
Neurologia
Acertos
11
Erros
7
Sem resposta
4
Exatidão
50.0%
Média
83.7%
Oftalmologia
Acertos
2
Erros
3
Sem resposta
0
Exatidão
40.0%
Média
80.0%
Oncologia Médica
Acertos
14
Erros
6
Sem resposta
1
Exatidão
66.7%
Média
80.2%
ORL
Acertos
4
Erros
2
Sem resposta
1
Exatidão
57.1%
Média
74.4%
Pediatria
Acertos
6
Erros
8
Sem resposta
3
Exatidão
35.3%
Média
82.0%
Planeamento e Gestão em Saúde
Acertos
0
Erros
2
Sem resposta
0
Exatidão
0.0%
Média
73.2%
Pneumologia
Acertos
7
Erros
11
Sem resposta
1
Exatidão
36.8%
Média
80.6%
Psiquiatria
Acertos
5
Erros
3
Sem resposta
2
Exatidão
50.0%
Média
89.5%
Radiologia-Urgências
Acertos
8
Erros
6
Sem resposta
0
Exatidão
57.1%
Média
64.9%
Reumatologia
Acertos
7
Erros
6
Sem resposta
1
Exatidão
50.0%
Média
81.4%
Traumatologia
Acertos
9
Erros
5
Sem resposta
1
Exatidão
60.0%
Média
74.5%
Urologia
Acertos
2
Erros
4
Sem resposta
0
Exatidão
33.3%
Média
78.2%

Desagregação por Tipo de Pergunta

Anatomia
Acertos
3
Erros
3
Sem resposta
0
Exatidão
50.0%
Média
79.8%
Bioestatística
Acertos
2
Erros
2
Sem resposta
1
Exatidão
40.0%
Média
90.7%
Diagnóstico
Acertos
34
Erros
31
Sem resposta
8
Exatidão
46.6%
Média
79.2%
Epidemiologia
Acertos
6
Erros
4
Sem resposta
2
Exatidão
50.0%
Média
81.2%
Ética
Acertos
1
Erros
0
Sem resposta
0
Exatidão
100.0%
Média
94.5%
Exames
Acertos
10
Erros
10
Sem resposta
1
Exatidão
47.6%
Média
73.9%
Farmacologia
Acertos
16
Erros
5
Sem resposta
4
Exatidão
64.0%
Média
84.0%
Fisiopatologia
Acertos
14
Erros
16
Sem resposta
3
Exatidão
42.4%
Média
85.4%
Interpretação
Acertos
15
Erros
18
Sem resposta
4
Exatidão
40.5%
Média
69.6%
Prevenção
Acertos
7
Erros
5
Sem resposta
0
Exatidão
58.3%
Média
89.8%
Prognóstico
Acertos
2
Erros
4
Sem resposta
1
Exatidão
28.6%
Média
83.9%
Risco
Acertos
8
Erros
5
Sem resposta
0
Exatidão
61.5%
Média
83.6%
Tratamento
Acertos
33
Erros
31
Sem resposta
7
Exatidão
46.5%
Média
81.3%
#RespostaCorretaEstado
1BB
2DD
3DB
4AC
5CC
6DB
7DD
8CC
9AA
10DD
11BD
12AA
13CC
14DA
15CB
16DA
17C
18AA
19AB
20AC
21DD
22AB
23AA
24CA
25AC
26BB
27CC
28DA
29AB
30DC
31AD
32BA
33CC
34CB
35DD
36BD
37AA
38BA
39CC
40BB
41BC
42BD
43DA
44D
45AD
46BB
47CC
48CC
49AB
50C
51AA
52DD
53AC
54BB
55CC
56DD
57CA
58BA
59BA
60AA
61AA
62D
63CD
64DAnulada
65DD
66CC
67BB
68BAnulada
69AA
70AB
71AB
72BD
73CB
74AC
75BB
76AA
77D
78DC
79CB
80AA
81DC
82CC
83BB
84DC
85AA
86AA
87AB
88D
89CB
90AA
91D
92DA
93AC
94BB
95DD
96BB
97BB
98B
99AA
100BB
101AA
102DD
103BB
104AD
105DB
106C
107CC
108BB
109AD
110CD
111B
112BC
113BAnulada
114BD
115DD
116DA
117BD
118D
119CA
120C
121AA
122AB
123BD
124DD
125AB
126AD
127CA
128DB
129CD
130CC
131BC
132DD
133CA
134BC
135DA
136DD
137AA
138BC
139BA
140CC
141DB
142BC
143A
144DD
145BC
146BC
147CC
148BA
149BC
150DD
151AA
152A
153DC
154BB
155D
156C
157C
158DD
159DD
160BB
161DB
162BB
163BB
164CB
165CA
166DC
167AA
168BB
169CC
170CA
171DD
172AB
173CA
174B
175AA
176CC
177C
178BB
179CC
180AAnulada
181AB
182DD
183CC
184A
185C
186DD
187CA
188CC
189BD
190DD
191BB
192DB
193AC
194DC
195CC
196BB
197AA
198BB
199DD
200AA
201AB
202BD
203B
204AD
205DD
206BAnulada
207BA
208AA
209B
210AD