MedicalBenchmark
Meta: Llama 3.2 3B Instruct provider

Llama 3.2 3B Instruct

278

#278 291 modeloetatikMIR 2024

Puntuazio garbia

38.66 pts

Ziurtasuna

36.0%

Zuzenak / Okerrak

72 / 100

Kostu osoa

$0.01

Errendimendu Orokorra

(vs. batez bestekoa)
Ziurtasuna

36.0%

avg: 80.5%

Puntuazio garbia

38.66 pts

avg: 150.85 pts

Zuzenak

72

avg: 161

Okerrak

100

avg: 30

Kostu osoa

$0.01

avg: $3.32

Batez besteko erantzun-denbora

26.1s

avg: 16.4s

Irteerako tokenak

179K

avg: 427K

Arrazonamendu tokenak

0

avg: 310K

Batez besteko konfiantza

81.0%

avg: 95.4%

Irakasgaien araberako xehetasuna

Alergologia
Zuzenak
2
Okerrak
1
Erantzun gabeak
0
Ziurtasuna
66.7%
Batez bestekoa
90.5%
Anestesiologia eta Bizkortzea
Zuzenak
2
Okerrak
0
Erantzun gabeak
2
Ziurtasuna
50.0%
Batez bestekoa
87.1%
Dermatologia
Zuzenak
5
Okerrak
7
Erantzun gabeak
2
Ziurtasuna
35.7%
Batez bestekoa
80.2%
Endokrinologia eta Nutrizioa
Zuzenak
7
Okerrak
8
Erantzun gabeak
4
Ziurtasuna
36.8%
Batez bestekoa
84.2%
Epidemiologia
Zuzenak
3
Okerrak
3
Erantzun gabeak
2
Ziurtasuna
37.5%
Batez bestekoa
89.3%
Erradiologia-Larrialdiak
Zuzenak
4
Okerrak
9
Erantzun gabeak
1
Ziurtasuna
28.6%
Batez bestekoa
64.9%
Erreumatologia
Zuzenak
6
Okerrak
7
Erantzun gabeak
1
Ziurtasuna
42.9%
Batez bestekoa
81.4%
Estatistika
Zuzenak
1
Okerrak
2
Erantzun gabeak
0
Ziurtasuna
33.3%
Batez bestekoa
91.1%
Farmakologia
Zuzenak
8
Okerrak
8
Erantzun gabeak
7
Ziurtasuna
34.8%
Batez bestekoa
85.4%
Gaixotasun Infekziosoak
Zuzenak
10
Okerrak
10
Erantzun gabeak
3
Ziurtasuna
43.5%
Batez bestekoa
81.8%
Gastroenterologia
Zuzenak
9
Okerrak
11
Erantzun gabeak
2
Ziurtasuna
40.9%
Batez bestekoa
70.5%
Genetika
Zuzenak
3
Okerrak
3
Erantzun gabeak
1
Ziurtasuna
42.9%
Batez bestekoa
86.5%
Geriatria
Zuzenak
5
Okerrak
4
Erantzun gabeak
1
Ziurtasuna
50.0%
Batez bestekoa
86.9%
Ginekologia eta Obstetrizia
Zuzenak
2
Okerrak
9
Erantzun gabeak
3
Ziurtasuna
14.3%
Batez bestekoa
81.2%
Hematologia
Zuzenak
5
Okerrak
7
Erantzun gabeak
1
Ziurtasuna
38.5%
Batez bestekoa
81.5%
Immunologia
Zuzenak
3
Okerrak
5
Erantzun gabeak
0
Ziurtasuna
37.5%
Batez bestekoa
89.1%
Kardiologia
Zuzenak
4
Okerrak
15
Erantzun gabeak
2
Ziurtasuna
19.0%
Batez bestekoa
79.7%
Medikuntza Legala eta Bioetika
Zuzenak
1
Okerrak
1
Erantzun gabeak
0
Ziurtasuna
50.0%
Batez bestekoa
91.7%
Nefrologia
Zuzenak
5
Okerrak
6
Erantzun gabeak
2
Ziurtasuna
38.5%
Batez bestekoa
80.8%
Neurologia
Zuzenak
12
Okerrak
9
Erantzun gabeak
1
Ziurtasuna
54.5%
Batez bestekoa
83.7%
Oftalmologia
Zuzenak
4
Okerrak
0
Erantzun gabeak
1
Ziurtasuna
80.0%
Batez bestekoa
80.0%
Onkologia Medikoa
Zuzenak
8
Okerrak
12
Erantzun gabeak
1
Ziurtasuna
38.1%
Batez bestekoa
80.2%
ORL
Zuzenak
3
Okerrak
3
Erantzun gabeak
1
Ziurtasuna
42.9%
Batez bestekoa
74.4%
Osasun Plangintza eta Kudeaketa
Zuzenak
0
Okerrak
2
Erantzun gabeak
0
Ziurtasuna
0.0%
Batez bestekoa
73.2%
Pediatria
Zuzenak
6
Okerrak
9
Erantzun gabeak
2
Ziurtasuna
35.3%
Batez bestekoa
82.0%
Pneumologia
Zuzenak
6
Okerrak
11
Erantzun gabeak
2
Ziurtasuna
31.6%
Batez bestekoa
80.6%
Psikiatria
Zuzenak
3
Okerrak
5
Erantzun gabeak
2
Ziurtasuna
30.0%
Batez bestekoa
89.5%
Traumatologia
Zuzenak
3
Okerrak
9
Erantzun gabeak
3
Ziurtasuna
20.0%
Batez bestekoa
74.5%
Urologia
Zuzenak
3
Okerrak
3
Erantzun gabeak
0
Ziurtasuna
50.0%
Batez bestekoa
78.2%
Zainketa Aringarriak
Zuzenak
3
Okerrak
1
Erantzun gabeak
0
Ziurtasuna
75.0%
Batez bestekoa
88.2%

Galdera motaren araberako xehetasuna

Anatomia
Zuzenak
3
Okerrak
2
Erantzun gabeak
1
Ziurtasuna
50.0%
Batez bestekoa
79.8%
Arriskua
Zuzenak
5
Okerrak
5
Erantzun gabeak
3
Ziurtasuna
38.5%
Batez bestekoa
83.6%
Biostatistika
Zuzenak
1
Okerrak
3
Erantzun gabeak
1
Ziurtasuna
20.0%
Batez bestekoa
90.7%
Diagnostikoa
Zuzenak
27
Okerrak
36
Erantzun gabeak
10
Ziurtasuna
37.0%
Batez bestekoa
79.2%
Epidemiologia
Zuzenak
2
Okerrak
7
Erantzun gabeak
3
Ziurtasuna
16.7%
Batez bestekoa
81.2%
Etika
Zuzenak
1
Okerrak
0
Erantzun gabeak
0
Ziurtasuna
100.0%
Batez bestekoa
94.5%
Farmakologia
Zuzenak
11
Okerrak
10
Erantzun gabeak
4
Ziurtasuna
44.0%
Batez bestekoa
84.0%
Fisiopatologia
Zuzenak
12
Okerrak
20
Erantzun gabeak
1
Ziurtasuna
36.4%
Batez bestekoa
85.4%
Interpretazioa
Zuzenak
13
Okerrak
19
Erantzun gabeak
5
Ziurtasuna
35.1%
Batez bestekoa
69.6%
Prebentzioa
Zuzenak
7
Okerrak
4
Erantzun gabeak
1
Ziurtasuna
58.3%
Batez bestekoa
89.8%
Probak
Zuzenak
9
Okerrak
10
Erantzun gabeak
2
Ziurtasuna
42.9%
Batez bestekoa
73.9%
Pronostikoa
Zuzenak
1
Okerrak
5
Erantzun gabeak
1
Ziurtasuna
14.3%
Batez bestekoa
83.9%
Tratamendua
Zuzenak
23
Okerrak
34
Erantzun gabeak
14
Ziurtasuna
32.4%
Batez bestekoa
81.3%
#ErantzunaZuzenaEgoera
1AB
2BD
3BB
4AC
5BC
6BB
7DD
8CC
9AA
10BD
11AD
12BA
13C
14A
15CB
16AA
17C
18AA
19AB
20DC
21CD
22B
23AA
24AA
25AC
26BB
27AC
28AA
29BB
30DC
31CD
32BA
33BC
34DB
35BD
36BD
37AA
38CA
39CC
40B
41BC
42AD
43CA
44BD
45BD
46BB
47C
48CC
49BB
50CC
51AA
52CD
53CC
54B
55AC
56AD
57DA
58A
59AA
60AA
61AA
62CD
63D
64Baliogabetua
65D
66AC
67B
68ABaliogabetua
69A
70BB
71AB
72DD
73B
74BC
75BB
76DA
77BD
78CC
79CB
80AA
81DC
82BC
83B
84CC
85BA
86AA
87DB
88DD
89AB
90AA
91DD
92AA
93BC
94BB
95BD
96B
97B
98B
99AA
100CB
101A
102BD
103AB
104BD
105DB
106AC
107CC
108BB
109AD
110BD
111AB
112BC
113BBaliogabetua
114BD
115DD
116CA
117D
118BD
119AA
120CC
121AA
122DB
123AD
124BD
125B
126BD
127DA
128BB
129DD
130C
131BC
132AD
133AA
134BC
135AA
136AD
137AA
138AC
139CA
140CC
141BB
142DC
143AA
144D
145AC
146BC
147CC
148AA
149AC
150CD
151AA
152DA
153DC
154BB
155CD
156BC
157DC
158DD
159DD
160AB
161DB
162DB
163BB
164B
165CA
166CC
167DA
168CB
169CC
170AA
171D
172BB
173AA
174B
175AA
176DC
177C
178DB
179DC
180BBaliogabetua
181CB
182DD
183CC
184CA
185CC
186BD
187DA
188C
189AD
190D
191BB
192DB
193CC
194AC
195CC
196DB
197CA
198BB
199CD
200BA
201BB
202AD
203CB
204DD
205DD
206Baliogabetua
207DA
208A
209B
210AD