MedicalBenchmark
Meta: Llama 3.2 1B Instruct provider

Llama 3.2 1B Instruct

287

#287 290 modeloetatikMIR 2025

Puntuazio garbia

6.66 pts

Ziurtasuna

14.5%

Zuzenak / Okerrak

29 / 67

Kostu osoa

$0.03

Errendimendu Orokorra

(vs. batez bestekoa)
Ziurtasuna

14.5%

avg: 75.9%

Puntuazio garbia

6.66 pts

avg: 138.99 pts

Zuzenak

29

avg: 152

Okerrak

67

avg: 38

Kostu osoa

$0.03

avg: $3.59

Batez besteko erantzun-denbora

4.9s

avg: 18.1s

Irteerako tokenak

121K

avg: 443K

Arrazonamendu tokenak

0

avg: 320K

Batez besteko konfiantza

47.1%

avg: 94.7%

Irakasgaien araberako xehetasuna

Alergologia
Zuzenak
0
Okerrak
0
Erantzun gabeak
4
Ziurtasuna
0.0%
Batez bestekoa
86.9%
Anestesiologia eta Bizkortzea
Zuzenak
2
Okerrak
2
Erantzun gabeak
2
Ziurtasuna
33.3%
Batez bestekoa
81.3%
Dermatologia
Zuzenak
1
Okerrak
5
Erantzun gabeak
7
Ziurtasuna
7.7%
Batez bestekoa
62.8%
Endokrinologia eta Nutrizioa
Zuzenak
2
Okerrak
7
Erantzun gabeak
7
Ziurtasuna
12.5%
Batez bestekoa
82.5%
Epidemiologia
Zuzenak
1
Okerrak
4
Erantzun gabeak
2
Ziurtasuna
14.3%
Batez bestekoa
67.1%
Erradiologia-Larrialdiak
Zuzenak
1
Okerrak
5
Erantzun gabeak
8
Ziurtasuna
7.1%
Batez bestekoa
67.9%
Erreumatologia
Zuzenak
1
Okerrak
2
Erantzun gabeak
11
Ziurtasuna
7.1%
Batez bestekoa
74.6%
Estatistika
Zuzenak
1
Okerrak
2
Erantzun gabeak
0
Ziurtasuna
33.3%
Batez bestekoa
74.9%
Farmakologia
Zuzenak
1
Okerrak
5
Erantzun gabeak
11
Ziurtasuna
5.9%
Batez bestekoa
73.1%
Gaixotasun Infekziosoak
Zuzenak
4
Okerrak
11
Erantzun gabeak
13
Ziurtasuna
14.3%
Batez bestekoa
71.1%
Gastroenterologia
Zuzenak
4
Okerrak
10
Erantzun gabeak
7
Ziurtasuna
19.0%
Batez bestekoa
72.9%
Genetika
Zuzenak
3
Okerrak
1
Erantzun gabeak
2
Ziurtasuna
50.0%
Batez bestekoa
68.2%
Geriatria
Zuzenak
1
Okerrak
3
Erantzun gabeak
7
Ziurtasuna
9.1%
Batez bestekoa
71.2%
Ginekologia eta Obstetrizia
Zuzenak
3
Okerrak
7
Erantzun gabeak
9
Ziurtasuna
15.8%
Batez bestekoa
85.9%
Hematologia
Zuzenak
3
Okerrak
2
Erantzun gabeak
6
Ziurtasuna
27.3%
Batez bestekoa
81.8%
Immunologia
Zuzenak
3
Okerrak
2
Erantzun gabeak
4
Ziurtasuna
33.3%
Batez bestekoa
82.5%
Kardiologia
Zuzenak
1
Okerrak
8
Erantzun gabeak
13
Ziurtasuna
4.5%
Batez bestekoa
77.4%
Medikuntza Legala eta Bioetika
Zuzenak
1
Okerrak
2
Erantzun gabeak
2
Ziurtasuna
20.0%
Batez bestekoa
67.2%
Nefrologia
Zuzenak
0
Okerrak
4
Erantzun gabeak
11
Ziurtasuna
0.0%
Batez bestekoa
78.2%
Neurologia
Zuzenak
4
Okerrak
6
Erantzun gabeak
10
Ziurtasuna
20.0%
Batez bestekoa
76.2%
Oftalmologia
Zuzenak
2
Okerrak
1
Erantzun gabeak
2
Ziurtasuna
40.0%
Batez bestekoa
72.6%
Onkologia Medikoa
Zuzenak
7
Okerrak
8
Erantzun gabeak
10
Ziurtasuna
28.0%
Batez bestekoa
86.3%
ORL
Zuzenak
2
Okerrak
4
Erantzun gabeak
2
Ziurtasuna
25.0%
Batez bestekoa
73.8%
Osasun Plangintza eta Kudeaketa
Zuzenak
0
Okerrak
2
Erantzun gabeak
0
Ziurtasuna
0.0%
Batez bestekoa
81.6%
Pediatria
Zuzenak
4
Okerrak
10
Erantzun gabeak
11
Ziurtasuna
16.0%
Batez bestekoa
72.7%
Pneumologia
Zuzenak
0
Okerrak
5
Erantzun gabeak
9
Ziurtasuna
0.0%
Batez bestekoa
73.0%
Psikiatria
Zuzenak
4
Okerrak
2
Erantzun gabeak
2
Ziurtasuna
50.0%
Batez bestekoa
82.0%
Traumatologia
Zuzenak
2
Okerrak
6
Erantzun gabeak
10
Ziurtasuna
11.1%
Batez bestekoa
78.2%
Urologia
Zuzenak
0
Okerrak
4
Erantzun gabeak
3
Ziurtasuna
0.0%
Batez bestekoa
79.5%
Zainketa Aringarriak
Zuzenak
0
Okerrak
1
Erantzun gabeak
3
Ziurtasuna
0.0%
Batez bestekoa
77.2%

Galdera motaren araberako xehetasuna

Anatomia
Zuzenak
2
Okerrak
2
Erantzun gabeak
3
Ziurtasuna
28.6%
Batez bestekoa
77.1%
Arriskua
Zuzenak
0
Okerrak
4
Erantzun gabeak
1
Ziurtasuna
0.0%
Batez bestekoa
84.3%
Biostatistika
Zuzenak
1
Okerrak
3
Erantzun gabeak
0
Ziurtasuna
25.0%
Batez bestekoa
78.4%
Diagnostikoa
Zuzenak
15
Okerrak
25
Erantzun gabeak
49
Ziurtasuna
16.9%
Batez bestekoa
77.9%
Epidemiologia
Zuzenak
1
Okerrak
3
Erantzun gabeak
1
Ziurtasuna
20.0%
Batez bestekoa
75.0%
Etika
Zuzenak
0
Okerrak
1
Erantzun gabeak
2
Ziurtasuna
0.0%
Batez bestekoa
72.0%
Farmakologia
Zuzenak
3
Okerrak
4
Erantzun gabeak
6
Ziurtasuna
23.1%
Batez bestekoa
82.4%
Fisiopatologia
Zuzenak
4
Okerrak
15
Erantzun gabeak
8
Ziurtasuna
14.8%
Batez bestekoa
72.6%
Interpretazioa
Zuzenak
5
Okerrak
12
Erantzun gabeak
25
Ziurtasuna
11.9%
Batez bestekoa
69.3%
Legala
Zuzenak
1
Okerrak
2
Erantzun gabeak
1
Ziurtasuna
25.0%
Batez bestekoa
63.6%
Prebentzioa
Zuzenak
2
Okerrak
4
Erantzun gabeak
6
Ziurtasuna
16.7%
Batez bestekoa
74.5%
Probak
Zuzenak
5
Okerrak
10
Erantzun gabeak
11
Ziurtasuna
19.2%
Batez bestekoa
76.3%
Pronostikoa
Zuzenak
1
Okerrak
3
Erantzun gabeak
2
Ziurtasuna
16.7%
Batez bestekoa
77.8%
Tratamendua
Zuzenak
8
Okerrak
24
Erantzun gabeak
50
Ziurtasuna
9.8%
Batez bestekoa
75.2%
#ErantzunaZuzenaEgoera
1BB
2AA
3AC
4DB
5A
6CC
7BC
8BA
9A
10D
11D
12D
13B
14D
15B
16B
17B
18A
19C
20A
21B
22D
23C
24AD
25C
26BBaliogabetua
27C
28CBaliogabetua
29AD
30DB
31AD
32A
33DD
34CD
35BB
36AD
37CC
38C
39D
40AA
41CD
42AC
43B
44CD
45AD
46AA
47A
48AA
49DD
50BB
51BC
52B
53BD
54B
55CA
56Baliogabetua
57C
58BB
59D
60A
61A
62AD
63B
64BD
65A
66A
67B
68B
69B
70CA
71D
72AA
73DD
74BC
75BA
76B
77BB
78AB
79C
80AC
81CC
82D
83BB
84AD
85C
86DC
87A
88D
89B
90BA
91B
92AC
93B
94C
95A
96C
97D
98C
99CA
100C
101B
102CD
103BA
104C
105A
106C
107CB
108D
109B
110C
111DA
112C
113B
114BD
115D
116AC
117BA
118CD
119CC
120B
121DD
122C
123C
124CC
125BD
126CD
127BB
128BD
129BA
130D
131D
132BA
133B
134C
135B
136C
137BA
138D
139AD
140DB
141BA
142AA
143B
144BB
145D
146C
147CB
148A
149A
150A
151A
152A
153BB
154CB
155B
156C
157A
158C
159CC
160A
161BA
162B
163D
164BC
165A
166B
167AC
168D
169B
170CB
171CC
172BA
173A
174B
175B
176CC
177C
178BA
179CD
180AA
181AB
182C
183DB
184AB
185B
186Baliogabetua
187AC
188AD
189D
190CA
191B
192A
193C
194AA
195A
196BA
197B
198C
199D
200BC
201CB
202A
203AD
204C
205AB
206CD
207A
208C
209CC
210B