MedicalBenchmark
EssentialAI: Rnj 1 Instruct provider

Rnj 1 Instruct

308

#308 319 modeloetatik sailkapen orokorrean

3 MIR azterketatan metatutako errendimendua

Puntuazio garbia

110.66 pts

Ziurtasuna

35.5%

Zuzenak / Okerrak

213 / 307

Kostu osoa

$0.11

Errendimendu Orokorra

(vs. batez bestekoa)
Ziurtasuna

35.5%

avg: 80.6%

Puntuazio garbia

110.66 pts

avg: 453.30 pts

Zuzenak

213

avg: 483

Okerrak

307

avg: 90

Kostu osoa

$0.11

avg: $9.58

Batez besteko erantzun-denbora

5.6s

avg: 17.9s

Irteerako tokenak

409K

avg: 1.3M

Arrazonamendu tokenak

0

avg: 898K

Batez besteko konfiantza

85.0%

avg: 95.4%

Azterketaren araberako banaketa

MIR 2024
307
Zuzenak
72
Okerrak
100
Ziurtasuna
36.0%
Puntuazio garbia
38.66
MIR 2025
310
Zuzenak
60
Okerrak
118
Ziurtasuna
30.0%
Puntuazio garbia
20.66
MIR 2026
307
Zuzenak
81
Okerrak
89
Ziurtasuna
40.5%
Puntuazio garbia
51.33