MedicalBenchmark

Bloga

Artikuluak, berriak eta analisiak medikuntzan IA-ri buruz

188 Neta: Bianca Ciobanu-k MIR-eko Errekorra Apurtzen du — Baina IAk Jada 200etik Doa
2026(e)ko martxoaren 2(a)9 min irakurketa

188 Neta: Bianca Ciobanu-k MIR-eko Errekorra Apurtzen du — Baina IAk Jada 200etik Doa

Bianca Ciobanu Selaru-k historian sartu da 188 netarekin, MIR-en inoiz erregistratutako giza emaitzarik onena. 41 urte, jatorri errumaniarra, iraunkortasunak moldeak hausten dituela frogatzea. Baina giza errekorra une singular batean iristen da: hiru IA ereduk jada azterketa osoa ebatzi dute — 200etik 200 — eta hamabostek 194 netatik gora gainditzen dute. Bikoitz mugarri honek zer esan nahi duen aztertzen dugu datuekin, grafikoekin eta testuinguruarekin.

MIR 2026EmaitzakIA vs Gizakiak
Gehiago irakurri
Bi Asteren Ondoren: 22 Eredu Berri eta Hiruko 200/200 MIR 2026an
2026(e)ko otsailaren 20(a)9 min irakurketa

Bi Asteren Ondoren: 22 Eredu Berri eta Hiruko 200/200 MIR 2026an

2026ko otsailaren 5etik 20ra 22 eredu berri gehitu ditugu benchmarkera. 15 egunetan %99,5etik %100era egin dugu jauzi: Gemini 3.1 Pro Preview-k 200/200 lortzen du, Qwen3.5 397B A17B-k open-weights sabaiari pitzadura egiten dio ranking globalean, eta MedGemma-k osasuneko "espezializazioa" zer den benetan erakusten duen lezio deserosoa uzten du. Storytelling teknikoa grafiko berriekin: berdinketa perfektua, denborazko desberdinketa eta benchmark bat sabairik gabe geratzen denean nola aldatzen den.

MIR 2026BenchmarkGemini 3.1
Gehiago irakurri
ALMA eta MIRI-k MIR 2026 azterketan lor daitekeen notarik altuena lortzen dute %100eko asmatze-tasarekin
2026(e)ko otsailaren 11(a)23 min irakurketa

ALMA eta MIRI-k MIR 2026 azterketan lor daitekeen notarik altuena lortzen dute %100eko asmatze-tasarekin

Espainian garatutako bi AA mediko modelok aurrekaririk gabeko emaitzak lortu dituzte. ALMAk azken hiru MIR-etako 600 galderak asmatu ditu akats bakar bat ere gabe — beste eredu inork lortu ez duen %100 absolutua. MIRIk %99,3 lortu du 13 aldiz kostu txikiagoarekin eta askoz azkarrago erantzunez. Ez dira eredu orokorrak: aditu espezializatuekin RAG Agentiko arkitekturak dira, BinPar eta Editorial Medica Panamericana-k eraikitakoak, AA medikoaren etorkizuna ez dagoela eredu handiagoengan, baizik eta adimendunagoetan frogatzen dutenak.

MIR 2026ALMAMIRI
Gehiago irakurri
Katedrala eta Bazarra: Open Source vs Jabetza MIR 2026an
2026(e)ko otsailaren 9(a)15 min irakurketa

Katedrala eta Bazarra: Open Source vs Jabetza MIR 2026an

MIR 2026ko rankingeko lehen 33 postuak jabetza-eredu guztiak dira. Eredu ireki onena 34. postuan geratzen da. Eredu irekien eta itxien arteko aldea aztertzen dugu, IAko open source-aren benetako taxonomia — non ireki aldarrikatzen diren eredu asko ateak erdi-irekita dituzten katedralak diren — eta zergatik RAGek fine-tuning-a gainditzen duen IA medikoa pertsonalizatzeko zure datuen kontrola galdu gabe.

MIR 2026Open SourceOpen Weights
Gehiago irakurri
Suitzako Labana eta Bisturria: Zergatik Huts Egiten duten Kode Eredu Onenek MIRen
2026(e)ko otsailaren 6(a)13 min irakurketa

Suitzako Labana eta Bisturria: Zergatik Huts Egiten duten Kode Eredu Onenek MIRen

Claude Opus 4.6 eta GPT-5.2-Codex programatzeko IA eredu aurreratuenak dira, agente-taldeak koordinatzeko eta partzialki beren burua eraikitzeko gai direnak. Baina MIR 2026an, 0,34 EUR-ko Flash eredu batek umiliatzen ditu. Programaziorako labana suitzarra ezin du ebakitzeko diseinatutako bisturiarekin lehiatu. Paradoxa agentikoaren analisia 290 ereduren datuekin, espezializazioak potentzia gordina zergatik gainditzen duen eremu medikoan erakusten duena.

MIR 2026Eredu AgentikoakClaude Opus 4.6
Gehiago irakurri
199/200: IAk Bakarra Huts Egiten du MIR 2026an
2026(e)ko otsailaren 5(a)16 min irakurketa

199/200: IAk Bakarra Huts Egiten du MIR 2026an

Gaztelaniazko IA medikoaren benchmark handiaren emaitza behinbetikoak. Hiru ereduk 199 asmatu dituzte 200 galdera baliozkoetatik — %99,5eko zehaztasuna, gizaki inork MIRen historian inoiz lortu ez duena. 'Flash' eredu batek hirugarren urtez jarraian lidertzen du, garestiagoa ez dela hobea erakutsiz. 290 ereduren azterketa sakona, kostu, abiadura, token eta zehaztasunaren datuekin, IA medikoa eraldatzen ari diren joerak agerian jartzen dituena.

MIR 2026BenchmarkGemini Flash
Gehiago irakurri
MIR 2026: Ekaitz Perfektua
2026(e)ko urtarrilaren 26(a)9 min irakurketa

MIR 2026: Ekaitz Perfektua

Boltatze handiko deialdi baten azterketa forentsea eta sabai-efektuaren arrisku isila. Analisi tekniko sakona kudeaketa administratibo konplexu batek eta teknikoki irisgarria den azterketa batek nola sortu duten hamarkadako deialdirik aldakorrena. MIR 2026ko koadernoak, plantilla ofizialak eta eredu psikometrikoak aztertzen ditugu paradoxa arriskutsu bat agerian jartzeko: nota puztutasunak non akats-tartea ia existitzen ez den.

MIR 2026AnalisiaPsikometria
Gehiago irakurri