MedicalBenchmark

Blog

Articles, novetats i anàlisis sobre IA en medicina

188 Netes: Bianca Ciobanu Bat el Rècord del MIR — Però la IA Ja Va per 200
March 2, 202611 min de lectura

188 Netes: Bianca Ciobanu Bat el Rècord del MIR — Però la IA Ja Va per 200

Bianca Ciobanu Selaru entra en la història amb 188 netes, el millor resultat humà mai registrat en el MIR. 41 anys, origen romanés, la prova que la constància trenca motles. Però el rècord humà arriba en un moment singular: tres models d'IA ja han resolt l'examen complet — 200 de 200 — i quinze superen les 194 netes. Analitzem què significa este doble fita amb dades, gràfiques i context.

MIR 2026ResultatsIA vs Humans
Llegir més
Dues Setmanes Després: 22 Models Nous i Triple 200/200 al MIR 2026
February 20, 202611 min de lectura

Dues Setmanes Després: 22 Models Nous i Triple 200/200 al MIR 2026

Del 5 al 20 de febrer de 2026 vam incorporar 22 models nous al benchmark. En només 15 dies vam passar del 99,5% al 100%: Gemini 3.1 Pro Preview entra amb 200/200, Qwen3.5 397B A17B trenca el sostre open-weights al rànquing global i MedGemma deixa una lliçó incòmoda sobre què vol dir realment especialització en salut. Storytelling tècnic amb noves gràfiques sobre l'empat perfecte, el desempat temporal i com canvia un benchmark quan es queda sense sostre.

MIR 2026BenchmarkGemini 3.1
Llegir més
ALMA i MIRI obtenen la nota màxima possible en l'examen MIR 2026 amb un 100% d'encert
February 11, 202627 min de lectura

ALMA i MIRI obtenen la nota màxima possible en l'examen MIR 2026 amb un 100% d'encert

Dos models d'IA medica desenvolupats a Espanya aconseguixen resultats sense precedents. ALMA encerta les 600 preguntes dels tres ultims MIR sense un sol error — un 100% absolut que cap altre model ha aconseguit. MIRI alcanca un 99,3% amb un cost 13 vegades inferior i responent molt mes rapid. No son models generalistes: son arquitectures RAG Agentiques amb experts especialitzats, construides per BinPar i Editorial Medica Panamericana, que demostren que el futur de la IA medica no esta en models mes grans, sino en models mes intel·ligents.

MIR 2026ALMAMIRI
Llegir més
La Catedral i el Bazar: Open Source vs Propietari en el MIR 2026
February 9, 202618 min de lectura

La Catedral i el Bazar: Open Source vs Propietari en el MIR 2026

Els 33 primers llocs del rànquing MIR 2026 són tots models propietaris. El millor model obert queda en la posició 34. Analitzem el gap entre models oberts i tancats, la taxonomia real de l'open source en IA — on molts models que es proclamen oberts són catedrals amb les portes entreobertes — i per què RAG supera el fine-tuning per a personalitzar IA mèdica sense perdre el control de les teues dades.

MIR 2026Open SourceOpen Weights
Llegir més
El Ganivet Suís i el Bisturí: Per Què els Millors Models de Codi Fracassen en el MIR
February 6, 202616 min de lectura

El Ganivet Suís i el Bisturí: Per Què els Millors Models de Codi Fracassen en el MIR

Claude Opus 4.6 i GPT-5.2-Codex son els models d'IA mes avancats per a programar, capacos de coordinar equips d'agents i construir-se parcialment a si mateixos. Pero en el MIR 2026, un model Flash de 0,34 EUR els humilia. El ganivet suís de la programacio no pot competir amb el bisturí dissenyat per a tallar. Analisi de la paradoxa agentica amb dades de 290 models que demostra per que l'especialitzacio supera la potencia bruta en l'ambit medic.

MIR 2026Models AgènticsClaude Opus 4.6
Llegir més
199 de 200: La IA Només Falla Una en el MIR 2026
February 5, 202619 min de lectura

199 de 200: La IA Només Falla Una en el MIR 2026

Resultats definitius del major benchmark d'IA mèdica en espanyol. Tres models empaten en 199 encerts sobre 200 preguntes vàlides — un 99,5% de precisió que cap ésser humà ha aconseguit mai en la història del MIR. Un model 'Flash' lidera per tercer any consecutiu, demostrant que més car no significa millor. Anàlisi exhaustiva de 290 models avaluats amb dades de cost, velocitat, tokens i precisió que revela les tendències que estan transformant la intel·ligència artificial mèdica.

MIR 2026BenchmarkGemini Flash
Llegir més
MIR 2026: La Tempesta Perfecta
January 26, 202611 min de lectura

MIR 2026: La Tempesta Perfecta

Anatomia forense d'una convocatòria d'alt voltatge i el perill silenciós de l'efecte sostre. Una anàlisi tècnica exhaustiva sobre com una gestió administrativa complexa i un examen tècnicament accessible han creat la convocatòria més volàtil de la dècada. Disseccionem els quaderns, les plantilles oficials i els models psicomètrics del MIR 2026 per a revelar una paradoxa perillosa: notes inflades on el marge d'error és pràcticament inexistent.

MIR 2026AnàlisiPsicometria
Llegir més