Avaluant el futur de la
IA Mèdica

La plataforma definitiva d'avaluació per a models de llenguatge en els exàmens MIR d'Espanya (2024-2026). Amb la confiança de clínics i investigadors.

Exàmens i Preguntes

Explora les preguntes oficials de l'examen MIR organitzades per any. Cada pregunta inclou anàlisi detallada del rendiment dels models d'IA.

Nou

MIR 2026

24 de gener del 2026

210preguntes

7anul·lades

Millor IA: 200.00 netes (Miri)

Millor huma: 188.00 netes

MIR 2025

25 de gener del 2025

210preguntes

6anul·lades

Millor IA: 200.00 netes (ALMA)

Millor huma: 165.67 netes

MIR 2024

20 de gener del 2024

210preguntes

5anul·lades

Millor IA: 200.00 netes (ALMA)

Millor huma: 186.67 netes

Millors Resultats (MIR 2026)

Avaluació basada en precisió zero-shot en preguntes oficials de l'examen.

ALMA

Binpar

100.0%

200correctas0incorrectas

Puntuación neta: 200.00 pts

319K$10.56

Miri

Editorial médica panamericana

100.0%

200correctas0incorrectas

Puntuación neta: 200.00 pts

137K$0.78

Gemini 3.1 Pro Preview

Google

100.0%

200correctas0incorrectas

Puntuación neta: 200.00 pts

347K$4.33

Gemini 3 Flash Preview

Google

99.5%

199correctas1incorrectas

Puntuación neta: 198.66 pts

95K$0.34

o3

OpenAI

99.5%

199correctas1incorrectas

Puntuación neta: 198.66 pts

148K$1.94

GPT-5

OpenAI

99.5%

199correctas1incorrectas

Puntuación neta: 198.66 pts

193K$2.05

La Nostra Metodologia

Com avaluem els models d'intel·ligència artificial en l'àmbit mèdic utilitzant l'examen MIR com a referència.

Preguntes MIR Oficials

Utilitzem preguntes reals de l'examen MIR d'Espanya, l'estàndard per avaluar coneixements mèdics a nivell professional. Cada pregunta és verificada i categoritzada per especialitat.

Avaluació Rigorosa

Cada model és avaluat sota les mateixes condicions controlades, sense accés a informació externa. Mesurem precisió, raonament clínic i consistència en les respostes.

Anàlisi Detallada

Proporcionem mètriques granulars per especialitat mèdica, tipus de pregunta i nivell de dificultat. Això permet identificar fortaleses i àrees de millora de cada model.

Preguntes catalogades per especialistes

Distribució de les preguntes de l'examen MIR per assignatura i tipus en cada edició.

Anàlisi Integral

El nostre benchmark proporciona una avaluació exhaustiva del rendiment de models d'IA en l'àmbit mèdic.

Avaluació Contínua

Seguiment del rendiment al llarg del temps per identificar millores i regressions.

Mètriques Detallades

Anàlisi granular per assignatura i tipus de pregunta clínica.

Objectius Clars

Benchmarks estandarditzats basats en l'examen MIR oficial d'Espanya.

Transparència Total

Metodologia oberta i reproduïble amb accés complet als criteris d'avaluació.

Actualització Constant

Incorporació de nous models i edicions de l'examen MIR de forma periòdica.

Comparació Directa

Rànquings i estadístiques que permeten comparar el rendiment entre models fàcilment.

Dades Verificades

Preguntes oficials del Ministeri de Sanitat amb respostes validades.

Preguntes per Tipus

Distribució de preguntes per tipus

Anatomia3 preguntes

Bioestadística3 preguntes

Diagnòstic86 preguntes

Epidemiologia10 preguntes

Ètica6 preguntes

Farmacologia16 preguntes

Fisiopatologia26 preguntes

Interpretació41 preguntes

Legal9 preguntes

Prevenció17 preguntes

Pronòstic5 preguntes

Proves36 preguntes

Risc17 preguntes

Tractament74 preguntes

Preguntes per Assignatura

Distribució de preguntes per assignatura

Al·lergologia1 preguntes

Anestesiologia i Reanimació7 preguntes

Cardiologia25 preguntes

Cures Pal·liatives6 preguntes

Dermatologia11 preguntes

Endocrinologia i Nutrició16 preguntes

Epidemiologia8 preguntes

Estadística3 preguntes

Farmacologia12 preguntes

Gastroenterologia32 preguntes

Genètica11 preguntes

Geriatria14 preguntes

Ginecologia i Obstetrícia13 preguntes

Hematologia11 preguntes

Immunologia6 preguntes

Malalties Infeccioses14 preguntes

Medicina Legal i Bioètica11 preguntes

Nefrologia10 preguntes

Neurologia15 preguntes

Oftalmologia6 preguntes

Oncologia Mèdica25 preguntes

ORL8 preguntes

Pediatria22 preguntes

Planificació i Gestió Sanitària10 preguntes

Pneumologia17 preguntes

Psiquiatria8 preguntes

Radiologia-Urgències13 preguntes

Reumatologia12 preguntes

Traumatologia11 preguntes

Urologia8 preguntes

Últims articles

Articles, novetats i anàlisis sobre IA en medicina

2 de març del 202611 min de lectura

188 Netes: Bianca Ciobanu Bat el Rècord del MIR — Però la IA Ja Va per 200

Bianca Ciobanu Selaru entra a la història amb 188 netes, el millor resultat humà mai registrat al MIR. 41 anys, origen romanès, la prova que la constància trenca motlles. Però el rècord humà arriba en un moment singular: tres models d'IA ja han resolt l'examen complet — 200 de 200 — i quinze superen les 194 netes. Analitzem què significa aquest doble fita amb dades, gràfiques i context.

Llegir més

20 de febr. del 202611 min de lectura

Dues Setmanes Després: 22 Models Nous i Triple 200/200 al MIR 2026

Del 5 al 20 de febrer de 2026 vam incorporar 22 models nous al benchmark. En només 15 dies vam passar del 99,5% al 100%: Gemini 3.1 Pro Preview entra amb 200/200, Qwen3.5 397B A17B trenca el sostre open-weights al rànquing global i MedGemma deixa una lliçó incòmoda sobre què vol dir realment especialització en salut. Storytelling tècnic amb noves gràfiques sobre l'empat perfecte, el desempat temporal i com canvia un benchmark quan es queda sense sostre.

Llegir més

11 de febr. del 202627 min de lectura

ALMA i MIRI obtenen la nota màxima possible a l'examen MIR 2026 amb un 100% d'encert

Dos models d'IA medica desenvolupats a Espanya assoleixen resultats sense precedents. ALMA encerta les 600 preguntes dels tres darrers MIR sense cap error — un 100% absolut que cap altre model ha aconseguit. MIRI arriba a un 99,3% amb un cost 13 vegades inferior i responent molt mes rapid. No son models generalistes: son arquitectures RAG Agentiques amb experts especialitzats, construides per BinPar i Editorial Medica Panamericana, que demostren que el futur de la IA medica no esta en models mes grans, sino en models mes intel·ligents.

Llegir més

9 de febr. del 202618 min de lectura

La Catedral i el Basar: Open Source vs Propietari al MIR 2026

Les 33 primeres posicions del rànquing MIR 2026 són tots models propietaris. El millor model obert queda en la posició 34. Analitzem el gap entre models oberts i tancats, la taxonomia real de l'open source en IA — on molts models que es proclamen oberts són catedrals amb les portes entreobertes — i per què RAG supera el fine-tuning per personalitzar IA mèdica sense perdre el control de les teves dades.

Llegir més

6 de febr. del 202616 min de lectura

El Ganivet Suís i el Bisturí: Per Què els Millors Models de Codi Fracassen al MIR

Claude Opus 4.6 i GPT-5.2-Codex son els models d'IA mes avancats per programar, capacos de coordinar equips d'agents i construir-se parcialment a si mateixos. Pero al MIR 2026, un model Flash de 0,34 EUR els humilia. El ganivet suís de la programacio no pot competir amb el bisturí dissenyat per tallar. Analisi de la paradoxa agentica amb dades de 290 models que demostra per que l'especialitzacio supera la potencia bruta en l'ambit medic.

Llegir més

5 de febr. del 202619 min de lectura

199 de 200: La IA Només Falla Una al MIR 2026

Resultats definitius del major benchmark d'IA mèdica en espanyol. Tres models empaten amb 199 encerts sobre 200 preguntes vàlides — un 99,5% de precisió que cap ésser humà ha assolit mai en la història del MIR. Un model 'Flash' lidera per tercer any consecutiu, demostrant que més car no significa millor. Anàlisi exhaustiva de 290 models avaluats amb dades de cost, velocitat, tokens i precisió que revela les tendències que estan transformant la intel·ligència artificial mèdica.

Llegir més

Tots els articles

Avaluant el futur de la IA Mèdica

Exàmens i Preguntes

MIR 2026

MIR 2025

MIR 2024

Millors Resultats (MIR 2026)

ALMA

Miri

Gemini 3.1 Pro Preview

Gemini 3 Flash Preview

o3

GPT-5

La Nostra Metodologia

Preguntes MIR Oficials

Avaluació Rigorosa

Anàlisi Detallada

Preguntes catalogades per especialistes

Anàlisi Integral

Avaluació Contínua

Mètriques Detallades

Objectius Clars

Transparència Total

Actualització Constant

Comparació Directa

Dades Verificades

Preguntes per Tipus

Preguntes per Assignatura

Últims articles

188 Netes: Bianca Ciobanu Bat el Rècord del MIR — Però la IA Ja Va per 200

Dues Setmanes Després: 22 Models Nous i Triple 200/200 al MIR 2026

ALMA i MIRI obtenen la nota màxima possible a l'examen MIR 2026 amb un 100% d'encert

La Catedral i el Basar: Open Source vs Propietari al MIR 2026

El Ganivet Suís i el Bisturí: Per Què els Millors Models de Codi Fracassen al MIR

199 de 200: La IA Només Falla Una al MIR 2026

Avaluant el futur de la
IA Mèdica