MedicalBenchmark

Blog

Artículos, novedades y análisis sobre IA en medicina

188 Netas: Bianca Ciobanu Bate el Récord del MIR — Pero la IA Ya Va por 200
2 de marzo de 202611 min de lectura

188 Netas: Bianca Ciobanu Bate el Récord del MIR — Pero la IA Ya Va por 200

Bianca Ciobanu Selaru entra en la historia con 188 netas, el mejor resultado humano jamás registrado en el MIR. 41 años, origen rumano, la prueba de que la constancia rompe moldes. Pero el récord humano llega en un momento singular: tres modelos de IA ya han resuelto el examen completo — 200 de 200 — y quince superan las 194 netas. Analizamos qué significa este doble hito con datos, gráficas y contexto.

MIR 2026ResultadosIA vs Humanos
Leer más
Dos Semanas Después: 22 Modelos Nuevos y Triple 200/200 en el MIR 2026
20 de febrero de 202611 min de lectura

Dos Semanas Después: 22 Modelos Nuevos y Triple 200/200 en el MIR 2026

Del 5 al 20 de febrero de 2026 incorporamos 22 modelos nuevos al benchmark. En solo 15 días pasamos del 99,5% al 100%: Gemini 3.1 Pro Preview entra con 200/200, Qwen3.5 397B A17B rompe el techo open-weights en el ranking global y MedGemma deja una lección incómoda sobre especialización en salud. Storytelling técnico con nuevas gráficas sobre el empate perfecto, el desempate temporal y cómo cambia un benchmark cuando se queda sin techo.

MIR 2026BenchmarkGemini 3.1
Leer más
ALMA y MIRI obtienen la nota máxima posible en el examen MIR 2026 con un 100% de acierto
11 de febrero de 202627 min de lectura

ALMA y MIRI obtienen la nota máxima posible en el examen MIR 2026 con un 100% de acierto

Dos modelos de IA médica desarrollados en España logran resultados sin precedentes. ALMA acierta las 600 preguntas de los tres últimos MIR sin un solo error — un 100% absoluto que ningún otro modelo ha conseguido. MIRI alcanza un 99,3% con un coste 13 veces inferior y respondiendo mucho más rápido. No son modelos generalistas: son arquitecturas RAG Agénticas con expertos especializados, construidas por BinPar y Editorial Médica Panamericana, que demuestran que el futuro de la IA médica no está en modelos más grandes, sino en modelos más inteligentes.

MIR 2026ALMAMIRI
Leer más
La Catedral y el Bazar: Open Source vs Propietario en el MIR 2026
9 de febrero de 202618 min de lectura

La Catedral y el Bazar: Open Source vs Propietario en el MIR 2026

Los 33 primeros puestos del ranking MIR 2026 son todos modelos propietarios. El mejor modelo abierto queda en el puesto 34. Analizamos el gap entre modelos abiertos y cerrados, la taxonomía real del open source en IA — donde muchos modelos que se proclaman abiertos son catedrales con las puertas entreabiertas — y por qué RAG supera al fine-tuning para personalizar IA médica sin perder el control de tus datos.

MIR 2026Open SourceOpen Weights
Leer más
La Navaja Suiza y el Bisturí: Por Qué los Mejores Modelos de Código Fracasan en el MIR
6 de febrero de 202616 min de lectura

La Navaja Suiza y el Bisturí: Por Qué los Mejores Modelos de Código Fracasan en el MIR

Claude Opus 4.6 y GPT-5.2-Codex son los modelos de IA más avanzados para programar, capaces de coordinar equipos de agentes y construirse parcialmente a sí mismos. Pero en el MIR 2026, un modelo Flash de 0,34 € los humilla. La navaja suiza de la programación no puede competir con el bisturí diseñado para cortar. Análisis de la paradoja agéntica con datos de 290 modelos que demuestra por qué la especialización supera a la potencia bruta en el ámbito médico.

MIR 2026Modelos AgénticosClaude Opus 4.6
Leer más
199 de 200: La IA Solo Falla Una en el MIR 2026
5 de febrero de 202618 min de lectura

199 de 200: La IA Solo Falla Una en el MIR 2026

Resultados definitivos del mayor benchmark de IA médica en español. Tres modelos empatan con 199 aciertos sobre 200 preguntas válidas — un 99,5% de precisión que ningún ser humano ha alcanzado jamás en la historia del MIR. Un modelo 'Flash' lidera por tercer año consecutivo, demostrando que más caro no significa mejor. Análisis exhaustivo de 290 modelos evaluados con datos de coste, velocidad, tokens y precisión que revela las tendencias que están transformando la inteligencia artificial médica.

MIR 2026BenchmarkGemini Flash
Leer más
MIR 2026: La Tormenta Perfecta
26 de enero de 202612 min de lectura

MIR 2026: La Tormenta Perfecta

Anatomía forense de una convocatoria de alto voltaje y el peligro silencioso del efecto techo. Un análisis técnico exhaustivo sobre cómo una gestión administrativa compleja y un examen técnicamente accesible han creado la convocatoria más volátil de la década. Diseccionamos los cuadernillos, las plantillas oficiales y los modelos psicométricos del MIR 2026 para revelar una paradoja peligrosa: notas infladas donde el margen de error es prácticamente inexistente.

MIR 2026AnálisisPsicometría
Leer más