MedicalBenchmark

Blog

Artigos, novidades e análises sobre IA en medicina

188 Netas: Bianca Ciobanu Bate o Récord do MIR — Pero a IA Xa Vai por 200
2 de marzo de 202611 min de lectura

188 Netas: Bianca Ciobanu Bate o Récord do MIR — Pero a IA Xa Vai por 200

Bianca Ciobanu Selaru entra na historia con 188 netas, o mellor resultado humano xamais rexistrado no MIR. 41 anos, orixe romanesa, a proba de que a constancia rompe moldes. Pero o récord humano chega nun momento singular: tres modelos de IA xa resolveron o exame completo — 200 de 200 — e quince superan as 194 netas. Analizamos que significa este dobre fito con datos, gráficas e contexto.

MIR 2026ResultadosIA vs Humanos
Ler máis
Dúas Semanas Despois: 22 Modelos Novos e Triplo 200/200 no MIR 2026
20 de febreiro de 202610 min de lectura

Dúas Semanas Despois: 22 Modelos Novos e Triplo 200/200 no MIR 2026

Do 5 ao 20 de febreiro de 2026 incorporamos 22 modelos novos ao benchmark. En só 15 días pasamos do 99,5% ao 100%: Gemini 3.1 Pro Preview entra con 200/200, Qwen3.5 397B A17B rompe o teito open-weights no ránquing global e MedGemma deixa unha lección incómoda sobre o que significa realmente a especialización en saúde. Storytelling técnico con novas gráficas sobre o empate perfecto, o desempate temporal e como cambia un benchmark cando se queda sen teito.

MIR 2026BenchmarkGemini 3.1
Ler máis
ALMA e MIRI obteñen a nota máxima posible no exame MIR 2026 cun 100% de acerto
11 de febreiro de 202626 min de lectura

ALMA e MIRI obteñen a nota máxima posible no exame MIR 2026 cun 100% de acerto

Dous modelos de IA medica desenvolvidos en Espana logran resultados sen precedentes. ALMA acerta as 600 preguntas dos tres ultimos MIR sen un so erro — un 100% absoluto que ningun outro modelo logrou. MIRI acada un 99,3% cun custo 13 veces inferior e respondendo moito mais rapido. Non son modelos xeneralistas: son arquitecturas RAG Axenticas con expertos especializados, construidas por BinPar e Editorial Medica Panamericana, que demostran que o futuro da IA medica non esta en modelos mais grandes, senon en modelos mais intelixentes.

MIR 2026ALMAMIRI
Ler máis
A Catedral e o Bazar: Open Source vs Propietario no MIR 2026
9 de febreiro de 202618 min de lectura

A Catedral e o Bazar: Open Source vs Propietario no MIR 2026

Os 33 primeiros postos do ranking MIR 2026 son todos modelos propietarios. O mellor modelo aberto queda no posto 34. Analizamos o gap entre modelos abertos e pechados, a taxonomía real do open source en IA — onde moitos modelos que se proclaman abertos son catedrais coas portas entreabertas — e por que RAG supera ao fine-tuning para personalizar IA médica sen perder o control dos teus datos.

MIR 2026Open SourceOpen Weights
Ler máis
A Navalla Suíza e o Bisturí: Por Que os Mellores Modelos de Código Fracasan no MIR
6 de febreiro de 202616 min de lectura

A Navalla Suíza e o Bisturí: Por Que os Mellores Modelos de Código Fracasan no MIR

Claude Opus 4.6 e GPT-5.2-Codex son os modelos de IA mais avanzados para programar, capaces de coordinar equipos de axentes e construirse parcialmente a si mesmos. Pero no MIR 2026, un modelo Flash de 0,34 EUR humillaos. A navalla suiza da programacion non pode competir co bisturí deseñado para cortar. Analise da paradoxa axentica con datos de 290 modelos que demostra por que a especializacion supera a potencia bruta no ambito medico.

MIR 2026Modelos AxénticosClaude Opus 4.6
Ler máis
199 de 200: A IA Só Falla Unha no MIR 2026
5 de febreiro de 202619 min de lectura

199 de 200: A IA Só Falla Unha no MIR 2026

Resultados definitivos do maior benchmark de IA médica en español. Tres modelos empatan con 199 acertos sobre 200 preguntas válidas — un 99,5% de precisión que ningún ser humano acadou xamais na historia do MIR. Un modelo 'Flash' lidera por terceiro ano consecutivo, demostrando que mais caro non significa mellor. Análise exhaustiva de 290 modelos avaliados con datos de custo, velocidade, tokens e precisión que revela as tendencias que están a transformar a intelixencia artificial médica.

MIR 2026BenchmarkGemini Flash
Ler máis
MIR 2026: A Tormenta Perfecta
26 de xaneiro de 202611 min de lectura

MIR 2026: A Tormenta Perfecta

Anatomía forense dunha convocatoria de alto voltaxe e o perigo silencioso do efecto teito. Unha análise técnica exhaustiva sobre como unha xestión administrativa complexa e un exame tecnicamente accesible crearon a convocatoria máis volátil da década. Diseccionamos os caderniños, as plantillas oficiais e os modelos psicométricos do MIR 2026 para revelar unha paradoxa perigosa: notas infladas onde a marxe de erro é practicamente inexistente.

MIR 2026AnálisePsicometría
Ler máis