MedicalBenchmark

Blog

Artigos, novidades e análises sobre IA em medicina

188 Netas: Bianca Ciobanu Bate o Recorde do MIR — Mas a IA Já Vai nos 200
2 de março de 202611 min de leitura

188 Netas: Bianca Ciobanu Bate o Recorde do MIR — Mas a IA Já Vai nos 200

Bianca Ciobanu Selaru entra para a história com 188 netas, o melhor resultado humano alguma vez registado no MIR. 41 anos, origem romena, a prova de que a perseverança quebra moldes. Mas o recorde humano chega num momento singular: três modelos de IA já resolveram o exame completo — 200 de 200 — e quinze superam as 194 netas. Analisamos o que este duplo marco significa com dados, gráficos e contexto.

MIR 2026ResultadosIA vs Humanos
Ler mais
Duas Semanas Depois: 22 Modelos Novos e Triplo 200/200 no MIR 2026
20 de fevereiro de 202611 min de leitura

Duas Semanas Depois: 22 Modelos Novos e Triplo 200/200 no MIR 2026

De 5 a 20 de fevereiro de 2026 incorporámos 22 modelos novos ao benchmark. Em apenas 15 dias passámos de 99,5% para 100%: o Gemini 3.1 Pro Preview entra com 200/200, o Qwen3.5 397B A17B quebra o teto open-weights no ranking global e o MedGemma deixa uma lição desconfortável sobre o que significa, na prática, especialização em saúde. Storytelling técnico com novas gráficas sobre o empate perfeito, o desempate temporal e como muda um benchmark quando fica sem teto.

MIR 2026BenchmarkGemini 3.1
Ler mais
ALMA e MIRI obtêm a nota máxima possível no exame MIR 2026 com 100% de acerto
11 de fevereiro de 202627 min de leitura

ALMA e MIRI obtêm a nota máxima possível no exame MIR 2026 com 100% de acerto

Dois modelos de IA medica desenvolvidos em Espanha alcancam resultados sem precedentes. ALMA acerta as 600 perguntas dos tres ultimos MIR sem um unico erro — um 100% absoluto que nenhum outro modelo conseguiu. MIRI atinge 99,3% com um custo 13 vezes inferior e respondendo muito mais rapido. Nao sao modelos generalistas: sao arquiteturas RAG Agenticas com especialistas dedicados, construidas pela BinPar e Editorial Medica Panamericana, que demonstram que o futuro da IA medica nao esta em modelos maiores, mas em modelos mais inteligentes.

MIR 2026ALMAMIRI
Ler mais
A Catedral e o Bazar: Open Source vs Proprietário no MIR 2026
9 de fevereiro de 202618 min de leitura

A Catedral e o Bazar: Open Source vs Proprietário no MIR 2026

As 33 primeiras posições do ranking MIR 2026 são todas de modelos proprietários. O melhor modelo aberto fica na posição 34. Analisamos o gap entre modelos abertos e fechados, a taxonomia real do open source em IA — onde muitos modelos que se proclamam abertos são catedrais com as portas entreabertas — e porque é que RAG supera o fine-tuning para personalizar IA médica sem perder o controlo dos seus dados.

MIR 2026Open SourceOpen Weights
Ler mais
O Canivete Suíço e o Bisturi: Por Que os Melhores Modelos de Código Fracassam no MIR
6 de fevereiro de 202616 min de leitura

O Canivete Suíço e o Bisturi: Por Que os Melhores Modelos de Código Fracassam no MIR

Claude Opus 4.6 e GPT-5.2-Codex sao os modelos de IA mais avancados para programar, capazes de coordenar equipas de agentes e construir-se parcialmente a si mesmos. Mas no MIR 2026, um modelo Flash de 0,34 EUR humilha-os. O canivete suico da programacao nao pode competir com o bisturi concebido para cortar. Analise do paradoxo agentico com dados de 290 modelos que demonstra por que a especializacao supera a potencia bruta no ambito medico.

MIR 2026Modelos AgênticosClaude Opus 4.6
Ler mais
199 de 200: A IA Só Falha Numa no MIR 2026
5 de fevereiro de 202619 min de leitura

199 de 200: A IA Só Falha Numa no MIR 2026

Resultados definitivos do maior benchmark de IA médica em espanhol. Três modelos empatam com 199 acertos em 200 questões válidas — uma precisão de 99,5% que nenhum ser humano jamais alcançou na história do MIR. Um modelo 'Flash' lidera pelo terceiro ano consecutivo, provando que mais caro não significa melhor. Análise exaustiva de 290 modelos avaliados com dados de custo, velocidade, tokens e precisão que revela as tendências que estão a transformar a inteligência artificial médica.

MIR 2026BenchmarkGemini Flash
Ler mais
MIR 2026: A Tempestade Perfeita
26 de janeiro de 202611 min de leitura

MIR 2026: A Tempestade Perfeita

Anatomia forense de uma edição de alta voltagem e o perigo silencioso do efeito teto. Uma análise técnica exaustiva sobre como uma gestão administrativa complexa e um exame tecnicamente acessível criaram a edição mais volátil da década. Dissecamos os cadernos, os gabaritos oficiais e os modelos psicométricos do MIR 2026 para revelar um paradoxo perigoso: notas inflacionadas onde a margem de erro é praticamente inexistente.

MIR 2026AnálisePsicometria
Ler mais