MedicalBenchmark

IA Médica de Precisão

ALMA

Sistema de IA médica desenvolvido por BinPar com conteúdos da Editorial Médica Panamericana e Guias Clínicas Espanholas. Combina RAG Agêntico com um corpus médico de referência para alcançar precisão perfeita no exame MIR.

Resultados Verificados

ALMA foi avaliada em três edições consecutivas do exame MIR com resultados perfeitos verificados pelo MedicalBenchmark.

600/600

Respostas corretas

Sobre o total de perguntas válidas no MIR 2024, 2025 e 2026

100%

Precisão total

Sem nenhum erro em três edições consecutivas

3 anos

MIR consecutivos

Desempenho perfeito sustentado em 2024, 2025 e 2026

~$10.50

Custo por exame

Custo médio de processamento por edição completa

~53s

Por pergunta

Tempo médio de resposta incluindo raciocínio completo

~32

Especialistas especializados

Agentes de domínio médico no sistema RAG Agêntico

99.8%

Intervalo de confiança

Fiabilidade estatística do sistema de avaliação

Arquitetura RAG Agêntico

ALMA utiliza um orquestrador inteligente que coordena múltiplos agentes especializados para responder perguntas médicas com a máxima precisão. Ao contrário de um RAG convencional, o sistema itera e valida antes de responder.

Consulta iterativa

O orquestrador realiza múltiplas rondas de consulta ao corpus, refinando a busca até encontrar a evidência mais relevante.

Especialistas especializados

Aproximadamente 32 agentes de domínio cobrem todas as especialidades médicas do MIR, de cardiologia a psiquiatria.

Corpus sintético

Base de conhecimento construída a partir da bibliografia de referência da Editorial Médica Panamericana, processada e otimizada para RAG.

Raciocínio em inglês

O sistema raciocina internamente em inglês para maximizar o desempenho do modelo base e responde no idioma da pergunta.

Subdelegação inteligente

Os especialistas podem delegar subconsultas a outros especialistas quando uma pergunta cruza fronteiras entre especialidades, criando redes dinâmicas de conhecimento.

Suporte multimodal

Processamento de imagens clínicas (radiografias, ECGs, fotografias dermatológicas) dentro do contexto especializado de cada agente especialista.

O orquestrador central é Claude Sonnet 4.5 com raciocínio estendido, executado no Amazon Bedrock na região de Aragão (Espanha).

Fluxo de Processamento

Pergunta MIRMIR
OrquestradorClaude Sonnet 4.5
Especialistas~32 especialistas
Corpus MédicoPanamericana
ValidaçãoIterativa
RespostaVerificada

Pipeline de Raciocínio Multilingue

Os LLMs atuais têm representações internas mais ricas em inglês. ALMA força o raciocínio interno em inglês para maximizar a precisão, respondendo sempre no idioma da pergunta.

ESPergunta em espanhol
ES → ENTradução interna
ENRaciocínio em inglês
ENSíntese em inglês
ESResposta em espanhol

Como Funciona

O processo de ALMA para responder uma pergunta médica segue um fluxo estruturado de cinco etapas.

1

Receção da pergunta

O orquestrador recebe a pergunta MIR com as suas opções de resposta e analisa o contexto clínico.

2

Análise e planeamento

Identificam-se as especialidades médicas relevantes e selecionam-se os agentes especialistas apropriados.

3

Consulta ao corpus

Os agentes selecionados consultam o corpus médico sintético da Panamericana para obter evidência clínica.

4

Iteração e validação

O orquestrador avalia a evidência recolhida e, se insuficiente, lança rondas adicionais de consulta.

5

Síntese e resposta

A evidência é sintetizada num raciocínio estruturado e seleciona-se a resposta com maior suporte clínico.

Inovações Técnicas

Para além da arquitetura geral, ALMA incorpora inovações-chave que contribuem para o seu desempenho excecional.

Corpus sintético otimizado

Os documentos médicos originais são processados através de um pipeline que extrai informação relevante, elimina redundância, reestrutura para eficiência LLM e enriquece com relações cruzadas entre especialidades.

Atualização incremental

Sistema baseado em Modelos de Linguagem Recursivos (RLM) que atualiza o corpus sem reconstruí-lo, detetando fragmentos obsoletos e integrando nova informação mantendo a coerência.

Árvore de memória com subdelegação

O orquestrador mantém uma árvore de contexto onde cada ramo corresponde a um especialista. As subconsultas herdam contexto relevante sem duplicar tokens, otimizando custo e velocidade.

RAG Agêntico vs Fine-tuning

Ao contrário do fine-tuning que modifica pesos do modelo de forma estática, o RAG Agêntico consulta informação atualizada dinamicamente, permitindo melhoria contínua sem retreinamento.

Soberania de Dados

ALMA está desenhada para cumprir com os mais altos padrões de privacidade e soberania de dados no setor sanitário europeu.

Processamento na UE

Todo o processamento é executado no AWS Bedrock na região de Aragão (Espanha), garantindo que os dados nunca saem da UE.

Sem acesso do fornecedor

A Anthropic não tem acesso aos dados processados. O AWS Bedrock garante isolamento completo do fornecedor do modelo.

Conformidade GDPR

Desenhado para cumprir com o Regulamento Geral de Proteção de Dados e as normativas sanitárias europeias.

Preparado para o AI Act

Arquitetura alinhada com os requisitos do Regulamento Europeu de Inteligência Artificial para sistemas de alto risco.

ALMA está atualmente em produção no CATSalut (Serviço Catalão de Saúde) ajudando profissionais de saúde em ambientes clínicos reais.

Explore os resultados de ALMA

Consulte o desempenho detalhado de ALMA em cada edição MIR, ou contacte-nos para mais informações.