MedicalBenchmark

IA Médica de Precisión

ALMA

Sistema de IA médica desenvolvido por BinPar con contidos de Editorial Médica Panamericana e Guías Clínicas Españolas. Combina RAG Axéntico cun corpus médico de referencia para acadar precisión perfecta no exame MIR.

Resultados Verificados

ALMA foi avaliada en tres convocatorias consecutivas do exame MIR con resultados perfectos verificados por MedicalBenchmark.

600/600

Preguntas correctas

Sobre o total de preguntas válidas no MIR 2024, 2025 e 2026

100%

Precisión total

Sen ningún fallo en tres convocatorias consecutivas

3 anos

MIR consecutivos

Rendemento perfecto sostido en 2024, 2025 e 2026

~$10.50

Custo por exame

Custo medio de procesamento por convocatoria completa

~53s

Por pregunta

Tempo medio de resposta incluíndo razoamento completo

~32

Expertos especializados

Axentes de dominio médico no sistema RAG Axéntico

99.8%

Intervalo de confianza

Fiabilidade estatística do sistema de avaliación

Arquitectura RAG Axéntico

ALMA utiliza un orquestrador intelixente que coordina múltiples axentes especializados para responder preguntas médicas coa máxima precisión. A diferenza dun RAG convencional, o sistema itera e valida antes de responder.

Consulta iterativa

O orquestrador realiza múltiples roldas de consulta ao corpus, refinando a busca ata atopar a evidencia máis relevante.

Expertos especializados

Aproximadamente 32 axentes de dominio cobren todas as especialidades médicas do MIR, dende cardioloxía ata psiquiatría.

Corpus sintético

Base de coñecemento construída a partir da bibliografía de referencia de Editorial Médica Panamericana, procesada e optimizada para RAG.

Razoamento en inglés

O sistema razona internamente en inglés para maximizar o rendemento do modelo base e responde no idioma da pregunta.

Subdelegación intelixente

Os expertos poden delegar subconsultas a outros especialistas cando unha pregunta cruza fronteiras entre especialidades, creando redes dinámicas de coñecemento.

Soporte multimodal

Procesamento de imaxes clínicas (radiografías, ECGs, fotografías dermatolóxicas) dentro do contexto especializado de cada axente experto.

O orquestrador central é Claude Sonnet 4.5 con razoamento estendido, executado en Amazon Bedrock na rexión de Aragón (España).

Fluxo de Procesamento

Pregunta MIRMIR
OrquestradorClaude Sonnet 4.5
Expertos~32 especialistas
Corpus MédicoPanamericana
ValidaciónIterativa
RespostaVerificada

Pipeline de Razoamento Multilingüe

Os LLMs actuais teñen representacións internas máis ricas en inglés. ALMA forza o razoamento interno en inglés para maximizar a precisión, respondendo sempre no idioma da pregunta.

ESPregunta en español
ES → ENTradución interna
ENRazoamento en inglés
ENSíntese en inglés
ESResposta en español

Como Funciona

O proceso de ALMA para responder unha pregunta médica segue un fluxo estruturado de cinco pasos.

1

Recepción da pregunta

O orquestrador recibe a pregunta MIR coas súas opcións de resposta e analiza o contexto clínico.

2

Análise e planificación

Identifícanse as especialidades médicas relevantes e selecciónanse os axentes expertos apropiados.

3

Consulta ao corpus

Os axentes seleccionados consultan o corpus médico sintético de Panamericana para obter evidencia clínica.

4

Iteración e validación

O orquestrador avalía a evidencia recompilada e, se é insuficiente, lanza roldas adicionais de consulta.

5

Síntese e resposta

Sintetízase a evidencia nun razoamento estruturado e selecciónase a resposta con maior soporte clínico.

Innovacións Técnicas

Máis alá da arquitectura xeral, ALMA incorpora innovacións clave que contribúen ao seu rendemento excepcional.

Corpus sintético optimizado

Os documentos médicos orixinais procésanse mediante un pipeline que extrae información relevante, elimina redundancia, reestrutura para eficiencia LLM e enriquece con relacións cruzadas entre especialidades.

Actualización incremental

Sistema baseado en Modelos de Linguaxe Recursivos (RLM) que actualiza o corpus sen reconstruílo, detectando fragmentos obsoletos e integrando nova información mantendo a coherencia.

Árbore de memoria con subdelegación

O orquestrador mantén unha árbore de contexto onde cada rama corresponde a un experto. As subconsultas heredan contexto relevante sen duplicar tokens, optimizando custo e velocidade.

RAG Axéntico vs Fine-tuning

A diferenza do fine-tuning que modifica pesos do modelo de forma estática, o RAG Axéntico consulta información actualizada dinamicamente, permitindo mellora continua sen readestramento.

Soberanía de Datos

ALMA está deseñada para cumprir cos máis altos estándares de privacidade e soberanía de datos no ámbito sanitario europeo.

Procesamento na UE

Todo o procesamento execútase en AWS Bedrock na rexión de Aragón (España), garantindo que os datos nunca saen da UE.

Sen acceso do provedor

Anthropic non ten acceso aos datos procesados. AWS Bedrock garante illamento completo do provedor do modelo.

Cumprimento GDPR

Deseñado para cumprir co Regulamento Xeral de Protección de Datos e as normativas sanitarias europeas.

Preparado para o AI Act

Arquitectura aliñada cos requisitos do Regulamento Europeo de Intelixencia Artificial para sistemas de alto risco.

ALMA está actualmente en produción en CATSalut (Servizo Catalán de Saúde) axudando a profesionais da saúde en contornos clínicos reais.

Explora os resultados de ALMA

Consulta o rendemento detallado de ALMA en cada convocatoria MIR, ou contacta connosco para máis información.