MedicalBenchmark

IA Mèdica de Precisió

ALMA

Sistema d'IA mèdica desenvolupat per BinPar amb continguts d'Editorial Médica Panamericana i Guies Clíniques Espanyoles. Combina RAG Agèntic amb un corpus mèdic de referència per a aconseguir precisió perfecta en l'examen MIR.

Resultats Verificats

ALMA ha sigut avaluada en tres convocatòries consecutives de l'examen MIR amb resultats perfectes verificats per MedicalBenchmark.

600/600

Preguntes correctes

Sobre el total de preguntes vàlides en el MIR 2024, 2025 i 2026

100%

Precisió total

Sense cap error en tres convocatòries consecutives

3 anys

MIR consecutius

Rendiment perfecte sostingut en 2024, 2025 i 2026

~$10.50

Cost per examen

Cost mitjà de processament per convocatòria completa

~53s

Per pregunta

Temps mitjà de resposta incloent raonament complet

~32

Experts especialitzats

Agents de domini mèdic en el sistema RAG Agèntic

99.8%

Interval de confiança

Fiabilitat estadística del sistema d'avaluació

Arquitectura RAG Agèntic

ALMA utilitza un orquestrador intel·ligent que coordina múltiples agents especialitzats per a respondre preguntes mèdiques amb la màxima precisió. A diferència d'un RAG convencional, el sistema itera i valida abans de respondre.

Consulta iterativa

L'orquestrador realitza múltiples rondes de consulta al corpus, refinant la cerca fins a trobar l'evidència més rellevant.

Experts especialitzats

Aproximadament 32 agents de domini cobrixen totes les especialitats mèdiques del MIR, des de cardiologia fins a psiquiatria.

Corpus sintètic

Base de coneixement construïda a partir de la bibliografia de referència d'Editorial Médica Panamericana, processada i optimitzada per a RAG.

Raonament en anglès

El sistema raona internament en anglès per a maximitzar el rendiment del model base i respon en l'idioma de la pregunta.

Subdelegació intel·ligent

Els experts poden delegar subconsultes a altres especialistes quan una pregunta creua fronteres entre especialitats, creant xarxes dinàmiques de coneixement.

Suport multimodal

Processament d'imatges clíniques (radiografies, ECGs, fotografies dermatològiques) dins del context especialitzat de cada agent expert.

L'orquestrador central és Claude Sonnet 4.5 amb raonament estés, executat en Amazon Bedrock en la regió d'Aragó (Espanya).

Flux de Processament

Pregunta MIRMIR
OrquestradorClaude Sonnet 4.5
Experts~32 especialistes
Corpus MèdicPanamericana
ValidacióIterativa
RespostaVerificada

Pipeline de Raonament Multilingüe

Els LLMs actuals tenen representacions internes més riques en anglès. ALMA força el raonament intern en anglès per a maximitzar la precisió, responent sempre en l'idioma de la pregunta.

ESPregunta en espanyol
ES → ENTraducció interna
ENRaonament en anglès
ENSíntesi en anglès
ESResposta en espanyol

Com Funciona

El procés d'ALMA per a respondre una pregunta mèdica seguix un flux estructurat de cinc passos.

1

Recepció de la pregunta

L'orquestrador rep la pregunta MIR amb les seues opcions de resposta i analitza el context clínic.

2

Anàlisi i planificació

S'identifiquen les especialitats mèdiques rellevants i se seleccionen els agents experts apropiats.

3

Consulta al corpus

Els agents seleccionats consulten el corpus mèdic sintètic de Panamericana per a obtindre evidència clínica.

4

Iteració i validació

L'orquestrador avalua l'evidència recopilada i, si és insuficient, llança rondes addicionals de consulta.

5

Síntesi i resposta

Se sintetitza l'evidència en un raonament estructurat i se selecciona la resposta amb major suport clínic.

Innovacions Tècniques

Més enllà de l'arquitectura general, ALMA incorpora innovacions clau que contribuïxen al seu rendiment excepcional.

Corpus sintètic optimitzat

Els documents mèdics originals es processen mitjançant un pipeline que extreu informació rellevant, elimina redundància, reestructura per a eficiència LLM i enriquix amb relacions creuades entre especialitats.

Actualització incremental

Sistema basat en Models de Llenguatge Recursius (RLM) que actualitza el corpus sense reconstruir-lo, detectant fragments obsolets i integrant nova informació mantenint la coherència.

Arbre de memòria amb subdelegació

L'orquestrador manté un arbre de context on cada branca correspon a un expert. Les subconsultes hereten context rellevant sense duplicar tokens, optimitzant cost i velocitat.

RAG Agèntic vs Fine-tuning

A diferència del fine-tuning que modifica pesos del model de forma estàtica, el RAG Agèntic consulta informació actualitzada dinàmicament, permetent millora contínua sense reentrenament.

Sobirania de Dades

ALMA està dissenyada per a complir amb els més alts estàndards de privacitat i sobirania de dades en l'àmbit sanitari europeu.

Processament en la UE

Tot el processament s'executa en AWS Bedrock en la regió d'Aragó (Espanya), garantint que les dades mai ixen de la UE.

Sense accés del proveïdor

Anthropic no té accés a les dades processades. AWS Bedrock garantix aïllament complet del proveïdor del model.

Compliment GDPR

Dissenyat per a complir amb el Reglament General de Protecció de Dades i les normatives sanitàries europees.

Preparat per a l'AI Act

Arquitectura alineada amb els requisits del Reglament Europeu d'Intel·ligència Artificial per a sistemes d'alt risc.

ALMA està actualment en producció en CATSalut (Servei Català de la Salut) ajudant professionals de la salut en entorns clínics reals.

Explora els resultats d'ALMA

Consulta el rendiment detallat d'ALMA en cada convocatòria MIR, o contacta amb nosaltres per a més informació.