MedicalBenchmark

IA Mèdica de Precisió

ALMA

Sistema d'IA mèdica desenvolupat per BinPar amb continguts d'Editorial Médica Panamericana i Guies Clíniques Espanyoles. Combina RAG Agèntic amb un corpus mèdic de referència per assolir una precisió perfecta a l'examen MIR.

Resultats Verificats

ALMA ha estat avaluada en tres convocatòries consecutives de l'examen MIR amb resultats perfectes verificats per MedicalBenchmark.

600/600

Preguntes correctes

Sobre el total de preguntes vàlides al MIR 2024, 2025 i 2026

100%

Precisió total

Sense cap error en tres convocatòries consecutives

3 anys

MIR consecutius

Rendiment perfecte sostingut el 2024, 2025 i 2026

~$10.50

Cost per examen

Cost mitjà de processament per convocatòria completa

~53s

Per pregunta

Temps mitjà de resposta incloent raonament complet

~32

Experts especialitzats

Agents de domini mèdic al sistema RAG Agèntic

99.8%

Interval de confiança

Fiabilitat estadística del sistema d'avaluació

Arquitectura RAG Agèntic

ALMA utilitza un orquestrador intel·ligent que coordina múltiples agents especialitzats per respondre preguntes mèdiques amb la màxima precisió. A diferència d'un RAG convencional, el sistema itera i valida abans de respondre.

Consulta iterativa

L'orquestrador realitza múltiples rondes de consulta al corpus, refinant la cerca fins a trobar l'evidència més rellevant.

Experts especialitzats

Aproximadament 32 agents de domini cobreixen totes les especialitats mèdiques del MIR, des de cardiologia fins a psiquiatria.

Corpus sintètic

Base de coneixement construïda a partir de la bibliografia de referència d'Editorial Médica Panamericana, processada i optimitzada per a RAG.

Raonament en anglès

El sistema raona internament en anglès per maximitzar el rendiment del model base i respon en l'idioma de la pregunta.

Subdelegació intel·ligent

Els experts poden delegar subconsultes a altres especialistes quan una pregunta creua fronteres entre especialitats, creant xarxes dinàmiques de coneixement.

Suport multimodal

Processament d'imatges clíniques (radiografies, ECGs, fotografies dermatològiques) dins del context especialitzat de cada agent expert.

L'orquestrador central és Claude Sonnet 4.5 amb raonament estès, executat a Amazon Bedrock a la regió d'Aragó (Espanya).

Flux de Processament

Pregunta MIRMIR
OrquestradorClaude Sonnet 4.5
Experts~32 especialistes
Corpus MèdicPanamericana
ValidacióIterativa
RespostaVerificada

Pipeline de Raonament Multilingüe

Els LLMs actuals tenen representacions internes més riques en anglès. ALMA força el raonament intern en anglès per maximitzar la precisió, responent sempre en l'idioma de la pregunta.

ESPregunta en espanyol
ES → ENTraducció interna
ENRaonament en anglès
ENSíntesi en anglès
ESResposta en espanyol

Com Funciona

El procés d'ALMA per respondre una pregunta mèdica segueix un flux estructurat de cinc passos.

1

Recepció de la pregunta

L'orquestrador rep la pregunta MIR amb les seves opcions de resposta i analitza el context clínic.

2

Anàlisi i planificació

S'identifiquen les especialitats mèdiques rellevants i se seleccionen els agents experts apropiats.

3

Consulta al corpus

Els agents seleccionats consulten el corpus mèdic sintètic de Panamericana per obtenir evidència clínica.

4

Iteració i validació

L'orquestrador avalua l'evidència recopilada i, si és insuficient, llança rondes addicionals de consulta.

5

Síntesi i resposta

Se sintetitza l'evidència en un raonament estructurat i se selecciona la resposta amb major suport clínic.

Innovacions Tècniques

Més enllà de l'arquitectura general, ALMA incorpora innovacions clau que contribueixen al seu rendiment excepcional.

Corpus sintètic optimitzat

Els documents mèdics originals es processen mitjançant un pipeline que extreu informació rellevant, elimina redundància, reestructura per a eficiència LLM i enriqueix amb relacions creuades entre especialitats.

Actualització incremental

Sistema basat en Models de Llenguatge Recursius (RLM) que actualitza el corpus sense reconstruir-lo, detectant fragments obsolets i integrant nova informació mantenint la coherència.

Arbre de memòria amb subdelegació

L'orquestrador manté un arbre de context on cada branca correspon a un expert. Les subconsultes hereten context rellevant sense duplicar tokens, optimitzant cost i velocitat.

RAG Agèntic vs Fine-tuning

A diferència del fine-tuning que modifica pesos del model de forma estàtica, el RAG Agèntic consulta informació actualitzada dinàmicament, permetent millora contínua sense reentrenament.

Sobirania de Dades

ALMA està dissenyada per complir amb els més alts estàndards de privacitat i sobirania de dades en l'àmbit sanitari europeu.

Processament a la UE

Tot el processament s'executa a AWS Bedrock a la regió d'Aragó (Espanya), garantint que les dades mai surten de la UE.

Sense accés del proveïdor

Anthropic no té accés a les dades processades. AWS Bedrock garanteix aïllament complet del proveïdor del model.

Compliment GDPR

Dissenyat per complir amb el Reglament General de Protecció de Dades i les normatives sanitàries europees.

Preparat per a l'AI Act

Arquitectura alineada amb els requisits del Reglament Europeu d'Intel·ligència Artificial per a sistemes d'alt risc.

ALMA està actualment en producció a CATSalut (Servei Català de la Salut) ajudant professionals de la salut en entorns clínics reals.

Explora els resultats d'ALMA

Consulta el rendiment detallat d'ALMA a cada convocatòria MIR, o contacta amb nosaltres per a més informació.