MedicalBenchmark

IA Mèdica de Precisió

ALMA

Sistema d'IA mèdica desenvolupat per BinPar amb continguts d'Editorial Mèdica Panamericana i Guies Clíniques Espanyoles. Combina RAG Agèntic amb un corpus mèdic de referència per assolir una precisió perfecta a s'examen MIR.

Resultats Verificats

ALMA ha estat avaluada en tres convocatòries consecutives de s'examen MIR amb resultats perfectes verificats per MedicalBenchmark.

600/600

Preguntes correctes

Sobre es total de preguntes vàlides an es MIR 2024, 2025 i 2026

100%

Precisió total

Sense cap error en tres convocatòries consecutives

3 anys

MIR consecutius

Rendiment perfecte sostingut en 2024, 2025 i 2026

~$10.50

Cost per examen

Cost mitjà de processament per convocatòria completa

~53s

Per pregunta

Temps mitjà de resposta incloent raonament complet

~32

Experts especialitzats

Agents de domini mèdic an es sistema RAG Agèntic

99.8%

Interval de confiança

Fiabilitat estadística des sistema d'avaluació

Arquitectura RAG Agèntic

ALMA utilitza un orquestrador intel·ligent que coordina múltiples agents especialitzats per respondre preguntes mèdiques amb sa màxima precisió. A diferència d'un RAG convencional, es sistema itera i valida abans de respondre.

Consulta iterativa

S'orquestrador realitza múltiples rondes de consulta an es corpus, refinant sa cerca fins a trobar s'evidència més rellevant.

Experts especialitzats

Aproximadament 32 agents de domini cobreixen totes ses especialitats mèdiques des MIR, des de cardiologia fins a psiquiatria.

Corpus sintètic

Base de coneixement construïda a partir de sa bibliografia de referència d'Editorial Médica Panamericana, processada i optimitzada per a RAG.

Raonament en anglès

Es sistema raona internament en anglès per maximitzar es rendiment des model base i respon en s'idioma de sa pregunta.

Subdelegació intel·ligent

Es experts poden delegar subconsultes a altres especialistes quan una pregunta creua fronteres entre especialitats, creant xarxes dinàmiques de coneixement.

Suport multimodal

Processament d'imatges clíniques (radiografies, ECGs, fotografies dermatològiques) dins des context especialitzat de cada agent expert.

S'orquestrador central és Claude Sonnet 4.5 amb raonament estès, executat a Amazon Bedrock a sa regió d'Aragó (Espanya).

Flux de Processament

Pregunta MIRMIR
OrquestradorClaude Sonnet 4.5
Experts~32 especialistes
Corpus MèdicPanamericana
ValidacióIterativa
RespostaVerificada

Pipeline de Raonament Multilingüe

Es LLMs actuals tenen representacions internes més riques en anglès. ALMA força es raonament intern en anglès per maximitzar sa precisió, responent sempre en s'idioma de sa pregunta.

ESPregunta en espanyol
ES → ENTraducció interna
ENRaonament en anglès
ENSíntesi en anglès
ESResposta en espanyol

Com Funciona

Es procés d'ALMA per respondre una pregunta mèdica segueix un flux estructurat de cinc passos.

1

Recepció de sa pregunta

S'orquestrador rep sa pregunta MIR amb ses seves opcions de resposta i analitza es context clínic.

2

Anàlisi i planificació

S'identifiquen ses especialitats mèdiques rellevants i se seleccionen es agents experts apropiats.

3

Consulta an es corpus

Es agents seleccionats consulten es corpus mèdic sintètic de Panamericana per obtenir evidència clínica.

4

Iteració i validació

S'orquestrador avalua s'evidència recopilada i, si és insuficient, llança rondes addicionals de consulta.

5

Síntesi i resposta

Se sintetitza s'evidència en un raonament estructurat i se selecciona sa resposta amb major suport clínic.

Innovacions Tècniques

Més enllà de s'arquitectura general, ALMA incorpora innovacions clau que contribueixen an es seu rendiment excepcional.

Corpus sintètic optimitzat

Es documents mèdics originals se processen mitjançant un pipeline que extreu informació rellevant, elimina redundància, reestructura per a eficiència LLM i enriqueix amb relacions creuades entre especialitats.

Actualització incremental

Sistema basat en Models de Llenguatge Recursius (RLM) que actualitza es corpus sense reconstruir-lo, detectant fragments obsolets i integrant nova informació mantenint sa coherència.

Arbre de memòria amb subdelegació

S'orquestrador manté un arbre de context on cada branca correspon a un expert. Ses subconsultes hereten context rellevant sense duplicar tokens, optimitzant cost i velocitat.

RAG Agèntic vs Fine-tuning

A diferència des fine-tuning que modifica pesos des model de forma estàtica, es RAG Agèntic consulta informació actualitzada dinàmicament, permetent millora contínua sense reentrenament.

Sobirania de Dades

ALMA està dissenyada per complir amb es més alts estàndards de privacitat i sobirania de dades en s'àmbit sanitari europeu.

Processament a sa UE

Tot es processament s'executa a AWS Bedrock a sa regió d'Aragó (Espanya), garantint que ses dades mai surten de sa UE.

Sense accés des proveïdor

Anthropic no té accés a ses dades processades. AWS Bedrock garanteix aïllament complet des proveïdor des model.

Compliment GDPR

Dissenyat per complir amb es Reglament General de Protecció de Dades i ses normatives sanitàries europees.

Preparat per a s'AI Act

Arquitectura alineada amb es requisits des Reglament Europeu d'Intel·ligència Artificial per a sistemes d'alt risc.

ALMA està actualment en producció a CATSalut (Servei Català de la Salut) ajudant professionals de sa salut en entorns clínics reals.

Explora es resultats d'ALMA

Consulta es rendiment detallat d'ALMA a cada convocatòria MIR, o contacta amb noltros per a més informació.