MedicalBenchmark

Zehaztasun Medikoko AA

ALMA

BinPar-ek Editorial Médica Panamericana-ren eta Gida Kliniko Espainiarren edukiekin garatutako AA mediko sistema. RAG Agentikoa konbinatzen du erreferentziako corpus mediko batekin MIR azterketan zehaztasun perfektua lortzeko.

Egiaztatutako Emaitzak

ALMA MIR azterketaren hiru deialdi jarraitan ebaluatu da, MedicalBenchmark-ek egiaztatutako emaitza perfektuekin.

600/600

Erantzun zuzenak

MIR 2024, 2025 eta 2026ko baliozko galdera guztietatik

100%

Zehaztasun osoa

Akatsik gabe hiru deialdi jarraitan

3 urte

MIR jarraituak

Errendimendu perfektua mantendu 2024, 2025 eta 2026an

~$10.50

Azterketa bakoitzeko kostua

Deialdi osoaren batez besteko prozesatze-kostua

~53s

Galdera bakoitzeko

Batez besteko erantzun-denbora arrazonamendu osoa barne

~32

Aditu espezializatuak

Domeinu medikoko agenteak RAG Agentiko sisteman

99.8%

Konfiantza-tartea

Ebaluazio-sistemaren fidagarritasun estatistikoa

RAG Agentiko Arkitektura

ALMAk orkestradore adimendun bat erabiltzen du, galdera medikoei zehaztasun handienaz erantzuteko agente espezializatu anitz koordinatzen dituena. Ohiko RAG batekin alderatuta, sistemak iteratu eta balioztatu egiten du erantzun aurretik.

Kontsulta iteratiboa

Orkestradore-ak corpusean hainbat kontsulta-txanda egiten ditu, bilaketa finduz ebidentzia garrantzitsuena aurkitu arte.

Aditu espezializatuak

Gutxi gorabehera 32 domeinu-agentek MIReko espezialitate mediko guztiak estaltzen dituzte, kardiologiatik psikiatriara.

Corpus sintetikoa

Editorial Médica Panamericana-ren erreferentzia-bibliografiatik eraikitako ezagutza-basea, RAGrako prozesatu eta optimizatua.

Ingelesezko arrazonamendua

Sistemak barnean ingelesez arrazonatzen du oinarrizko modeloaren errendimendua maximizatzeko eta galderaren hizkuntzan erantzuten du.

Azpidelegazio adimenduna

Adituek azpikontsultak beste espezialista batzuei delegatu diezaiekete galdera batek espezialitate-mugak gurutzatzen dituenean, ezagutza-sare dinamikoak sortuz.

Laguntza multimodala

Irudi klinikoen prozesatzea (erradiografiak, EKGak, argazki dermatologikoak) aditu-agente bakoitzaren testuinguru espezializatuan.

Orkestradore zentrala Claude Sonnet 4.5 da arrazonamendu hedatuarekin, Amazon Bedrock-en Aragoiko eskualdean (Espainia) exekutatua.

Prozesatze-fluxua

MIR GalderaMIR
Orkestradore-aClaude Sonnet 4.5
Adituak~32 espezialista
Corpus MedikoaPanamericana
BaliozkotzeaIteratiboa
ErantzunaEgiaztatua

Arrazonamendu Eleaniztuneko Pipeline-a

Gaur egungo LLMek barneko irudikapen aberatsagoak dituzte ingelesez. ALMAk barneko arrazonamendua ingelesez behartzen du zehaztasuna maximizatzeko, beti galderaren jatorrizko hizkuntzan erantzunez.

ESGaldera gaztelaniaz
ES → ENBarneko itzulpena
ENArrazonamendua ingelesez
ENSintesia ingelesez
ESErantzuna gaztelaniaz

Nola Funtzionatzen Du

ALMAren prozesuak galdera mediko bati erantzuteko bost urratseko fluxu egituratua jarraitzen du.

1

Galderaren harrera

Orkestradore-ak MIR galdera jasotzen du bere erantzun-aukerekin eta testuinguru klinikoa aztertzen du.

2

Analisia eta planifikazioa

Espezialitate mediko garrantzitsuak identifikatzen dira eta aditu-agente egokiak hautatzen dira.

3

Corpusaren kontsulta

Hautatutako agenteek Panamericanaren corpus mediko sintetikoa kontsultatzen dute ebidentzia klinikoa lortzeko.

4

Iterazioa eta baliozkotzea

Orkestradore-ak bildutako ebidentzia ebaluatzen du eta, nahikoa ez bada, kontsulta-txanda gehigarriak abiarazten ditu.

5

Sintesia eta erantzuna

Ebidentzia arrazonamendu egituratuan sintetizatzen da eta laguntza kliniko handieneko erantzuna hautatzen da.

Berrikuntza Teknikoak

Arkitektura orokorretik haratago, ALMAk funtsezko berrikuntzak jasotzen ditu bere errendimendu bikainari laguntzen diotenak.

Corpus sintetiko optimizatua

Jatorrizko dokumentu medikoak pipeline baten bidez prozesatzen dira, informazio garrantzitsua ateratzen duena, erredundantzia ezabatzen duena, LLM eraginkortasunerako berregituratzen duena eta espezialitateen arteko gurutzatutako harremanekin aberasten duena.

Eguneratze inkrementala

Hizkuntza Modelo Errekurtsiboen (RLM) oinarritutako sistema, corpusa birsortu gabe eguneratzen duena, zati zaharkituak detektatuz eta informazio berria koherentzia mantenduz integratuz.

Memoria-zuhaitza azpidelegazioarekin

Orkestradore-ak testuinguru-zuhaitz bat mantentzen du, non adar bakoitza aditu bati dagokion. Azpikontsultek testuinguru garrantzitsua heredatzen dute tokenak bikoiztu gabe, kostua eta abiadura optimizatuz.

RAG Agentikoa vs Fine-tuning

Modeloaren pisuak modu estatikoan aldatzen dituen fine-tuning-arekin alderatuta, RAG Agentikoak informazio eguneratua dinamikoki kontsultatzen du, berrentrenamendurik gabeko hobekuntza etengabea ahalbidetuz.

Datuen Subiranotasuna

ALMA Europako osasun-arloko pribatutasun eta datuen subiranotasun-estandar altuenak betetzeko diseinatua dago.

EBko prozesatzea

Prozesatze guztia AWS Bedrock-en exekutatzen da Aragoiko eskualdean (Espainia), datuak inoiz EBtik irteten ez direla bermatuz.

Hornitzailearen sarbiderik gabe

Anthropic-ek ez du prozesatutako datuetarako sarbiderik. AWS Bedrock-ek modeloaren hornitzailearen isolamendu osoa bermatzen du.

GDPR betetze

Datuen Babes Orokorreko Erregelamendua eta Europako osasun-araudia betetzeko diseinatua.

AI Act-erako prest

Arriskua handiko sistemetarako Europako Adimen Artifizialaren Erregelamenduaren eskakizunekin lerrokatutako arkitektura.

ALMA gaur egun produkzioan dago CATSalut-en (Kataluniako Osasun Zerbitzua) osasun-profesionalei benetako ingurune klinikoetan lagunduz.

Esploratu ALMAren emaitzak

Kontsultatu ALMAren errendimendu zehatza MIR deialdi bakoitzean, edo jarri gurekin harremanetan informazio gehiagorako.