Stockholms universitet

Forskningsprojekt Federated Health: Ett nordiskt hälsodatanätverk

Elektroniska journaler är fulla av viktig – men ostrukturerad – information, exempelvis kring patienters medicinska implantat eller tidigare biverkningar av mediciner. Här finns en innovationspotential. I detta projekt använder vi nordiska patientjournaler för att visa hur utmaningar inom sjukvården kan lösas.

Genrebild: En mängd olikfärgade tabletter i en persons hand.
Foto: Ksenia Yakovleva/Unsplash.

Data i form av ostrukturerad text bidrar med kontextuell information som inte finns någon annanstans i patientjournaler. Men den här typen av information är också svårast att använda och dela.

Att dela ostrukturerade data såsom klinisk text innebär betydande tekniska utmaningar eftersom texten innehåller personlig information och det är svårt att tillhandahålla integritetsgarantier. Dessutom har varje land hälsodata på det egna modersmålet. Det innebär speciella utmaningar för bearbetning av klinisk text med hjälp av datadrivna AI-algoritmer eftersom de kan läcka personlig information Därför måste texten avidentifieras och pseudonymiseras innan AI-modellerna konstrueras.

I detta projekt kommer ett federerat hälsodatanätverk att utvecklas, inriktat på sekundär användning av hälsodata. Projektet använder distribuerad maskininlärning, särskilt federerad inlärning, för att säkerställa datasekretess och ägande. Det federerade hälsodatanätverket kommer att byggas på integritetsbevarande och säker träning av flerspråkiga kliniska språkmodeller på norska, svenska, danska, finska och estniska. Dessutom innehåller lösningen en distribuerad ledger med smarta kontrakt och blockchainteknik, vilket ökar transparensen och säkerheten.

Två användningsfall kommer att visa innovationspotentialen hos ostrukturerade kliniska textdata: Upptäckt av medicinska implantat och upptäckt av biverkningar.

Projektet syftar till att främja området för vårddatadelning och -analys, låsa upp potentialen för ostrukturerade data i elektroniska journalsystem och möjliggöra innovativa framsteg inom hälso- och sjukvården samtidigt som integritet och säkerhet bibehålls.
 

Projektbeskrivning

Inför en undersökning med magnetresonanstomografi (MRI) är det viktigt att ha detaljerad modellkunskap om medicinska implantat som en enskild patient har. Annars kan de orsaka allvarlig skada, eller till och med dödsfall. Automatisk analys av klinisk text kan snabbare identifiera nya och allvarliga biverkningar.

I dag kräver processen att man läser igenom hela patientjournalen för att fastställa om patienten har ett medicinskt implantat och vilken modell.

Modellen som ska utvecklas i projektet kommer att kunna minska tiden för att hitta befintliga implantat och öka antalet enheter som kan detekteras.

Lösningen inkluderar en pipeline för hantering av klinisk text på flera nordiska språk, integritetsbevarande distribuerad träning med federerad inlärning och integration av en distribuerad ledger för ökad transparens och säkerhet.

Slutprodukten kommer att vara ett integritetsbevarande virtuellt datalager med olika användarnivåer för dataanalys och forskningsändamål. Implementeringen involverar utnyttjande av stora datauppsättningar från patientjournaler, befintliga verktyg för bearbetning av naturligt språk och en nationell infrastruktur för primärvård.

Projektet leds av Norwegian Centre for E-health Research, Tromsø, Norge i samarbete med följande partners:

  • University of Turku, Finland
  • Stockholms universitet, Sverige
  • Region Östergötland/Linköpings universitetssjukhus, Sverige
  • DNV, Norge
  • University of Copenhagen, Danmark
  • University of Tartu, Estland
  • Omilon, Danmark
  • Cambio, Sverige

Projektmedlemmar

Projektansvariga

Hercules Dalianis

Professor

Institutionen för data- och systemvetenskap
Hercules Dalianis

Medlemmar

Thomas Vakili

Doktorand

Institutionen för data- och systemvetenskap
Thomas_Vakili_2022

Tyr Hullmann

Projektassistent

Institutionen för data- och systemvetenskap
Tyr Hullman. Foto: Privat.

Publikationer

Lamproudis, A., Dalianis, H. et al (2023):

”De-identifying Norwegian Clinical Text using Resources from Swedish and Danish”. To appear in the Proceedings of AMIA 2023, Annual Symposium, November 11-15. New Orleans, LA, USA.