This page in English

Forskningsprojekt Federated Health: Ett nordiskt hälsodatanätverk

Elektroniska journaler är fulla av viktig – men ostrukturerad – information, exempelvis kring patienters medicinska implantat eller tidigare biverkningar av mediciner. Här finns en innovationspotential. I detta projekt använder vi nordiska patientjournaler för att visa hur utmaningar inom sjukvården kan lösas.

This page in English

Tema

Kontaktperson på SU

Hercules Dalianis

Professor

Institutionen för data- och systemvetenskap

08-16 16 16

hercules@dsv.su.se

Översikt

Projektperiod

2023-04-01 - 2025-11-01

Ansvarig

Institutionen för data- och systemvetenskap

Forskningsämne

AI och data science Språkteknologi

Status

Avslutad

Finansiering

Nordic Innovation

Forskargrupp

Natural Language Processing Research Group

Natural Language Processing Research Group utvecklar, tillämpar och utvärderar metoder för att bearbeta, modellera och analysera text, i synnerhet involverande stora språkmodeller. Vi utforskar tillämpningar inom olika domäner och fokuserar på frågor som integritet, förklarbarhet och domänanpassning.

Förstoring av HPV-16, en högrisktyp för cancer.

Genrebild: En mängd olikfärgade tabletter i en persons hand.

Foto: Ksenia Yakovleva/Unsplash.

Data i form av ostrukturerad text bidrar med kontextuell information som inte finns någon annanstans i patientjournaler. Men den här typen av information är också svårast att använda och dela.

Att dela ostrukturerade data såsom klinisk text innebär betydande tekniska utmaningar eftersom texten innehåller personlig information och det är svårt att tillhandahålla integritetsgarantier. Dessutom har varje land hälsodata på det egna modersmålet. Det innebär speciella utmaningar för bearbetning av klinisk text med hjälp av datadrivna AI-algoritmer eftersom de kan läcka personlig information Därför måste texten avidentifieras och pseudonymiseras innan AI-modellerna konstrueras.

I detta projekt kommer ett federerat hälsodatanätverk att utvecklas, inriktat på sekundär användning av hälsodata. Projektet använder distribuerad maskininlärning, särskilt federerad inlärning, för att säkerställa datasekretess och ägande. Det federerade hälsodatanätverket kommer att byggas på integritetsbevarande och säker träning av flerspråkiga kliniska språkmodeller på norska, svenska, danska, finska och estniska. Dessutom innehåller lösningen en distribuerad ledger med smarta kontrakt och blockchainteknik, vilket ökar transparensen och säkerheten.

Två användningsfall kommer att visa innovationspotentialen hos ostrukturerade kliniska textdata: Upptäckt av medicinska implantat och upptäckt av biverkningar.

Projektet syftar till att främja området för vårddatadelning och -analys, låsa upp potentialen för ostrukturerade data i elektroniska journalsystem och möjliggöra innovativa framsteg inom hälso- och sjukvården samtidigt som integritet och säkerhet bibehålls.

Projektbeskrivning

Inför en undersökning med magnetresonanstomografi (MRI) är det viktigt att ha detaljerad modellkunskap om medicinska implantat som en enskild patient har. Annars kan de orsaka allvarlig skada, eller till och med dödsfall. Automatisk analys av klinisk text kan snabbare identifiera nya och allvarliga biverkningar.

I dag kräver processen att man läser igenom hela patientjournalen för att fastställa om patienten har ett medicinskt implantat och vilken modell.

Modellen som ska utvecklas i projektet kommer att kunna minska tiden för att hitta befintliga implantat och öka antalet enheter som kan detekteras.

Lösningen inkluderar en pipeline för hantering av klinisk text på flera nordiska språk, integritetsbevarande distribuerad träning med federerad inlärning och integration av en distribuerad ledger för ökad transparens och säkerhet.

Slutprodukten kommer att vara ett integritetsbevarande virtuellt datalager med olika användarnivåer för dataanalys och forskningsändamål. Implementeringen involverar utnyttjande av stora datauppsättningar från patientjournaler, befintliga verktyg för bearbetning av naturligt språk och en nationell infrastruktur för primärvård.

Projektet leds av Norwegian Centre for E-health Research, Tromsø, Norge i samarbete med följande partners:

University of Turku, Finland
Stockholms universitet, Sverige
Region Östergötland/Linköpings universitetssjukhus, Sverige
DNV, Norge
University of Copenhagen, Danmark
University of Tartu, Estland
Omilon, Danmark
Cambio, Sverige

Projektmedlemmar

Projektansvariga

Hercules Dalianis

Professor

Institutionen för data- och systemvetenskap

08-16 16 16

hercules@dsv.su.se

Medlemmar

Thomas Vakili

Doktorand

Institutionen för data- och systemvetenskap

08-16 16 59

thomas.vakili@dsv.su.se

Martin Hansson

Amanuens

Institutionen för data- och systemvetenskap

martin.hansson@dsv.su.se

Tyr Hullmann

Projektassistent (alumn)

Institutionen för data- och systemvetenskap

Publikationer

Chomutare, T., Hansson, M., Dalianis, H. et al (2025):

Implementing a Nordic-Baltic Federated Health Data Network: A Case Report. In the Proceedings of the 20th World Congress on Medical and Health Informatics, MedInfo2025, 9-13 August. Taipei, Taiwan.

Lamproudis, A., Dalianis, H. et al (2023):

De-identifying Norwegian Clinical Text using Resources from Swedish and Danish. Proceedings of AMIA 2023, Annual Symposium, November 11-15. New Orleans, LA, USA.