Forskningsprojekt Health Bank avidentifieringsverktyg och dess praktiska användning

Foto: Teerawut Masawat/Mostphotos.
Patientjournaler innehåller värdefull information om symptom, diagnoser, behandlingar och utfall, men i journaler finns också information som röjer patientens identitet.
Med hjälp av verktyg som kan hitta namn, adresser, telefonnummer, ålder och andra personuppgifter i fri text, kan de känsliga uppgifterna ersättas med pseudonymer eller surrogat. Denna avidentifiering gör att patientjournaler kan bli tillgängliga för forskare samt användas som träningsmaterial för maskininlärningsalgoritmer – utan att man riskerar att röja patienters identitet.
I det här forskningsprojektet testas HB Deid – ett avidentifierings- och pseudonymiseringsverktyg – på Region Stockholm. Syftet är att samla in krav som kan implementeras i framtida versioner av HB Deid.
HB Deid är ett verktyg som har tagits fram för att avidentifiera och pseudonymisera texter på svenska. Se hur det funkar
Projektet genomförs inom ramen för programmet Strategisk mobilitet, finansierat av Stiftelsen för strategisk forskning. Programmet går ut på att möjliggöra samarbeten mellan forskare från industrin och forskare från akademin.
Projektansvariga
Hercules DalianisVakili, T., Lamproudis, A., Henriksson, A och Dalianis, H. (2022)
”Downstream Task Performance of BERT Models Pre-Trained Using Automatically De-Identified Clinical Data” (inskickad)
Dalianis, H. och Berg, H. (2021) - ”HB Deid – HB De-identification tool demonstrator”