Forskningsprojekt Health Bank avidentifieringsverktyg och dess praktiska användning
Syftet med detta projekt är att möjliggöra den praktiska användningen av avidentifiering av klinisk text på svenska. Avidentifieringsverktyget HB Deid ska testas inte bara i laboratoriemiljö på Stockholms universitet, utan även på textbaserade patientdata från Region Stockholm.
Patientjournaler innehåller värdefull information om symptom, diagnoser, behandlingar och utfall, men i journaler finns också information som röjer patientens identitet.
Med hjälp av verktyg som kan hitta namn, adresser, telefonnummer, ålder och andra personuppgifter i fri text, kan de känsliga uppgifterna ersättas med pseudonymer eller surrogat. Denna avidentifiering gör att patientjournaler kan bli tillgängliga för forskare samt användas som träningsmaterial för maskininlärningsalgoritmer – utan att man riskerar att röja patienters identitet.
I det här forskningsprojektet testas HB Deid – ett avidentifierings- och pseudonymiseringsverktyg – på Region Stockholm. Syftet är att samla in krav som kan implementeras i framtida versioner av HB Deid.
HB Deid är ett verktyg som har tagits fram för att avidentifiera och pseudonymisera texter på svenska. Se hur det funkar
Projektet genomförs inom ramen för programmet Strategisk mobilitet, finansierat av Stiftelsen för strategisk forskning. Programmet går ut på att möjliggöra samarbeten mellan forskare från industrin och forskare från akademin.
Projektmedlemmar
Projektansvariga
Hercules Dalianis
Professor
Publikationer
Vakili, T., Lamproudis, A., Henriksson, A och Dalianis, H. (2022)
”Downstream Task Performance of BERT Models Pre-Trained Using Automatically De-Identified Clinical Data” (inskickad)