Stockholms universitet

Forskningsprojekt DataLEASH: Lärande och delning av data med säker persondatahantering

Med de stora datamängder som genereras i dag har den personliga integriteten blivit en het fråga. I detta projekt studerar vi hur man kan skapa säkra språk- och datamodeller med hjälp av maskininlärning – utan att röja personuppgifter.

Genrebild: Flerfärgad text på datorskärm. Foto: Shahadat Rahman/Unsplash.
Foto: Shahadat Rahman/Unsplash.

Den pågående digitaliseringen har skapat stora mängder data, och områdena artificiell intelligens (AI) och maskininlärning har utvecklats kraftigt. Samtidigt har lagstiftning som GDPR skapat ett skydd för att personuppgifter inte ska sparas i onödan, och inte heller användas till annat än det ursprungliga syftet.

I projektet DataLeash utvecklar och testar vi maskininlärningsmodeller som säkerställer användningen av data utan att riskera att röja personers identitet. Deltagare i detta projekt är Stockholms universitet, KTH och RISE.

HB Deid är ett verktyg som har tagits fram för att avidentifiera och pseudonymisera texter på svenska.
Se hur HB Deid funkar

Tidigare medlemmar i detta projekt är Hanna Berg och Mila Grancharova. 

Avnämare för projektet är Charlotte Dingertz, Stockholms stad, Sven-Åke Lööv, Region Stockholm, Henrik Löf, Karolinska universitetssjukhuset, Marina Santini, RISE, och Peter Lundberg, Linköpings universitetssjukhus.

Projektet finansieras av KTHs digitaliseringssatsning 2019 inom IT och mobil kommunikation (ICT TNG) genom regeringens strategiska forskningsområden (SFO) för att skapa världsledande forskning.

Projektmedlemmar

Projektansvariga

Hercules Dalianis

Professor

Institutionen för data- och systemvetenskap
Hercules Dalianis

Uno Fors

Forskare

Institutionen för data- och systemvetenskap

Medlemmar

Thomas Vakili

Doktorand

Institutionen för data- och systemvetenskap
Thomas_Vakili_2022

Publikationer