Forskningsprojekt DataLEASH: Lärande och delning av data med säker persondatahantering
Med de stora datamängder som genereras i dag har den personliga integriteten blivit en het fråga. I detta projekt studerar vi hur man kan skapa säkra språk- och datamodeller med hjälp av maskininlärning – utan att röja personuppgifter.
Den pågående digitaliseringen har skapat stora mängder data, och områdena artificiell intelligens (AI) och maskininlärning har utvecklats kraftigt. Samtidigt har lagstiftning som GDPR skapat ett skydd för att personuppgifter inte ska sparas i onödan, och inte heller användas till annat än det ursprungliga syftet.
I projektet DataLeash utvecklar och testar vi maskininlärningsmodeller som säkerställer användningen av data utan att riskera att röja personers identitet. Deltagare i detta projekt är Stockholms universitet, KTH och RISE.
HB Deid är ett verktyg som har tagits fram för att avidentifiera och pseudonymisera texter på svenska.
Se hur HB Deid funkar
Tidigare medlemmar i detta projekt är Hanna Berg och Mila Grancharova.
Avnämare för projektet är Charlotte Dingertz, Stockholms stad, Sven-Åke Lööv, Region Stockholm, Henrik Löf, Karolinska universitetssjukhuset, Marina Santini, RISE, och Peter Lundberg, Linköpings universitetssjukhus.
Projektet finansieras av KTHs digitaliseringssatsning 2019 inom IT och mobil kommunikation (ICT TNG) genom regeringens strategiska forskningsområden (SFO) för att skapa världsledande forskning.
Projektmedlemmar
Projektansvariga
Hercules Dalianis
Professor
Uno Fors
Forskare
Medlemmar
Thomas Vakili
Doktorand
Martin Hansson
Amanuens