Lisa Kaati på Ivas 100-lista 2023

Hatescan – en maskininlärningsmodell som känner igen toxiskt språk på svenska – är ett av de mest intressanta forskningsprojekten i Sverige just nu. Det anser i alla fall Iva, som uppmärksammar projektet på den så kallade 100-listan.

Genrebild: en silhuett av en person framför en skärm med mönster.
Förtal och nedsättande tilltal kan förgifta samtalsklimatet på nätet. Foto: Su San Lee/Unsplash.

Forskaren bakom Hatescan är Lisa Kaati, universitetslektor på Institutionen för data- och systemvetenskap (DSV) vid Stockholms universitet. Vi fick en pratstund med henne.

 

Grattis Lisa! Hur känns det?

Porträttfoto: Lisa Kaati, Institutionen för data-och systemvetenskap (DSV), Stockholms universitet.
Lisa Kaati. Foto: Åse Karlén.

– Tack, det känns jätteroligt! Syftet med Ivas lista är ju att sätta ljuset på aktuell forskning med potential att påverka samhället. Därför känns det extra roligt att vår forskning lyfts fram där. Vi hoppas kunna bidra till att minska mängden toxiskt språk i kommunikation.

 

Hur funkar Hatescan?

– Hatescan är en maskininlärningsmodell som är tränad på att känna igen toxiskt språk på svenska. Hatescan har använts i ett flertal studier men också testats praktiskt på att känna igen toxiskt språk i chattar. Användningsområdena är många, exempelvis kan tekniken användas för moderering av kommentarsfält. Hatescan är också i bruk i appar för att uppmärksamma skribenter på att de kommentarer de skriver kan uppfattas som toxiska.

 

Det här är toxiskt språk

Begreppet toxiskt språk används för att beskriva kommunikation som förgiftar samtalsklimatet i sociala medier. I begreppet toxiskt språk ryms kommunikation som är förbjuden i lag (exempelvis hets mot folkgrupp och förtal) men också andra former av kränkningar som nedsättande tilltal, integritetskränkningar eller respektlöshet.

Källa: Lisa Kaati i ”Hot mot det demokratiska samtalet” (SKR, 2023)

 

Hur har ni utvecklat maskininlärningsmodellen?

– Jag har haft ett flertal studenter på DSV som utvärderat Hatescan. Vi har dels velat få en bättre förståelse för vad modellen klarar av, och dels uppmärksamma olika typer av partiskhet – så kallad bias.

– Under våren har jag dessutom handlett två masterstudenter, Arvin Moshfegh och Kevin Lindén, som har arbetat med att ta fram en modell för att känna igen hot på svenska. Det arbetet skulle kunna ses som ett komplement till Hatescan. Arvin och Kevin läser på vårt masterprogram i informationssäkerhet. Inom ramen för sitt masterarbete har de skapat ett dataset som består av syntetiskt genererade data, data från svenska sociala medier och översatta data. Datasetet har sedan använts för att träna upp en maskininlärningsmodell i att känna igen hot. Arvin och Kevin har testat modellen på svenska sociala medier och resultaten ser mycket lovande ut, säger Lisa Kaati.

 

Mer om Ivas 100-lista

Iva, Kungl. Ingenjörsvetenskapsakademien, listar varje år forskare vars idéer har potential att göra nytta i samhället. Syftet med Ivas 100-lista är att underlätta för företag och forskare att hitta varandra och tillsammans skapa nya innovationer och affärsmöjligheter.

Årets upplaga av listan presenterades 10 maj 2023. De 79 forskningsprojekten på listan är inriktade på klimatomställning, energiförsörjning, välfärdsteknologi, cybersäkerhet och krisberedskap.

Läs mer om Ivas 100-lista

Stockholms universitet har i år med fyra forskningsprojekt på listan, varav Lisa Kaatis är ett.

Läs mer om projekten

Kontakta Lisa Kaati

Läs mer om Lisa Kaatis forskning

Mer om Institutionen för data- och systemvetenskap (DSV)

Text: Åse Karlén