Utbildar framtidens talanger inom data science

DSV har tillsammans med Statistiska institutionen utvecklat ett nytt masterprogram som utbildar framtidens talanger inom data science.

Programmet tar ett nytt grepp och kombinerar de tre ämnena data science, statistik och beslutsanalys.

Ioanna Miliou, en av programkoordinatorerna och skaparna, berättar om inspirationen till kursernas utformning, uppbyggnad och tankarna bakom programmet.

Ioanna Miliou Foto: Carina Bergholm
Ioanna Miliou programkoordinator för Masterprogrammet i data science, statistik och beslutsanalys 120 hp.

– Vi vill skapa framtidens data scientist. Och inte på det sättet som gjorts tidigare. En bra data scientist behöver en robust bakgrund i statistisk, inte nödvändigtvis med komplex matematik, men en solid grund i statistiken. Studenterna kommer också att få kunskap om beslutsproblem och olika typer av riskanalyser och att lära sig hur man implementerar det i en företagsmiljö, säger Ioanna Miliou.

En bra data scientist behöver en robust bakgrund i statistisk

Samarbetet mellan institutionerna växte fram när lärarna såg luckor i det tidigare masterprogrammet i data science och beslutsanalys.

– Statistik är basen för maskininlärning och data mining-algoritmer idag. Därför är det bra att våra studenter får med sig den delen i sin masterexamen.

Kursupplägg

Programmets struktur består av de tre pelarna data science, statistik och beslutsanalys, med en tredjedel var av upplägget.

– Vi utformar innehållet i kurserna så att det ena fältet sammanlänkas med det andra. Det kommer att finnas en lärare som är specialist inom varje område men vi skapar ett flöde mellan kurserna. Vi kommer att gästföreläsa i varandras kurser och har liknande paradigm genom dem. Studenterna kommer att känna hur det håller ihop.

Praktisk erfarenhet

De flesta av kurserna kommer att innehålla både traditionella föreläsningar och laborationer. Vissa kurser kommer att ha projekt.

– Nästan hälften består av praktiska tester för att implementera det studenterna har lärt sig på föreläsningarna. Alla kurser i data science har en del med programmering. Allt studenterna lär sig på föreläsningarna kommer de att implementera i kod. Vi kommer att diskutera den teoretiska delen och ibland matematiken bakom den. Studenterna går sedan till labbet och arbetar med att ”få det att fungera" med verkliga data. Inom data science använder vi programmeringsspråket Python och i statistik R. De språken är väldigt lika varandra. Det är ingen svår övergång från det ena till det andra. Båda är väldigt intuitiva.

Allt studenterna lär sig på föreläsningarna kommer de att implementera i kod

Tillgänglighet för studenter med olika bakgrund

Programmet välkomnar också studenter som inte har så mycket programmeringskunskaper. Kurserna är utformade med gradvis ökande svårighetsgrad.

– Vi börjar med en kurs med grunderna i data science, med enkla programmeringsuppgifter och vi studerar teorin på en lägre nivå. Då är studenterna förberedda för data mining-kursen. Där kommer de att se samma typ av algoritmer och uppgifter men mer komplicerade. Under våren går vi in på djupinlärning med de mest komplexa algoritmerna. Detta gör det möjligt för alla studenter att följa den ökande svårighetsgraden.