Stockholms universitet
Go to this page on our english site

Korpusbaserade metoder

Kursen behandlar det storskaliga studiet av skriven text och av transkriberade yttranden.

Kursen behandlar korpusbaserade metoder, det vill säga det storskaliga studiet av skriven text och av transkriberade (talade eller tecknade) yttranden. Kursen går igenom data, metod och evidens i olika lingvistiska traditioner liksom kvantitativa egenskaper i språket, frekvens och n-gram. Vidare behandlas datainsamling för olika typer av korpusar (traditionella korpusar, monitorkorpusar och webbkorpusar) och modaliteter (text, tal och tecken). Kursen ger också en översikt över datorlingvistiska metoder för automatisk segmentering och annotering av text, inklusive tokenisering, ordklasstaggning och syntaktisk analys. Relationen mellan korpusmaterial och forskningsfrågor liksom etik, upphovsrätt och licenser diskuteras också.

 • Kursupplägg

  Undervisning

  Undervisning ges i form av föreläsningar och laborationer.

  Examination

  Kursen examineras genom salstentamen och skriftliga laborationsrapporter. 

  Examinator

  Beata Megyesi

 • Schema

  Schema finns tillgängligt senast en månad före kursstart. Vi rekommenderar inte utskrift av scheman då vissa ändringar kan ske. Vid kursstart meddelar utbildningsansvarig institution var du hittar ditt schema under utbildningen.
 • Kurslitteratur

  Observera att kurslitteraturen kan ändras fram till två månader före kursstart.
 • Kursrapporter

 • Kontakt

  Välkommen att kontakta oss på studentexpeditionen. Fler kontaktuppgifter hittar du på våra utbildningssidor:

  Kontaktuppgifter för studentärenden

  Studentexpedition