Stockholms universitet logo, länk till startsida
Go to this page on our english site

Korpusbaserade metoder

Kursen behandlar det storskaliga studiet av skriven text och av transkriberade yttranden.

Kursen behandlar korpusbaserade metoder, det vill säga det storskaliga studiet av skriven text och av transkriberade (talade eller tecknade) yttranden. Kursen går igenom data, metod och evidens i olika lingvistiska traditioner liksom kvantitativa egenskaper i språket, frekvens och n-gram. Vidare behandlas datainsamling för olika typer av korpusar (traditionella korpusar, monitorkorpusar och webbkorpusar) och modaliteter (text, tal och tecken). Kursen ger också en översikt över datorlingvistiska metoder för automatisk segmentering och annotering av text, inklusive tokenisering, ordklasstaggning och syntaktisk analys. Relationen mellan korpusmaterial och forskningsfrågor liksom etik, upphovsrätt och licenser diskuteras också.

  • Kursupplägg

    Undervisning

    Undervisning ges i form av föreläsningar och laborationer.

    Examination

    Kursen examineras genom salstentamen och skriftliga laborationsrapporter. 

    Examinator

    Mats Wirén

  • Schema

    Schema finns tillgängligt senast en månad före kursstart. Vi rekommenderar inte utskrift av scheman då vissa ändringar kan ske. Vid kursstart meddelar utbildningsansvarig institution var du hittar ditt schema under utbildningen.
  • Kurslitteratur

    Observera att kurslitteraturen kan ändras fram till två månader före kursstart.
  • Kursrapporter

  • Kontakt

    Studentexpedition 

    Institutionen för lingvistiks studentexpedition finns i rum C 378 (hus C, plan 3).
    Vi har besöks- och telefontid följande dagar:
    Tisdag 9-10
    Onsdag 13-15
    Torsdag 9-11 och 13-16
    08-16 23 46
    exp@ling.su.se

    Studierektor

    Sofia Gustafson-Capková
    ma@ling.su.se
    08 16 34 88