Korpusbaserade metoder, 7,5 hp

Om kursen

Kursen behandlar korpusbaserade metoder, dvs det storskaliga studiet av skriven text och av transkriberade (talade eller tecknade) yttranden. Moment: Data, metod och evidens i olika lingvistiska traditioner. Kvantitativa egenskaper i språket, frekvens, n-gram. Datainsamling för olika typer av korpusar (inklusive traditionella korpusar, monitorkorpusar och webbkorpusar) och modaliteter (text, tal, tecken). Representation av korpusar: XML. Översikt över datorlingvistiska metoder för automatisk segmentering och annotering av text, inklusive tokenisering, ordklasstaggning och syntaktisk analys. Sökning i korpusar: reguljära uttryck. Analys av innehåll i korpusar på basis av förekomster och samförekomster. Relationen mellan korpusmaterial och forskningsfrågor. Etik, upphovsrätt, licenser.

Vet du vad du vill läsa?

Sök bland kurser och program

Vad finns att läsa på SU?

Alla våra ämnen