Korpusbaserade metoder

Den här kursen behandlar det storskaliga studiet av skriven text och yttranden som överförts – transkriberats – från tal till skrift.

Kursen behandlar korpusbaserade metoder, det vill säga det storskaliga studiet av skriven text och av transkriberade, talade eller tecknade, yttranden.

Kursen går igenom data, metod och evidens i olika lingvistiska traditioner, liksom kvantitativa egenskaper i språket – till exempel frekvens och n-gram.

Kursen ger en översikt över datorlingvistiska metoder för automatisk uppdelning (segmentering) och uppmärkning (annotering) av text, till exempel för ordklass och syntaktisk analys. Relationen mellan korpusmaterial och forskningsfrågor liksom etik, upphovsrätt och licenser diskuteras också.



Undervisning

Undervisning ges i form av föreläsningar och laborationer.


Examination

Kursen examineras genom salstentamen och skriftliga laborationsrapporter. 

Examinator

Schema finns tillgängligt senast en månad före kursstart. Vi rekommenderar inte utskrift av scheman då vissa ändringar kan ske. Vid kursstart meddelar utbildningsansvarig institution var du hittar ditt schema under utbildningen.


Observera att kurslitteraturen kan ändras fram till två månader före kursstart.


Kursrapporter visas för de tre senaste kurstillfällena.







Välkommen att kontakta oss på studentexpeditionen!