Korpusbaserade metoder, 7,5 hp

Om utbildningen

Kursen behandlar korpusbaserade metoder, dvs det storskaliga studiet av skriven text och av transkriberade (talade eller tecknade) yttranden. Moment: Data, metod och evidens i olika lingvistiska traditioner. Kvantitativa egenskaper i språket, frekvens, n-gram. Datainsamling för olika typer av korpusar (inklusive traditionella korpusar, monitorkorpusar och webbkorpusar) och modaliteter (text, tal, tecken). Representation av korpusar: XML. Översikt över datorlingvistiska metoder för automatisk segmentering och annotering av text, inklusive tokenisering, ordklasstaggning och syntaktisk analys. Sökning i korpusar: reguljära uttryck. Analys av innehåll i korpusar på basis av förekomster och samförekomster. Relationen mellan korpusmaterial och forskningsfrågor. Etik, upphovsrätt, licenser.

Om ämnet: Lingvistik

Lingvistik

Lingvistik är vetenskapen om det mänskliga språket och språken. Lingvister studerar språket som allmänt fenomen: hur språk (såväl talade som tecknade) är uppbyggda, hur de används, likheter och skillnader mellan olika språk, hur man förstår och själv producerar språk, hur barn tillägnar sig sitt modersmål, hur språk uppkommer, förändras eller försvinner, men också hur man kan omsätta dessa kunskaper till praktiska tillämpningar i allt från maskinöversättning till språkundervisning.

Lingvistik är ett mångfacetterat ämne vilket gör att problemställningarna kan angripas tvärvetenskapligt utifrån såväl humanistiska och beteendevetenskapliga som naturvetenskapliga perspektiv. Så finns till exempel lingvistisk forskning baserad på sociologi, psykologi, filosofi, kognition, pedagogik, matematik,

datalogi och medicin. Språket studeras ur olika infallsvinklar, som hur individen använder sitt eller sina språk i kommunikation med andra eller genom att bygga upp modeller och teorier om hur språk är uppbyggda för att bättre förstå människan som varelse.

En annan infallsvinkel är att studera formaliserade modeller som gör det möjligt att med dator bearbeta naturligt språk, från yttranden i dialog till stora textsamlingar, för att till exempel analysera, generera, filtrera eller översätta språk, eller söka information i stora språkliga datamängder. En annan är talspråksutveckling och språkens ljudkonstruktioner, där avancerade experimentella tekniker används för att studera talkommunikation ur akustiskt, artikulatoriskt och perceptuellt perspektiv.

ARBETSMARKNAD En examen i lingvistik gör dig inte omedelbart kvalificerad för ett specifikt yrke, men många använder sina lingvistikkunskaper inom en mängd olika områden, både på företag och myndigheter. Exempel på områden där lingvistikstudier är en viktig merit är Språkrådet, auktorisering av tolkar, språkliga utredningar, system för interaktion med maskiner (tänk Siri eller Cortana), maskinöversättning, förlagsvärlden och utbildningsområdet.

EXAMEN su.se/examen

Om intresseområdet: Språk

Språk öppnar dörrar till andra kulturer, till upplevelser, till affärskontakter och samarbeten mellan länder. Vid Stockholms universitet kan du läsa närmare 30 olika språk. Du kan även läsa mer teoretiska ämnen såsom lingvistik och tvåspråkighet.

Studier i språk kan leda in till en mängd olika yrken, alltifrån undervisning och forskning till arbete inom stadsförvaltning, industri, handel och turism.

Utbildningsansvarig institution

Institutionen för lingvistik