Dokumentation av gawarbati – slutrapportering

Gawarbati är ett säreget indoeuropeiskt språk, som talas av cirka 15 000 personer i det bergiga och delvis otillgängliga gränsområdet mellan norra Pakistan och nordöstra Afghanistan. Nu har vi dokumenterat språket – och börjat utforska det!

Gawarum: Området längs Kunarfloden där språket gawarbati talas.

Gawarum: Området längs Kunarfloden där språket gawarbati talas. Foto: Muhammad Ali Shah

Projektet Gawarbati – dokumentation av ett hotat språk i Hindukush har letts av professor Henrik Liljegren, tillsammans med ett svensk-pakistanskt team av totalt sju personer. De har gjort video- och ljudinspelningar om 22 timmar, fördelat på cirka 200 sessioner, med drygt 150 språkanvändare i regionen.

Det inspelade materialet representerar många olika ämnen, situationer, åldrar och yrkesgrupper. Här finns allt från folksagor, poesi och historiska berättelser till djupintervjuer, föreläsningar och gruppdiskussioner.

Allt detta har sedan, med hjälp av annoteringsverktyget ELAN, segmenterats och transkriberats ord för ord – både ljudenligt (med det så kallade IPA-alfabetet) och med det arabiskbaserade skriftspråk som nyligen har utvecklats för gawarbati. Därefter har allt översatts till engelska och urdu, som är det nationella språket i Pakistan. 

Språkbank till nytta för forskare – och för talarna själva

Henrik Liljegren, professor i lingvistik, vid besök i Pakistan.

Henrik Liljegren, professor vid institutionen för lingvistik, under sitt senaste besök i Pakistan. Foto: Privat

– En större del av materialet har vi bearbetat ytterligare med mjukvara som är speciellt utvecklad för ändamålet, berättar Henrik Liljegren. Detta har resulterat i en digital och sökbar språkbank och en lexikal databas som i dagsläget omfattar 7500 uppslag!

– Den här språkbanken kommer vi att utvidga med resterade insamlat material och förbättra ytterligare. På detta sätt kommer materialet att kunna studeras vidare under mycket lång tid framöver – och vara till nytta för såväl talarna själva som lingvister och andra forskare. 

Materialet kommer att kunna studeras vidare under mycket lång tid framöver

En av de pakistanska teammedlemmarna har dessutom digitaliserat en lokalt producerad ordbok, som omfattar mer än 20 000 uppslagsord. Den kommer att utgöra ett viktigt komplement till det korpusbaserade lexikonet efter en mer genomgripande systematisering och redigering.

– Genom projektet och den språkvetenskapliga analysen har vi fått en bättre förståelse för hur gawarbatis grammatik är uppbyggd och hur ordförrådet ser ut. För tillfället arbetar vi med en kommande textsamling och ett online-lexikon för gawarbati, säger Henrik Liljegren.

Projektet Gawarbati – dokumentation av ett hotat språk i Hindukush har pågått mellan 2021 och 2024. Det har genomförts i samverkan mellan Institutionen för lingvistik på Stockholms universitet och det Islamabad-baserade språkresurscentret Forum for Language Initiatives. Projektet har nu slutrapporterats till Vetenskapsrådet, som har finansierat det. 

Mer om Henrik Liljegren


Anastasia Panova, doktorand i lingvistik, Stockholms universitet, ger på sitt halvtidsseminarium..

Anastasia Panova ger sitt halvtidsseminarium om avhandlingsarbetet. Foto: Henrik Liljegren.

En avhandling och flera artiklar på gång

  • Anastasia Panova är doktorand vid Institutionen för lingvistik och engagerad inom projektet. Hon skriver en avhandling som innehåller en omfattande analys och beskrivning av alla väsentliga delar av det grammatiska systemet i gawarbati.
  • Inom kort publiceras också ett flertal vetenskapliga artiklar som presenterar forskningsrön som har att göra med gawarbatis ljudsystem och informationsstruktur.
  • Baserat på insamlat och analyserat material bidrar projektet – i form av presentationer, inlämnade manuskript och redan godkända publikationer – till en ökad insikt om gawarbatis relation till besläktade språk, framför allt andra indoariska språk i Hindukushregionen. 
  • Materialet visar också gawarbatis historiska utveckling, och dessutom vilka egenskaper som formats i kontakt med språkets närmaste grannar, eller under påverkan av nationellt eller regionalt dominerande språk. Gawarbati befinner sig i överlappningen mellan olika språkkontaktområden, och delar drag med vart och ett av dessa.

Senast uppdaterad: 2025-04-10

Sidansvarig: Institutionen för lingvistik