Ny publikation ger en introduktion till Historisk kryptologi

I bibliotek och arkiv världen över finns tusentals historiska manuskript skrivna i hemlig kod. Texter som med hjälp av chiffer hållits hemliga för utomstående. Det är allt från diplomatisk korrespondens och underrättelserapporter, privata brev, dagböcker eller texter med anknytning till hemliga sällskap. Inom forskningsområdet Historisk kryptologi arbetar man med att hitta sätt för att avkoda dessa hemliga dokument. Hur det går till beskrivs i ett nyligen publicerat bokkapitel.

Handwitten signs, ink on paper
The Borg Cipher. Foto: Beata Megyesi

Beáta Megyesi är professor i datorlingvistik vid Institutionen för lingvistik och huvudansvarig forskare vid DECRYPT-projektet. Det är ett interdisciplinärt forskningsprojekt med representanter från alla de olika vetenskapsområden som behövs för att analysera chiffer: datorlingvister, datavetare, historiker, språkhistoriker, bildanalysexperter och kryptologer. Tillsammans med sina kollegor inom DECRYPT har Beáta skrivit kapitlet ”Historical Cryptology” i den nyligen publicerade boken Learning and Experiencing Cryptography with CrypTool and SageMath (Artech House, 2024). I kapitlet ges en introduktion till hur man analyserar historiska chiffer, från insamling och digitalisering till transkribering och dekryptering. Processen inkluderar även tolkning och kontextualisering av meddelandet satt i dess historiska sammanhang.

Ett utmanande källmaterial

De manuskript som studeras inom Historisk kryptologi, är oftast handskrivna källor.
– De finns i arkiv och bibliotek världen över, men de är ofta gömda utan någon form av indexering och är därför svåra att lokalisera, berättar Beáta Megyesi. När de väl hittats behöver de digitaliseras och omvandlas till ett maskinläsbart textformat innan de kan dechiffreras. Hon påpekar att det finns många svårigheter när man jobbar med historiska krypterade texter.

– Transkriptionen är en av de största utmaningarna då vi måste omvandla bilden till textformat. Det är tidsödande och ofta källor till fel. De består av många olika sorters symboler och ovanliga skriftsystem,  de kan ha svårlästa handstilar, skadade sidor. Och det underliggande språket använder gamla eller föråldrade språk. Beáta påpekar också att krypterade texter skiljer sig mycket åt i hur de är kodade, med olika tecken och symboler.

Det finns en stor mängd material med sällsynta eller okända skriftsystem från vår historia långt tillbaka i tiden, som väntar på analys och dechiffrering

– De vanligaste krypteringssätten historiskt sett var att byta ut bokstäver eller tecken enligt vissa principer där alfabetiska tecken, stavelser, ord, fraser eller meningar kunde få sina egna koder.

 

Nytt forskningsområde

Forskningsområdet Historisk kryptologi är nytt, och Beáta Megyesi menar att det finns mycket att utforska.

– Vi behöver samla in mer material för att kunna skapa bättre algoritmer som kan användas för att hjälpa till med transkription av olika symbolsystem, och vi behöver bättre analysmetoder anpassade till historiska varianter av världens tusentals språk.
Hittills har DECRYPT enbart fokuserat på europeiska chiffer från tidig modern tid.

Beáta MegyesiBeáta Megyesi, professor i datorlingvistik vid Institutionen för lingvistik. Foto: Privat.

Men det finns en stor mängd material med sällsynta eller okända skriftsystem från vår historia långt tillbaka i tiden, som väntar på analys och dechiffrering.

– Och för det behöver vi robusta verktyg som hjälper historiker, lingvister och forskare i att tolka dessa historiska källor, säger Beáta. Närmast på agendan står vidareutveckling av vårt transkriptionsverktyg som ska kopplas ihop med kryptoanalysverktyget så att de kan användas tillsammans och släppas på webben.

 

Här kan du läsa kapitlet Historical Cryptology

Läs mer om Beáta Megyesis forskning här

Här kan du läsa mer om DECRYPT-projektet

På DECRYPT:s webbsida hittar du också fler chiffer och de verktyg som har utvecklats inom projektet.