Sökbarhet, hittbarhet och metadata

Det är viktigt att andra kan söka och hitta forskningsdata som tillgängliggörs. Metadata är helt avgörande för att den information du vill dela kan hittas och användas av andra. Kort kan metadata beskrivas som strukturerad information som beskriver t.ex. forskningsdata eller andra publikationer, men också förklarar, kontextualiserar och gör dem sökbara. Det är därför viktigt att lägga tid på att fylla i fält för metadata när forskningsdata publiceras, för att informationen ska gå att hitta och återanvända.

Vilka olika slags metadata finns det?

  • Beskrivande: Information om innehåll och kontext, att användas för att kunna citera information på ett vetenskapligt sätt. Exempel på beskrivande metadata är: titel, författare, vetenskapligt ämnesområde, nyckelord, sammanfattningar av studien, metod etc.
  • Administrativa: Information som möjliggör kategorisering och korrekt hantering. Exempel på administrativa metadata är: filformat, rättigheter/licenser/copyright, bevarande etc.
  • Strukturella: För att kunna strukturera de två ovanstående kategorierna, behövs strukturella metadata. Exempel på detta är: beständig länkning (t.ex. DOI eller URN), hur olika tabeller relaterar till varandra, etc.

Poängen med metadata är att underlätta automatisk hantering och kategorisering av information, därför bör metadata som skapas följa någon av de standarder som finns. Till skillnad från dokumentation, som ska vara läsbar för en användare, är metadata alltså grund för hur system hanterar din information eller dina data.

Metadata kan användas till flera saker, som till exempel:

  • Att citera: för att skapa möjligheter till meritering och erkännande för den som har skapat innehållet.
  • Att återanvända: för att andra ska kunna bygga vidare på din forskning, behöver de lätt kunna förstå hur du har strukturerat din information. Det måste också finnas tillräckligt med metadata för att en annan forskare ska förstå t.ex. hur datainsamlingen har gått till och vad olika variabler betyder.
  • Att söka/hitta: för att andra ska kunna hitta informationen och verifiera att den är korrekt. Metadata behöver svara på frågorna: När? Var? Vad? Vem? Hur? ”Findable” (eller ”hittbar”) är en av grundpelarna i FAIR-principen.
  • Tolkning av data: att förstå mer om hur information har strukturerats och samlats in, gör att den kan tolkas ur olika synvinklar för att ytterligare verifiera resultaten. Det är också ofta en stor hjälp för författaren som återvänder till sina data efter någon månad, eller ett par år.

Frågor om metadata? Kontakta opendata@su.se.


Data som inte kan delas

Alla data är inte möjliga att dela öppet, av juridiska eller etiska skäl.

När kan inte forskningsdata delas öppet?

  • Om forskningsdata innehåller känsliga personuppgifter ska de inte publiceras. Men, icke-känsliga uppgifter kan publiceras om materialet helt anonymiseras.
  • Om det saknas skriftligt samtycke från deltagare i studien där de godkänner öppen publicering av resultat (dokumentation av detta krävs).
  • Om det inkluderar material som är upphovsrättsskyddat av någon annan.
  • Om materialet innehåller information som avslöjar företagshemligheter eller finansiell information.
  • Om materialet inte gått igenom etiska prövningar, där det är nödvändigt.

Om data inte kan delas öppet är det viktigt att ändå beskriva forskningsmaterialet i syfte att göra det sökbart och synligt. I flera plattformar finns möjligheten att endast registrera metadata. Lägg då till dina kontaktuppgifter när du registrerar metadata så att användare kan fråga dig om den information du har gjort sökbar.


Informationssäkerhet

Informationssäkerheten syftar till att säkerställa att informationstillgångar inom universitetet skyddas. Information och tillhörande informationsteknik är en ytterst viktig tillgång för verksamheten vid Stockholms universitet. Genom att ha en god informationssäkerhet tryggas den information som är viktig för universitetet. Alla verksamma inom Stockholms universitet ska därför arbeta aktivt, effektivt och kontinuerligt med informationssäkerhet, det vill säga hur olika typer av information hanteras i olika sammanhang.

Universitetets informationssäkerhetsarbete samordnas av IT-avdelningen och använder termerna konfidentialitet, riktighet, spårbarhet och tillgänglighet.

  • Med konfidentialitet menas att ingen obehörig ska ha tillgång till informationen. Speciellt viktigt att tänka på för forskare som hanterar forskningsdata som innehåller personuppgifter.
  • För forskare är det även viktigt att kunna garantera datas riktighet, dvs. att informationen skyddas från att obehöriga kan göra förändringar, både avsiktliga och oavsiktliga.
  • Med spårbarhet menas att det i efterhand går att spåra vem som gjorde vad i ett system. Om du som forskare hanterar känsliga personuppgifter eller annan sekretessbelagd information kan detta var extra viktigt.
  • För att möjliggöra tanken med öppna forskningsdata krävs att materialet görs tillgängligt. Självklart ska informationen alltid finnas och kunna nås av användarna när den behövs, på internet eller på begäran.

10 goda råd om informationssäkerhet.


Tillgängliggöra och bevara data

När forskningsdata tillgängliggörs digitalt är det viktigt att tänka på i vilka filformat informationen är sparad, så att andra kan återanvända materialet. Alla digitala filformat riskerar att bli föråldrade och inte kunna läsas i framtiden. Om det sker riskerar värdefulla forskningsdata att förloras.

Det viktigaste som forskare ska tänka på när det gäller att välja filformat för informationen i forskningsprojekt är att:

  • Använda ett bevarandeformat redan från början om det är möjligt
  • Använda ett filformat som är leverantörsoberoende
  • Använda ett filformat som följer en öppen standard
  • Använda ett filformat som är vanligt förekommande

Det är inte alltid möjligt att välja ett format som uppfyller dessa kriterier. Standarder och traditioner inom olika discipliner kan avgöra vilka filformat som används. Specifika instrument, analysredskap eller egentillverkad programvara är sådant som kan vara avgörande för dataformaten. Det är emellertid viktigt att komma ihåg att varje gång som man konverterar en fil från ett format till ett annat så riskerar man att information går förlorat. Spara alltså om möjligt filer i lämpliga format redan från början.

Svensk Nationell Datatjänst (SND) har utvärderat ett antal olika format som de anser är lämpliga för hantering, långtidsbevaring och tillgängliggörande av forskningsdata. Dessa kan dock komma att förändras över tid beroende på den tekniska utvecklingen.

I Riksarkivets föreskrift RA-FS 2009:2 anges vilka filformat som är godkända för bevarande. Vilket filformat som ska användas är beroende på den ursprungliga handlingens användningsområde t.ex. bevaras databaser och register som sekventiella filer eller XML-filer och kontorsdokument som PDF/A. Tyvärr saknas bevarandeformat för digitalt ljud och bild.

När du levererar ditt forskningsprojekt till arkivet kommer de filformat du använt att konverteras till ett bevarandeformat. Ett bevarandeformat är ett programoberoende format för att inte riskera att det plötsligt saknas rätt programvara för att läsa informationen.


Arkivering av forskningsdata

Forskningsdata som skapas i samband med ditt forskningsprojekt är också en betydelsefull del av universitetets arkiv och behöver arkiveras tillsammans med andra handlingar från forskningsprojekt. I enlighet med Arkivlagen ska forskningsmaterial alltid arkiveras vid det egna lärosätet. Rådatafiler, etiktillstånd, forskningsdokumentation likväl som publicerade resultat ska arkiveras. Det är därför viktigt att forskare efter avslutat projekt rensar arbetshandlingar och gallrar de handlingar som är av tillfällig och ringa betydelse, men bevarar de handlingar och den typ av information som är upptagna i Riksarkivets föreskrift RA-FS 1999:1.

Det är dessutom viktigt tänka på att bevara den information som hjälper till att ge en god förståelse för vad som hänt under forskningsprojektet och hur materialet ska tolkas. Forskningsmaterialet ska levereras till Avdelningen för arkiv och registratur, kontakta oss via e-post: arkivet@su.se.

Vad är en allmän handling?

Handling avser en framställning i skrift eller bild, samt upptagning som kan läsas, avlyssnas eller på annat sätt uppfattas med tekniskt hjälpmedel. En handling är allmän om den förvaras hos en myndighet och är inkommen till eller upprättad hos myndigheten.

Myndigheter är enligt offentlighetsprincipen skyldiga att lämna ut allmänna handlingar. En handling måste dock vara offentlig och inte omfattas av någon bestämmelse i offentlighets- och sekretesslagen för att myndigheten ska vara skyldig att lämna ut hela innehållet.