Dokumentation och metadata

En viktig parameter vid tillgängliggörande av forskningsdata är att de data som publiceras är förståeliga för sekundäranvändare. Hur materialet dokumenteras och beskrivs med tillhörande metadata, data om data, är därmed avgörande för att den information som delas kan hittas och användas av andra, såväl idag som i framtiden. Metadata underlättar automatisk hantering och kategorisering av information, därför bör metadata som skapas följa någon av de standarder som finns. Till skillnad från dokumentation, som ska vara läsbar för en användare, är metadata grunden för hur system hanterar information eller data.

Vilka olika slags metadata finns det?

  • Beskrivande: Information om innehåll och kontext, att användas för att kunna citera information på ett vetenskapligt sätt. Exempel på beskrivande metadata är: titel, författare, vetenskapligt ämnesområde, nyckelord, sammanfattningar av studien, metod etc.
  • Administrativa: Information som möjliggör kategorisering och korrekt hantering. Exempel på administrativa metadata är: filformat, rättigheter/licenser/copyright, bevarande etc.
  • Strukturella: För att kunna strukturera de två ovanstående kategorierna, behövs strukturella metadata. Exempel på detta är: beständig länkning (t.ex. DOI eller URN), hur olika tabeller relaterar till varandra, etc.

Metadata kan användas till flera saker, som till exempel:

  • Att citera: för att skapa möjligheter till meritering och erkännande för den som har skapat innehållet.
  • Att återanvända: det måste finnas tillräckligt med metadata för att en annan forskare ska förstå till exempel hur datainsamlingen har gått till och vad olika variabler betyder.
  • Att söka/hitta: för att andra ska kunna hitta informationen och verifiera att den är korrekt. Metadata behöver svara på frågorna: När? Var? Vad? Vem? Hur?
  • Tolkning av data: att förstå mer om hur information har strukturerats och samlats in, gör att den kan tolkas ur olika synvinklar för att ytterligare verifiera resultaten. Det är också ofta en stor hjälp för författaren som återvänder till sina data efter någon månad, eller ett par år.

Data som inte kan delas

Alla data är inte möjliga att dela öppet, av juridiska, etiska eller kommersiella skäl.

När kan inte forskningsdata delas öppet?

  • Om forskningsdata innehåller känsliga personuppgifter, eller känslig information ska de inte publiceras. Men, icke-känsliga uppgifter kan publiceras om materialet anonymiseras.
  • Om det saknas skriftligt samtycke från deltagare i studien där de godkänner öppen publicering av resultat (dokumentation av detta krävs).
  • Om det inkluderar material som är upphovsrättsskyddat av någon annan.
  • Om materialet innehåller information som avslöjar företagshemligheter eller finansiell information.
  • Om materialet inte gått igenom etiska prövningar, där det är nödvändigt.

Om data inte kan delas öppet är det viktigt att ändå beskriva forskningsmaterialet i syfte att göra det sökbart och synligt. I flera plattformar finns möjligheten att endast registrera metadata. Lägg då till kontaktuppgifter så att en sekundäranvändare kan fråga om informationen som publicerats.

Informationssäkerhet

Alla verksamma inom Stockholms universitet ska arbeta aktivt, effektivt och kontinuerligt med informationssäkerhet, det vill säga hur olika typer av information hanteras i olika sammanhang.

Universitetets informationssäkerhetsarbete samordnas av IT-avdelningen och använder termerna konfidentialitet, riktighet, spårbarhet och tillgänglighet.

  • Med konfidentialitet menas att ingen obehörig ska ha tillgång till informationen. Speciellt viktigt att tänka på för forskare som hanterar forskningsdata som innehåller personuppgifter.
  • För forskare är det även viktigt att kunna garantera datas riktighet, dvs. att informationen skyddas från att obehöriga kan göra förändringar, både avsiktliga och oavsiktliga.
  • Med spårbarhet menas att det i efterhand går att spåra vem som gjorde vad i ett system. Vid hantering av känsliga personuppgifter eller annan sekretessbelagd information kan detta vara extra viktigt.
  • För att möjliggöra tanken med öppna forskningsdata krävs att materialet görs tillgängligt, i den mån det är möjligt. Självklart ska informationen alltid finnas och kunna nås av användarna när den behövs, på internet eller på begäran.

10 goda råd om informationssäkerhet.
Lagra och säkerhetskopiera ditt material.
Anvisningar för molntjänster.

Tillgängliggöra och bevara data

När forskningsdata tillgängliggörs digitalt är det viktigt att tänka på i vilka filformat informationen är sparad, så att andra kan återanvända materialet. Alla digitala filformat riskerar att bli föråldrade och inte kunna läsas i framtiden. Om det sker riskerar värdefulla forskningsdata att förloras. Det viktigaste som forskare ska tänka på när det gäller att välja filformat för informationen i forskningsprojekt är att:

  • Använda ett bevarandeformat redan från början om det är möjligt
  • Använda ett filformat som är leverantörsoberoende
  • Använda ett filformat som följer en öppen standard
  • Använda ett filformat som är vanligt förekommande

Svensk Nationell Datatjänst (SND) har utvärderat ett antal olika filformat som de anser är lämpliga för hantering, långtidsbevaring och tillgängliggörande av forskningsdata. Dessa kan dock komma att förändras över tid beroende på den tekniska utvecklingen.

I Riksarkivets föreskrift RA-FS 2009:2 anges vilka filformat som är godkända för bevarande. Vilket filformat som ska användas är beroende på den ursprungliga handlingens användningsområde t.ex. bevaras databaser och register som sekventiella filer eller XML-filer och kontorsdokument som PDF/A. Tyvärr saknas bevarandeformat för digitalt ljud och bild.

Arkivering av forskningsdata

Forskningsdata och forskningsmaterial som skapas i samband med ditt forskningsprojekt är en betydelsefull del av universitetets arkiv och ska alltid arkiveras, i enlighet med Arkivlagen. Varje institution vid Stockholms universitet är egen arkivbildare och har ansvar för sitt eget arkiv. Rådatafiler, etiktillstånd, forskningsdokumentation likväl som publicerade resultat ska arkiveras och det är viktigt tänka på att bevara den information som hjälper till att ge en god förståelse för vad som hänt under forskningsprojektet och hur materialet ska tolkas. Det är därför viktigt att forskare efter avslutat projekt rensar arbetshandlingar och gallrar de handlingar som är av tillfällig och ringa betydelse, men bevarar de handlingar och den typ av information som är upptagna i Riksarkivets föreskrift RA-FS 1999:1. Myndigheter är enligt offentlighetsprincipen skyldiga att lämna ut allmänna handlingar. Ta del av hur offentlighetsprincipen och sekretess påverkar arbetet.

Forskningsmaterialet ska levereras till Stockholms universitets Arkiv och registratur. Vid leverans konverteras använda filformat till ett bevarandeformat. Ett bevarandeformat är ett programoberoende format för att inte riskera att det plötsligt saknas rätt programvara för att läsa informationen.