Dokumentation och metadata

En viktig parameter vid tillgängliggörande av forskningsdata är att de data som publiceras är förståeliga för sekundäranvändare. Hur materialet dokumenteras och beskrivs med tillhörande metadata, data om data, är därmed avgörande för att den information som delas kan hittas och användas av andra, såväl idag som i framtiden. Metadata underlättar automatisk hantering och kategorisering av information, därför bör metadata som skapas följa någon av de standarder som finns. Till skillnad från dokumentation, som ska vara läsbar för en användare, är metadata grunden för hur system hanterar information eller data.

Vilka olika slags metadata finns det?

  • Beskrivande: Information om innehåll och kontext, att användas för att kunna citera information på ett vetenskapligt sätt. Exempel på beskrivande metadata är: titel, författare, vetenskapligt ämnesområde, nyckelord, sammanfattningar av studien, metod etc.
  • Administrativa: Information som möjliggör kategorisering och korrekt hantering. Exempel på administrativa metadata är: filformat, rättigheter/licenser/copyright, bevarande etc.
  • Strukturella: För att kunna strukturera de två ovanstående kategorierna, behövs strukturella metadata. Exempel på detta är: beständig länkning (t.ex. DOI eller URN), hur olika tabeller relaterar till varandra, etc.

Metadata kan användas till flera saker, som till exempel:

  • Att citera: för att skapa möjligheter till meritering och erkännande för den som har skapat innehållet.
  • Att återanvända: det måste finnas tillräckligt med metadata för att en annan forskare ska förstå till exempel hur datainsamlingen har gått till och vad olika variabler betyder.
  • Att söka/hitta: för att andra ska kunna hitta informationen och verifiera att den är korrekt. Metadata behöver svara på frågorna: När? Var? Vad? Vem? Hur?
  • Tolkning av data: att förstå mer om hur information har strukturerats och samlats in, gör att den kan tolkas ur olika synvinklar för att ytterligare verifiera resultaten. Det är också ofta en stor hjälp för författaren som återvänder till sina data efter någon månad, eller ett par år.

Data som inte kan delas

Alla data är inte möjliga att dela öppet, av juridiska, etiska eller kommersiella skäl.

När kan inte forskningsdata delas öppet?

  • Om forskningsdata innehåller känsliga personuppgifter, eller känslig information ska de inte publiceras. Men, icke-känsliga uppgifter kan publiceras om materialet anonymiseras.
  • Om det saknas skriftligt samtycke från deltagare i studien där de godkänner öppen publicering av resultat (dokumentation av detta krävs).
  • Om det inkluderar material som är upphovsrättsskyddat av någon annan.
  • Om materialet innehåller information som avslöjar företagshemligheter eller finansiell information.
  • Om materialet inte gått igenom etiska prövningar, där det är nödvändigt.

Om data inte kan delas öppet är det viktigt att ändå beskriva forskningsmaterialet i syfte att göra det sökbart och synligt. I flera plattformar finns möjligheten att endast registrera metadata. Lägg då till kontaktuppgifter så att en sekundäranvändare kan fråga om informationen som publicerats.

Informationssäkerhet

Alla verksamma inom Stockholms universitet ska arbeta aktivt, effektivt och kontinuerligt med informationssäkerhet, det vill säga hur olika typer av information hanteras i olika sammanhang.

Universitetets informationssäkerhetsarbete samordnas av IT-avdelningen och använder termerna konfidentialitet, riktighet, spårbarhet och tillgänglighet.

  • Med konfidentialitet menas att ingen obehörig ska ha tillgång till informationen. Speciellt viktigt att tänka på för forskare som hanterar forskningsdata som innehåller personuppgifter.
  • För forskare är det även viktigt att kunna garantera datas riktighet, dvs. att informationen skyddas från att obehöriga kan göra förändringar, både avsiktliga och oavsiktliga.
  • Med spårbarhet menas att det i efterhand går att spåra vem som gjorde vad i ett system. Vid hantering av känsliga personuppgifter eller annan sekretessbelagd information kan detta vara extra viktigt.
  • För att möjliggöra tanken med öppna forskningsdata krävs att materialet görs tillgängligt, i den mån det är möjligt. Självklart ska informationen alltid finnas och kunna nås av användarna när den behövs, på internet eller på begäran.

10 goda råd om informationssäkerhet.
Lagra och säkerhetskopiera ditt material.
Anvisningar för molntjänster.

Tillgängliggöra och bevara data

När forskningsdata tillgängliggörs digitalt är det viktigt att tänka på i vilka filformat informationen är sparad, så att andra kan återanvända materialet. Alla digitala filformat riskerar att bli föråldrade och inte kunna läsas i framtiden. Om det sker riskerar värdefulla forskningsdata att förloras. Det viktigaste som forskare ska tänka på när det gäller att välja filformat för informationen i forskningsprojekt är att:

  • Använda ett bevarandeformat redan från början om det är möjligt
  • Använda ett filformat som är leverantörsoberoende
  • Använda ett filformat som följer en öppen standard
  • Använda ett filformat som är vanligt förekommande

Svensk Nationell Datatjänst (SND) har utvärderat ett antal olika filformat som de anser är lämpliga för hantering, långtidsbevaring och tillgängliggörande av forskningsdata. Dessa kan dock komma att förändras över tid beroende på den tekniska utvecklingen.

I Riksarkivets föreskrift RA-FS 2009:2 anges vilka filformat som är godkända för bevarande. Vilket filformat som ska användas är beroende på den ursprungliga handlingens användningsområde t.ex. bevaras databaser och register som sekventiella filer eller XML-filer och kontorsdokument som PDF/A. Tyvärr saknas bevarandeformat för digitalt ljud och bild.

Arkivera forskningsmaterial

Forskningsmaterial som skapas i samband med forskningsprojekt är en betydelsefull del av universitetets arkiv och ska arkiveras. Det är viktigt att redan från början tänka på att bevara den information som hjälper till att ge en god förståelse för vad som hänt och varför under forskningsprojektet samt hur materialet ska tolkas.

Rensa - Gallra – Bevara/Arkivera

Efter avslutat projekt är det viktigt att rensa och gallra i forskningsmaterialet, samt samla ihop och ordna det som ska bevaras och arkiveras. Arbetshandlingar rensas och för det krävs det inget stöd i regelverket. Allmänna handlingar som är av tillfällig och ringa betydelse, kan gallras, men kräver stöd i regelverket. Gallringsbeslut finns på lärosätet och talar om vad som får gallras och efter hur lång tid. Kontakta alltid institutionens arkivvårdare eller Arkivfunktionen centralt vid tveksamheter på arkivet@su.se.

Forskningsmaterial som ska bevaras/arkiveras

Administrativa handlingar, t.ex.

Ansökningar och beslut om medel, även avslagen.
Etikprövning och tillstånd för forskning.
Utlämnande av uppgift med förbehåll enligt Offentlighets- och sekretesslag.
Överföring av sekretess enligt Offentlighets- och sekretesslag.
Datahanteringsplanen.

Ekonomiska handlingar, t.ex.

Ekonomiska del- och slutrapporter till finansiären.

Forskningsdata, t.ex.

Forskningsdata, rådata och processad data.
Samtycken och information om personuppgiftsbehandling.
Kodnycklar, koder och kodbeskrivningar.
Metodbeskrivningar.
Mallar och formulär.
Programvara, datorkod som används för att utföra analys.
Information som gör att någon annan kan förstå och kan använda data för vidare forskning.

En fördel med att tidigt ladda upp data eller metadata i ett repositorium, som Figshare, är att du förbereder dig för automatisk arkivering (= långvarig bevarande), vilket innebär att du inte behöver skicka in/ladda upp samma metadata och datafiler igen för lokal arkivering.

Publikationer och andra redovisningar av resultat, t.ex.

Avhandlingar, del- och slutrapporter, papers, presentationer.

Forskningsmaterialet ska levereras till Stockholms universitets Arkiv och registratur.