Bibliotheek

Zoeken in CatalogusPlus

Open onderzoeksdata kunnen mensenlevens redden

15 november 2016

Paul Boersma is hoogleraar fonetische wetenschappen en directeur van het Amsterdam Center for Language and Communication (ACLC) van de Faculteit der Geesteswetenschappen. Hij ontwierp het facultaire dataprotocol en vertegenwoordigt de UvA-onderzoekers in de Research Data Management (RDM) Programmaraad.

Meer meta-analyses mogelijk

Open onderzoeksdata als default, tenzij gesloten nodig  is ...  zoals de EU vanaf 2017 eist, vind ik een hele goede richtlijn. De belastingbetaler moet over de data kunnen beschikken. Bovendien zorgt dit ervoor dat onderzoeksdata veel meer waard worden. Het maatschappelijk nut wordt veel groter, want het maakt onder andere meer meta-analyses mogelijk – die zijn zeer waardevol. Een standaardwerk rapporteert dat als er in de jaren zeventig een meta-analyse gedaan was naar wiegendood, dat er dan 60.000 baby’s minder gestorven waren. Open onderzoeksdata kunnen dus mensenlevens redden. Nu is het vaak nog heel lastig om data te verzamelen voor meta-analyses.´

Onderzoeksdata zoveel mogelijk delen

´Een van de vier doelen van ons FGw-dataprotocol is dat we onderzoekdata zoveel mogelijk delen. Onderzoekers maken zich vaak zorgen over het openbaar maken van data terwijl het onderzoek nog loopt, omdat ook anderen dan analyses kunnen gaan doen. Daarom maken we de data pas openbaar na afronding van het onderzoek. De noodzaak van open data is hier inmiddels geaccepteerd. We discussiëren nu nog over na hoeveel jaar de data openbaar moeten worden. Wat doe je als je na je proefschrift nog verder wilt met je data?´

Wat telt als data?

´We hebben gesproken over het facultaire dataprotocol met de onderzoeksdirecteuren in de onderzoeksraad, in de adviesraad en in de groepenvergaderingen. De onderzoeksraad heeft het al goedgekeurd. Het moet dit jaar nog vastgesteld worden door de decaan. Uit de gesprekken kwam naar voren dat sommig onderzoek zich niet zo goed leent voor RDM en dat enkele groepen al veel aan RDM doen en daarom niet zitten te springen om nog een richtlijn. Ook hebben we veel gediscussieerd over wat als data telt en welke data precies opgeslagen moet worden.´

Aantekeningen in de kantlijn

´Bijvoorbeeld: tellen bij de boekbesprekingen van literatuurwetenschappers de aantekeningen in de kantlijn van het boek als onderzoeksdata en moeten zij die beschikbaar stellen? Onderzoekers kunnen aantekeningen beschouwen als interpretatie, niet als data. En wat moeten taalwetenschappers doen die door participerend onderzoek talen in bv. de Amazone beschrijven? Opnamen publiceren is niet altijd mogelijk bij mensen die hun taal als heilig beschouwen. Wat sla je dan op en hoe?’

Welke ruwe, afgeleide en analysedata bewaren?

‘In ons protocol staat een beschrijving van de ruwe en afgeleide data die opgeslagen moeten worden. Bij historisch onderzoek bijvoorbeeld moeten alle moeilijk bereikbare bronnen vastgelegd worden in de dataset door ze te scannen of fotograferen. Dat is belangrijk met het oog op replicatie. Het protocol geeft ook aan welke analysedata bewaard moeten worden.´

Organiseer je onderzoeksdata voor de ogen van anderen

´Doel 1 van het protocol is veilige dataopslag. Onze voorzieningen hiervoor zijn nu niet optimaal, dus we zijn blij met de komst van het centrale RDM-systeem. Als dit gebruiksvriendelijk genoeg is, dan gaan onze onderzoekers dat zeker gebruiken. Doelen 2 (accountability) en 3 (data-organisatie) wijzen op de verantwoordelijkheid van de onderzoeker ervoor te zorgen dat anderen je data makkelijk kunnen raadplegen. Dat vereist dat de onderzoeker alle stappen in de analyse documenteert en onderzoeksdata goed in mappen organiseert, beschrijft en codeert.´

Zorgen over bewaartijd

´Mijn zorg is nog de bewaartijd. De centrale UvA/HvA-richtlijn stelt minimaal tien jaar bewaren. Voor veel van onze vakgebieden - denk aan geschiedenis! - is dat erg kort. Ik had gehoopt dat op het moment dat je de onderzoeksdata openbaar maakt, ze dat voor altijd zouden blijven. Ik hoop dat langdurige opslag in het centrale RDM-systeem mogelijk is, want wij willen onze data heel lang bewaren. Er wordt vaak gezegd dat dataopslag duur is, maar dat klopt niet, het wordt steeds goedkoper.´

Sprong voorwaarts

Binnen mijn onderzoeksinstituut weet iedereen dat het facultaire dataprotocol er is. Straks krijgt iedereen het toegestuurd, en dan moeten we verder in gesprek met elkaar over een eventuele interpretatie en uitwerking van het protocol op het niveau van het onderzoeksinstituut. Research data management wordt ook aangekaart in de jaargesprekken, maar dat kan nog explicieter. Ik verwacht dat we in 2017 een sprong voorwaarts kunnen maken met de komst van ons protocol en het centrale RDM-systeem.’

RDM-protocol Geesteswetenschappen

De hoofddoelen van het RDM-protocol van de faculteit der Geesteswetenschappen zijn: 

  1. you shall not lose your data
  2. you are accountable for your data
  3. you organise your data for the eyes of others
  4. you share your data with others as much as possible

Deze doelen zijn afgeleid van de hoofddoelen van het dataprotocol van de UvA-psychologen: safety, accountability, efficiency en data sharing. Het protocol wordt na vaststelling gepubliceerd op de website van FGw.

Interview: Anneke de Maat

Gepubliceerd door  RDM support