Bibliotheek

Zoeken in CatalogusPlus

'Slecht RDM haalt de kwaliteit van het hele onderzoek omlaag'

Interview met Emiel van Loon, docent FNWI

1 maart 2018

In 2020 is het vanzelfsprekend dat goed research datamanagement in het UvA- en HvA-onderwijs wordt aangeleerd. Dat is althans de ambitie van Fase 2 van het RDM-programma. Emiel van Loon, werkzaam bij het Institute for Biodiversity and Ecosystem Dynamics van de FNWI, besteedt in zijn onderwijs al systematisch aandacht aan het omgaan met onderzoeksdata. "In het derde jaar zijn studenten blij dat ze het hebben geleerd".

Wat moeten studenten weten of kunnen rond onderzoeksdata? 

'Beseffen dat het slecht documenteren en beheren van onderzoekdata allerlei nare gevolgen kan hebben, zowel voor henzelf als voor anderen die met dezelfde dataset gaan werken. RDM is niet alleen op universiteiten een belangrijke vaardigheid, maar juist ook bij toekomstige werkgevers. Bij de overheid en in het bedrijfsleven zijn onderzoeksdata vaak zelfs beter op orde dan in universiteiten. Bijvoorbeeld ingenieursbureau's en Philips weten al jaren dat goed onderzoeksdatamanagement zichzelf terugverdient. In universiteiten kun je er niet echt mee schitteren, maar dat hoeft in bedrijven helemaal niet, daar kijken ze heel rationeel naar kosten en baten.' 

Welke onderdelen van RDM zijn vooral van belang voor studenten? Plannen, bewaren, delen?

'Het hele scala. Het gaat vooral om een attitude. Als je onderzoek de wereld in slingert, hebt je een verantwoordelijkheid om zorg te dragen voor de data. Helaas is dat slecht verenigbaar met de manier waarop het onderwijs is georganiseerd, daar is als het ware ingebakken dat je al na 8 weken niet meer omkijkt naar je data.'

Zijn er nog andere meer specifieke eisen die je stelt aan kennis/vaardigheden van FNWI-studenten?

'Ik verwacht eigenlijk van alle UvA-studenten dat ze de FAIR-principes kunnen noemen en weten wat ze inhouden. Die zijn niet gebaseerd op technische kennis of software. Daarnaast hoop ik dat FNWI studenten ook praktische vaardigheden hebben met betrekking tot data analyse en programmeren. Bij FNWI doen de meeste studenten experimenten of observationele studies waarbij vaak ook hele grote hoeveelheden gegevens met automatische sensoren worden ingewonnen. Dat leidt tot heel veel data die niet met standaardsoftware is op te slaan en niet meer 'op het oog' is te controleren. Het is in dit soort situaties zaak om het onderzoek van het begin af aan zo te organiseren en software te schrijven waarmee kwaliteit van de gegevens van meet af aan gecontroleerd kan worden (bijv. via visualisatie en automatische checks). En iedere FNWI-studenten zou hierin vaardig moeten zijn.'

Hoe is het nu gesteld met de kennis en vaardigheden van studenten op dit gebied?

'Die is gebrekkig. Bij FNWI zijn we bezig om dit onderwerp vanaf jaar één meer onder hun aandacht te brengen. Niet pas in de scriptiefase. Tegen die tijd zou het een automatisme moeten zijn en zou de nadruk op het onderzoek zelf moeten liggen. Dan moet het al als zonnetje lopen. Deze visie wordt breed ondersteund in de faculteit. Er zal nog wel wat tijd kosten voordat de RDM-kennis en vaardigheden goed in de curricula zijn ingebouwd en we de studenten echt goed toerusten. Er is met name ook veel training onder docenten nodig. Maar er is veel enthousiasme en ook visitatiecommissies zien het belang.
Vorig jaar zijn, zowel bij de programma's waar ik zelf als docent bij betrokken ben als bij drie andere bachelors, in het onderwijs- en examenreglement eindtermen opgenomen rond RDM. Daarmee laden die opleidingen de verplichting op zich om ook onderwijs over RDM te verzorgen.'

En in de masters?

'Die studenten hebben zulke verschillende achtergronden dat ook zij nog wel eens deficiënt zijn op dit gebied. Daarom zou ik bijspijkermodules willen. Helaas kan het niet allemaal tegelijk. Ik heb het op me genomen om wat te duwen en te trekken.' 

Welke data-ongelukken zie je gebeuren? 

'Er gebeuren vooral veel kleine ongelukjes. Bij onderzoek van studenten gaat heel veel tijd verloren met het herstructureren van data en met het herzien van metadata. Dat is inefficiënt en frustrerend. Soms is een erfenis van een andere student of onderzoeker de oorzaak, soms is het door een gebrek aan kennis of een te afstandelijke supervisie.
Wil een docent serieus zijn in zijn supervisie, dan moet hij de student vaak spreken en dan doorvragen over de data: wat betekenen die data? Hoe heb je dat gedocumenteerd? En ook zelf tijd inruimen om die data in alle stappen van de bewerking te bekijken. Dan weet je of het de goede kant op gaat. Het is hard nodig, want slecht RDM haalt de kwaliteit van het hele onderzoek omlaag.'

Hoe stel je RDM in het onderwijs aan de orde?

'De studenten moeten bijvoorbeeld een enquête maken en de resultaten van één onderdeel labelen en verwerken. Een volgende stap is dat de resultaten van verschillende onderdelen moeten worden samengevoegd. Zo komen ze allerlei problemen tegen die ze moeten oplossen en worden ze zich bewust van het belang van goede structurering.
Ook geven we hen vervuilde datasets, zoals je die ook wel eens tegenkomt in de praktijk. Met ontbrekende waarden en typfouten. Ze ondervinden aan den lijve wat het is om te worstelen met datasets die niet netjes zijn overgeschreven.'

Hoe waarderen studenten RDM-onderwijs?

'Vooral startende bachelorstudenten bij aardwetenschappen en ecologie vinden RDM vaak een verplicht nummer. 'Dat is niet waar ik voor gekomen ben' zeggen ze dan. Maar vrijwel altijd komt er waardering naarmate de opleiding vordert. In het derde jaar zijn ze blij dat ze het hebben geleerd. Voor ons als docenten is het zeker een aandachtspunt om studenten meer lol te laten beleven in de studie van dit onderwerp, maar het is net als met leren schrijven of andere academische vaardigheden: meters moet je maken.
Het zou leuk zijn om eens een terugkomdag te houden over dit onderwerp. Laat afgestudeerden vertellen wat ze aan deze vaardigheden hebben in hun huidige werk of onderzoekspraktijk.'

Interview: Alice Doek

Gepubliceerd door  Bibliotheek van de UvA