"Datamanagement is echt belangrijk – ook voor de toekomst van je eigen onderzoek"

De meerwaarde van een DMP

Als ze voor haar onderzoek een NWO-beurs binnenhaalt, moet biochemicus Tessa Sinnige voor het eerst een Data Management Plan schrijven. Omdat ze niet goed weet hoe ze dat moet aanpakken, vraagt ze hulp aan RDM Support. In eerste instantie heeft Sinnige een paar praktische vragen, maar gaandeweg realiseert ze zich dat ze voor het onderzoek in haar lab meer stappen rondom datamanagement moet zetten. “Ik ben blij dat ik hier nú achter kom – en niet pas over vijf jaar.”

Steeds meer onderzoeksfinanciers stellen het schrijven van een Data Management Plan (DMP) verplicht. “Het punt was alleen dat ik nog nooit zo’n plan had geschreven”, zegt Sinnige. “Dat is niet iets wat je leert tijdens je opleiding, en ook op mijn vorige werkplekken had ik er niet mee te maken gehad. Ik wist dus niet goed wat er van mij werd verwacht.”

Sinnige maakt een opzet voor haar plan met DMPonline, een tool waarmee je je DMP opstelt. “Toch kwam ik er in mijn eentje niet helemaal uit. Gelukkig heeft de tool een knop waarmee ik feedback kon vragen aan de datamanagement-experts van de Universiteit Utrecht.”

Tessa Sinnige in haar laboratorium, fotograaf PhotoA.nl

Op die manier komt Sinnige in contact met research dataconsultant Dafne Jansen van RDM Support. Zij reviewt het DMP van de onderzoeker, samen met Mercedes Beltrán, de facultaire datasteward. Die weet veel over het type data waarmee onderzoekers aan de faculteit Bètawetenschappen werken. Jansen adviseert op hoofdlijnen, bijvoorbeeld over het toevoegen van metadata, zodat experimenten makkelijk terug te vinden zijn, en de datasteward checkt het plan op specifieke en technische details.

Wat is een DMP?

Veel onderzoeksfinanciers, waaronder NWO, vragen wetenschappers die een beurs krijgen om voor aanvang van hun project een Data Management Plan te schrijven. Dit is een document waarin precies staat welke data ze tijdens hun project verzamelen, hoe ze die data opslaan en beheren, en wat er na afloop mee gebeurt. Sinnige: “Logisch, ze willen natuurlijk dat onderzoeksgeld goed wordt besteed. En wanneer verzamelde data zorgvuldig bewaard blijven, kunnen deze in de toekomst hergebruikt worden door andere onderzoekers.”

Het belang van datamanagement

Sinnige krijgt goede feedback, maar die roept vervolgens weer nieuwe vragen op. “Toen ben ik op aanraden van Dafne langsgegaan bij een van de Walk-in Hours die RDM Support wekelijks op de campus organiseert. Je kunt daar als onderzoeker zonder afspraak binnenlopen, heel laagdrempelig dus.”

Tijdens een van de wekelijkse Walk-in Hours raken Sinnige en Jansen uitgebreid aan de praat. “Door dat gesprek ging ik pas echt het belang van datamanagement inzien. Ik realiseerde me dat ik bij het opzetten van mijn lab überhaupt niet aan protocollen voor datamanagement had gedacht. Onze data bestaan vooral uit microscopie-bestanden. Maar alle teamleden hadden hun eigen manier om die bestanden een naam te geven en in mapjes te zetten.”

Zo’n DMP is typisch iets waarvan je als wetenschapper verzucht dat het er óók nog bij komt. Maar ik realiseer me nu dat datamanagement echt belangrijk is – ook voor de toekomst van je eigen onderzoek.

Masterstudenten

In het lab van Sinnige waren er al wél protocollen voor de experimenten die de onderzoekers er doen, vertelt ze. “Zodra nieuwe medewerkers bij ons beginnen, leren we hen die protocollen aan. Ik realiseerde we dat we op het gebied van datamanagement ook zoiets nodig hadden. Zodat iedereen z’n data op dezelfde manier organiseert.”

Dat is in haar geval extra belangrijk, benadrukt ze, omdat in het Sinnige Lab veel masterstudenten rondlopen. “Meestal werken die een halfjaar tot een jaar bij ons, terwijl projecten veel langer duren. Het komt vaak voor dat de onderzoekers die data verzamelden al weg zijn tegen de tijd dat we onze resultaten gaan opschrijven. Ik moet dan nog wel de data van al die verschillende mensen kunnen terugvinden. Als iedereen z’n eigen systeem hanteert, werkt dat natuurlijk niet.”

FAIRe data

Daar komt bij dat de Universiteit Utrecht hoge ambities heeft op het gebied van open science. FAIR data is daar een onderdeel van. Dat wil zeggen dat wetenschappelijke data Findable, Accessible, Interoperable en Reusable moeten worden gemaakt, vertelt Sinnige. “Ook daar had ik een vraag over: het was mij niet duidelijk of ‘accessible’ betekent dat je data volledig openbaar moet zijn. Dat blijkt niet het geval; het gaat erom dat de dataset ten eerste vindbaar (Findable) is voor andere onderzoekers. En dat als zij toegang willen, ik dat op een handige manier moet kunnen geven (Accessible).”

Voor Sinnige is dit een opluchting: “Ik vind het prettig dat ik andere wetenschappers persoonlijk toelichting kan geven, voordat ze eventueel iets doen met onze data. Wanneer alles zomaar te downloaden is, weet je niet hoe anderen je dataset interpreteren en gebruiken."

Tijdens het gesprek leert Sinnige ook over het bestaan van Yoda, een applicatie en dienst van de universiteit waar onderzoekers op een veilige manier data kunnen opslaan, delen, publiceren en voor een lange termijn bewaren. Sinnige: “Dat is een handige manier om aan de FAIR-principes te voldoen. Via Yoda kun je andere onderzoekers bijvoorbeeld ook toegang geven tot je data. Je kunt bij RDM Support workshops volgen in het gebruik van dit systeem. Voor onderzoekers in mijn lab zou dat een goede volgende stap zijn.”

Tessa Sinnige werkt in haar laboratorium, fotograaf PhotoA.nl

Ik vind het prettig dat ik andere wetenschappers persoonlijk toelichting kan geven, voordat ze eventueel iets doen met onze data. Wanneer alles zomaar te downloaden is, weet je niet hoe anderen je dataset interpreteren en gebruiken.

Advies aan collega’s

Inmiddels is het DMP van Sinnige goedgekeurd door NWO. Nu zijn zij en haar team bezig om richtlijnen op te stellen voor datamanagement in het lab. “We hebben bedacht om de codes die we hanteren in onze labjournaals ook hiervoor te gebruiken. Elke onderzoeker heeft per experiment een eigen code, met diens initialen en een nummer. Nu slaan we de data op in mappen met diezelfde code. Zo sorteren we de gegevens overzichtelijk per experiment.”

Hoewel Sinnige baalt dat ze pas twee jaar na de start van haar onderzoeksgroep meer leert over datamanagement, is ze ook blij met deze inhaalslag. “Beter laat dan nooit”, zegt ze lachend. “Ik zou wel tegen collega-onderzoekers willen zeggen: neem datamanagement serieus. Zo’n DMP is typisch iets waarvan je als wetenschapper verzucht dat het er óók nog bij komt. Maar ik realiseer me nu dat datamanagement echt belangrijk is – ook voor de toekomst van je eigen onderzoek.”

Bovendien, zegt ze, helpt goede dataopslag je om bij eventuele latere vragen te onderbouwen wat je hebt gepubliceerd. “Fraude in de wetenschap komt helaas nog regelmatig voor. Mochten anderen twijfelen aan jouw conclusies, dan wil jij je ruwe onderzoeksdata kunnen laten zien. Anders kun je wel inpakken. Maar ook los daarvan: je wilt niet die wetenschapper zijn bij wie na jaren onderzoek de helft van z’n data onvindbaar blijkt. Dat kun je voorkomen door er nu al goed over na te denken.”

Sinnige Lab

Sinnige is tenure track assistant professor aan de Universiteit Utrecht. In een vijfjarig traject krijgt ze van de universiteit de middelen en mensen om haar eigen lab op te zetten. Haar onderzoek gaat over veroudering. “En dan vooral over ziektes die daarmee te maken hebben, zoals de ziektes van Alzheimer, Parkinson en Huntington. Onder de microscoop onderzoeken we bepaalde eiwitten, die zich bij deze ziektes niet goed gedragen. We gebruiken daarvoor de rondworm C. elegans als modelorganisme, omdat die transparant is en maar een levensduur van een paar weken heeft.”