7 mei 2019

“Onze code is ontwikkeld om door iedereen ter wereld te gebruiken”

Wat betekent Research Data Management in de praktijk van een onderzoeker? In deze reeks interviews door RDM Support delen onderzoekers hun ervaringen over verschillende aspecten van research data management. In dit interview: Erik van Sebille, deskundige op het gebied van plastic soep en oceaanstromingen en winnaar UU-Publiprijs 2018, over het maken van community code.

”Er drijft 250 miljoen kilo plastic aan het oppervlak van de oceaan. Maar elk jaar gaat er twintig keer zoveel plastic de oceaan in als dat er nu drijft. Het overgrote deel drijft dus niet aan het oppervlak. Daarvan weten we dus niet waar het plastic is, dat noemen wij de ‘dark plastic’. We kunnen het probleem van plastic in zee alleen maar oplossen als we weten waar het plastic is. Daarom zijn we hier, binnen het onderzoeksproject TOPIOS, bezig met het maken van een driedimensionale kaart waar het plastic in de oceaan is. Hiervoor gebruiken we de software OceanParcels, die we zelf ontwikkeld hebben, en die met hulp van de community alleen maar beter wordt.”

Om vertrouwen te bouwen moet je mensen toegang geven tot het ontwikkelen van de code
Portretfoto Erik van Sebille
Erik van Sebille, foto's door Pieter van Dorp van Vliet

Inclusive development

De tool OceanParcels bestaat uit een software code die te gebruiken is in Python. De code is door iedereen te downloaden en heeft zich ontwikkeld tot een echte community code. Oceanograaf Erik van Sebille vertelt: “Het is niet de bedoeling dat deze code alleen maar hier in dit gebouw door deze onderzoeksgroep gebruikt wordt. Het is gemaakt om door de hele wereld te gebruiken. Om dat te realiseren moet je je richten op twee aspecten. De ene kant is het adverteren van je code, door naar conferenties te gaan, te netwerken en artikelen te schrijven. Maar de andere kant, de technische kant, is het inclusief maken van de ontwikkeling van de code. Je kunt geen code maken en aan de wereld aanbieden, en verwachten dat deze gebruikt wordt. Dan heb je geen co-ownership. Om vertrouwen te bouwen moet je mensen toegang geven tot het ontwikkelen van de code. En dat is wat we inclusive development noemen. Ik krijg nu bijna wekelijks een mailtje van iemand die de code heeft gedownload en een vraag heeft of een bug vindt.”

Alle vragen van gebruikers van de code worden al bijna te veel voor mij alleen

Knelpunten

Voor het ontwikkelen en uitrollen van een community code is geen vast recept. Het is een kwestie van uitproberen. “Alle vragen van gebruikers worden al bijna te veel voor mij alleen,” legt Erik uit, “daarom zijn we nu bezig met het opzetten van een chatroom, waar de community elkaar kan ontmoeten en elkaar kan helpen.” Maar er zijn meer hindernissen. “Het is enorm moeilijk om de ontwikkeling van zo’n code gefinancierd te krijgen. Voor een community code als deze zijn geen subsidies binnen te halen. Daarom moet zo’n code ontwikkeld worden binnen een gefinancierd onderzoek. En niet zo maar een gefinancierd onderzoek, een heel groot gefinancierd onderzoek.”

Volgens Erik loopt de ook onderzoeksondersteuning op sommige vlakken nog achter. “Ik heb OceanParcels opgezet toen ik nog op Imperial College Londen werkte, en zij hebben me geholpen met het kiezen van een licentie. Echter, de Universiteit Utrecht heeft geen standaard policy voor het delen van softwarecode.” Het hebben van een geschikte licentie is van belang voor het waarborgen van het gratis hergebruik en aanpassen van de software.

De opslag van de onderzoeksdata is ook een knelpunt. “Ons probleem is dat we enorm veel data hebben, we zitten makkelijk aan de honderd terabyte.” De Universiteit Utrecht heeft een eigen data repository, genaamd YODA, waar deze hoeveelheden opgeslagen kunnen worden. Echter lost dat niet alle problemen van Erik op. “YODA kon niet gekoppeld worden aan de High Performance Computing systemen die wij nodig hebben.” ITS heeft dit inmiddels mogelijk gemaakt. Information Architect Maarten Hoogerwerf, onderdeel van het RDM Support netwerk, vertelt: “Uiteraard staat het onderzoek van Erik niet stil en heeft hij voorlopig een andere oplossing gevonden. Maar de behoefte van Erik heeft ons geholpen om dit ook voor andere onderzoekers mogelijk te maken.”

Ik heb de beste baan van de wereld
Erik van Sebille voor een scherm met afgebeelde oceaanstromingen
Erik van Sebille, foto's door Pieter van Dorp van Vliet

Social contract

In januari dit jaar heeft Erik de UU-Publiprijs mogen ontvangen vanwege zijn media optreden. Hij is op het gebied van plastic soep regelmatig in het nieuws geweest, en Erik is zeer actief op het gebied van wetenschapscommunicatie. Gepassioneerd vertelt hij over zijn drijfveren: “Ik investeer veel in het social contract dat bestaat tussen de samenleving en de universitaire wereld. Ik volg hier, met belastinggeld, mijn eigen onderzoeks-interesses. Ik heb de beste baan van de wereld, en ik bepaal zelf mijn agenda en mijn onderzoek. En dat doe ik omdat de samenleving denkt dat het een goed idee is als ik hier mijn onderzoek zit te doen. Daarom vind ik het op mijn beurt belangrijk om te laten zien wat ik hier doe. En te laten zien waarom het een goed idee is om geld te geven aan de wetenschap.”

De UU-Publiprijs stelt de winnaar in staat een video te maken over zijn onderzoek. “Deze prijs ga ik gebruiken om vlogs over ons onderzoek te maken voor het VMBO. In deze vlogs wil ik laten zien waarom wat ik doe belangrijk is en wat zij daarmee moeten.” Maar om een discussie te beginnen is er meer nodig: “Met mijn vlogs wil ik de scholieren stimuleren om terug te vloggen. Ik wil een platform maken waar al deze vlogs gedeeld kunnen worden. Het doel hiervan is om de scholieren aan het denken te zetten, en een hele discussie te beginnen.”

Cursus Reproducible Coding

Met OceanParcels als inpiratiebron werkt Research Data Management Support nu aan een introductieworkshop Reproducible Coding, een ééndagscursus die in het najaar van 2019 structureel gegeven zal worden. In deze workshop leer je goede gewoontes aan waardoor jouw code niet alleen door jou, maar ook door anderen gebruikt kan worden.

Meer informatie

Wil je meer informatie over het delen van een code, of over de diensten van Research Data Management Support? Of ben je geïnteresseerd in de workshop Reproducible coding? Kijk op onze website of neem contact op via info.rdm@uu.nl.