“Door de samenwerking met research engineers en data experts is dit een veel interessanter onderzoeksproject geworden”
Wat betekent research data management in de praktijk van een onderzoeker? In deze reeks interviews door RDM Support delen onderzoekers hun ervaringen over verschillende aspecten van research data management. In dit interview deelt ecoloog Joeri Zwerts hoe hij door middel van machine learning zijn onderzoek naar een hoger niveau brengt.
Joeri Zwerts vertelt: “Duurzame of verantwoorde houtproductie is vaak te herkennen door het Forest Stewardship Council (FSC) label. Maar heeft FSC-certificering eigenlijk wel een positief effect op de fauna in de betreffende bossen? Daar is nog erg weinig onderzoek naar gedaan, en met mijn onderzoek probeer ik die vraag te beantwoorden.” Joeri Zwerts is een PhD-er bij het departement Ecology and Biodiversity van de Faculteit Bètawetenschappen. Zijn onderzoeksdata bestaan uit video-opnames van cameravallen en geluidsopnames uit de jungle van Congo, Kameroen en Gabon. Met name voor het analyseren van de geluidsopnames heeft hij onder andere de hulp ingeschakeld van het Research Engineering team van RDM Support. “Je kunt uit die geluidsopnames een heleboel informatie halen. Maar het is niet te doen om alles terug te luisteren en handmatig te turven wanneer je een aap of ander dier hoort. Het Research Engineering team helpt mij om door middel van machine learning een applicatie te bouwen die dit werk voor mij doet.”
We hebben meer kunnen realiseren dan dat we afzonderlijk van elkaar hadden kunnen doen. Daarom moedig ik interdisciplinair werken enorm aan
Apengeluiden en machine learning
“Geluidsopnames hebben een veel groter bereik dan een cameraval. Als een dier in een boom zit zie je hem vaak niet, maar je kunt hem wel horen. Maar onderzoek doen naar biodiversiteit met behulp van geluidsopnames, acoustic monitoring, is nog een onderontwikkelde techniek, vooral op plekken waar veel omgevingsgeluid is zoals een regenwoud. Om dit onderzoek uit te voeren heb je bij uitstek een interdisciplinair project nodig. Ik ben ecoloog, en geen expert in machine learning. Daarvoor heb je research engineers en data science experts nodig, die op hun beurt geen expert in ecologie zijn. Door samen te werken met RDM Support en het focusgebied Applied Data Science hebben we onze krachten gebundeld, en is dit een veel interessanter project geworden. We hebben meer kunnen realiseren dan dat we afzonderlijk van elkaar hadden kunnen doen. Daarom moedig ik interdisciplinair werken enorm aan. Ik werk nu met machine learning modellen en de research engineers werken met apengeluiden. Dat zijn twee werelden die niet vaak raken, maar elkaar wel versterken. We leren ontzettend veel van elkaar.”
“Voor de ontwikkelde applicatie is een zelflerend algoritme nodig. Dit algoritme moet je trainen en daar heb je trainingsdata voor nodig. Hiervoor heb ik geluidsopnames gemaakt in opvangcentra voor dieren uit de jungle, waarbij ik de geluidsrecorders in de kooien heb opgehangen om zo grote aantallen vocalisaties per soort te verzamelen. Het zou natuurlijk fantastisch zijn als deze methode door meerdere mensen gebruikt zou kunnen worden, want de mogelijkheden zijn eindeloos. Niet alleen voor onderzoekers die de biodiversiteit willen onderzoeken, maar ook om bijvoorbeeld het geluid van geweerschoten van stropers te kunnen herkennen zodat de eco-surveillance beter aangestuurd kan worden. Daarom willen we deze methode open source publiceren, zodat andere partijen hun eigen trainingsdata kunnen inpluggen om deze applicatie vervolgens voor een ander doel in te zetten.”
Ondersteuning brengt onderzoek verder
“Het zou ideaal zijn als iedere onderzoeksgroep iemand heeft die fulltime beschikbaar is voor het begeleiden van codes schrijven en meekijken en denken over de mogelijkheden van een onderzoek. Want misschien kun je veel meer informatie uit je onderzoeksdata halen. Als startende onderzoeker heb je wel kennis van statistiek en programmeren, maar een expert ben je niet. Gaandeweg loop je tegen een probleem of vraag aan die wat complexer is en blijkt je kennis, of die van je onderzoeksgroep, niet altijd toereikend te zijn. Dit geldt zeker voor snel ontwikkelende technieken zoals machine learning. Als dit soort research engineering expertise aanwezig is binnen de onderzoeksgroep hoef je je als onderzoeker niet te laten beperken door ontoereikende kennis en vaardigheden over deze methoden. Met dit soort expertise kan RDM Support een toegevoegde waarde leveren.”
Applied Data Science
Dit onderzoeksproject is medegefinancieerd door het focusgebied Applied Data Science. Twee maal per jaar is er een call voor de Applied Data Science grants. Het gaat daarbij om kleine onderzoeksprojecten van maximaal 5000 euro die er op gericht zijn om onderzoekers te helpen met het toepassen van data science technieken in hun eigen onderzoek. Er wordt daarbij interdisciplinair samengewerkt tussen faculteiten en met RDM Support. Voor meer informatie over deze calls en een overzicht van de lopende projecten, neem een kijkje op de website van Applied Data Science.
Research Data Management Support
Ben je geïnteresseerd geraakt in de diensten van het Research Engineering team? Of wil je nog een andere RDM story lezen over hoe het Research Engineering team een onderzoeker heeft geholpen? Neem een kijkje op onze onze website, of neem contact met ons op. Wil je Joeri in actie zien in Congo?
Kijk dan op NPOplus naar Helden van de Wildernis.