Razendsnel tekstuele data uitpluizen met ASReview
Versie 1.0 van de ASReview is 9 juni 2022 gelanceerd. Met ASReview, een van de grootste opensource-softwareprojecten aan de universiteit, kunnen gebruikers bij het uitpluizen van enorme hoeveelheden tekstuele data ontzettend veel tijd besparen. Rens van de Schoot, hoogleraar ‘Statistics for Small Data Sets’ aan de Universiteit Utrecht en initiatiefnemer van dit softwareproject: “Met ASReview kan de tijdsbesparing die je besteed aan het screenen van bijvoorbeeld systematische review, meta-analyse, of het ontwikkelen van een medische richtlijn wel oplopen tot 95%.” ASReview is inmiddels uitgegroeid tot een wereldwijde gemeenschap van onderzoekers, gebruikers en ontwikkelaars.
De wetenschappelijke artikelen stapelen zich op. Elke negen jaar verdubbelt de wetenschappelijke output. Van de Schoot: “Stel je voor dat je in deze almaar groeiende berg aan nieuwe kennis een medische richtlijn moet bijwerken. Of evidence-based beleid moet maken, of op zoek moet gaan naar nieuwe technologieën. Niemand heeft simpelweg genoeg tijd om al die wetenschappelijke literatuur te lezen.”
Teamprestatie
In de afgelopen jaren heeft een multidisciplinair team aan de Universiteit Utrecht een zogenoemde Open Source tool ontwikkeld en gevalideerd om literatuuronderzoek te ondersteunen bij het snel vinden van relevante artikelen: ASReview. Het team bestaat uit wetenschappers van uiteenlopende disciplines (statistiek, data science, geneeskunde) en uit onder meer IT-engineers en specialisten van de Universiteitsbibliotheek. Van de Schoot is verheugd dat ze samen tot dit resultaat zijn gekomen: “Het is echt een teamprestatie.”
Het ASReview-project is een schoolvoorbeeld hoe open science onderzoek verder kan helpen.
Open Science
Naast het onderhouden en bijwerken van de bètaversie heeft het team meer dan twee jaar gewerkt aan versie 1.0. Jonathan de Bruin, Research Software Specialist aan de Universiteit Utrecht: “Met achttien medewerkers hebben we meer dan 70.000 regels code geschreven, meer dan 500 bestanden gewijzigd, en honderden pagina's documentatie geschreven.” Softwareversie 1.0 is volledig opnieuw ontworpen volgens de laatste richtlijnen van Big-Techbedrijven. Van de Schoot: “Het beschikt ook over een simulatiemodus, zodat iedereen de prestaties van verschillende machine learning-modellen kan testen. Gebruikers kunnen zelfs hun eigen modellen toevoegen om te zien of deze beter presteren dan de beschikbare modellen.” Het ASReview-project is daarmee een schoolvoorbeeld van hoe open science onderzoek (en de ontwikkeling van softwareprojecten) verder kan helpen. Van de Schoot nodigt iedereen uit om mee te doen. “Op 1 juli hebben we een ASReview Users Meeting. En op onze blog vind je hoe je bij kunt dragen aan dit project.”