Het verkennen van de potentie van datadonatie

Interview met Karin van Es en Dennis Nguyen

Datadonatie biedt een nieuwe en unieke aanpak voor het verzamelen van digital trace data, waardoor onderzoekers niet worden gehinderd door de beperkingen van platforms. Een consortium van zes Nederlandse universiteiten is begonnen met het opzetten van een eigen digitale datadonatie-infrastructuur. Binnen dit initiatief voeren Karin van Es en Dennis Nguyen van de Faculteit Geesteswetenschappen aan de Universiteit Utrecht, ondersteund door Laura Boeschoten (UU) en Niek de Schipper (UvA) van het nationale D3I team, twee pilotstudies uit: één gericht op het videodeelplatform Netflix, en de andere op de AI-chatbot ChatGPT. In dit interview lichten Karin van Es en Dennis Nguyen de betekenis van het project toe.

Waarom is een platform voor datadonatie nodig?

Karin van Es: 'Het wordt steeds moeilijker voor onderzoekers om toegang te krijgen tot online gedragsdata, omdat grote techbedrijven en online platforms de toegang tot hun data beperken. De digitale datadonatie-infrastructuur D3I, gefinancierd door PDI-SSH D3I, helpt onderzoekers deze uitdaging aan te gaan door deelnemers te vragen hun 'digitale sporen' te doneren voor onderzoeksdoeleinden.'

Wat zijn datadonaties?

Van Es: 'Onder de Algemene verordening gegevensbescherming (AVG) hebben individuen het recht om een kopie te verkrijgen van hun persoonlijke gegevens die wordt bewaard door data processors, ontvangen als Data Download Packages (DDP's) in bestanden. Datadonaties bieden een nieuwe methode voor het verzamelen van gegevens, waardoor onderzoekers toegang krijgen tot digital trace data die aan hun project zijn gedoneerd door deelnemers. Deelnemers vragen en delen hun DDP's met onderzoekers door ze naar hun apparaten te downloaden. Ze doneren niet alle data, maar alleen de kenmerken die interessant zijn voor de onderzoeker. Bovendien kunnen deelnemers selecteren welke data ze uiteindelijk willen doneren. Deze methode voor dataverzameling opent nieuwe mogelijkheden voor academisch onderzoek, terwijl tegelijkertijd ethische maatregelen worden genomen om verantwoorde datapraktijken te waarborgen. Door deze techniek te benutten, krijgen wetenschappers toegang tot datasets die eerder ontoegankelijk waren.'

Wat onderzoeken jullie met de pilotstudies?

Van Es: 'Voor de eerste pilot hebben we 129 Netflix DDP's en enquêtes ontvangen met de hulp van het panelwervingsbedrijf Ipsos I&O. Netflix wordt vaak geprezen om haar verstoring van het traditionele medialandschap door haar geavanceerde dataverzameling en -analysemogelijkheden, en de effectiviteit van haar aanbevelingssysteem. De implicaties van deze innovaties worden echter nog niet volledig begrepen. Traditioneel bewaakt Netflix haar kijkcijfers nauwlettend, maar er is recentelijk een verschuiving op naar meer transparantie opgetreden. Toch delen ze nog steeds alleen informatie die ze willen delen. Zo behoudt Netflix controle over het narratief waarmee ze het publieke begrip van binge-watching, de populariteit van inhoud en diversiteit binnen haar catalogus vormt. Hoe kunnen wij dan kritisch deze praktijken onderzoeken? Onze pilot onderzoekt kritisch de verhalen van Netflix, daagt haar selectieve transparantie uit en werpt licht op de dynamiek van streamingconsumptie.

Dennis Nguyen: 'We zijn momenteel bezig met het opzetten van de tweede pilot, waarbij we ons richten op het verkrijgen van ChatGPT DDP's van universiteitsstudenten. We onderzoeken hoe we dit onderzoeksproject op de meest ethisch verantwoorde manier kunnen uitvoeren met input van de privacyfunctionaris en de ethische commissie. De impact van ChatGPT op leerdoelen en onderwijsbenaderingen, zowel in de klas als in de academische wereld in het algemeen, zorgt voor intrigerende vragen. Wat ontbreekt in de cyclus van hype en angst over GenAI in het onderwijs is empirisch onderzoek naar de situatie in de praktijk. Hoe studenten het gebruiken in verschillende contexten is slechts voorzichtig onderzocht, voornamelijk via enquêtes. Er is beperkt onderzoek beschikbaar over hoe ze GenAI-diensten, zoals ChatGPT, voor studiegerelateerde doeleinden waarnemen en benutten. Het onderzoeken van studenteninteracties via hun daadwerkelijke data, verzameld door ChatGPT/OpenAI, opent nieuwe paden voor een beter begrip van hoe GenAI het hoger onderwijs vanuit een studentenperspectief betreedt.'

Wat is de volgende stap?

Nguyen: 'Tot nu toe vinden we de mogelijkheden erg bemoedigend en kijken we ernaar uit om daadwerkelijk met de data te werken. We zijn benieuwd naar verdere verkenning van de bereidheid van deelnemers om te doneren aan onderzoek en de kwaliteit van de beschikbare data. Het ultieme doel van dit project is om deze methode breder beschikbaar te maken voor andere onderzoekers. Steeds meer materialen, waaronder procedures voor ethische goedkeuring en databeheer, zullen online beschikbaar worden gesteld ter ondersteuning van anderen die datadonaties gebruiken voor onderzoeksprojecten in de toekomst.'

Over

Karin van Es is Affiliate en Impact Specialist bij het Centre for Digital Humanities (CDH). Ze werkt als universitair hoofddocent Media- en Cultuurwetenschappen aan de Universiteit Utrecht en maakt deel uit van de GenAI in Education Humanities taskforce.

Dennis Nguyen is universitair docent in computationele methoden en digitale geletterdheid bij Media- en Cultuurwetenschappen aan de Universiteit Utrecht.

Meer lezen over data donatie? Bezoek het D3I symposium op 30-31 mei 2024 aan de Universiteit van Amsterdam, waar ook een korte cursus wordt gegeven over hoe je een studie naar data donaties kunt voorbereiden.