Hackathon: e-mails tussen overheid en Shell doorspitten

Onderzoeksjournalisten van platform Follow the Money willen de verwevenheid tussen Shell en de Nederlandse overheid achterhalen. Met beroep op de Wet openbaarheid van bestuur (Wob) heeft Follow the Money een enorme hoeveelheid aan communicatiedocumenten verworven. De documenten bestaan onder meer uit e-mails, memo’s, beleidsstukken en zelfs WhatsAppjes van de overheid gericht aan, of handelend over, Shell. Hoe kan zo’n overvloed aan documenten zo snel mogelijk doorgespit worden? Daartoe heeft Rens van de Schoot, hoogleraar ‘Statistics for Small Data Sets’ aan de Universiteit Utrecht, een hackathon georganiseerd.

We zetten onze software in om zo efficiënt mogelijk de zogenoemde Shell Papers door te spitten.

Hoe vind je in duizenden documenten precies wat je zoekt, zonder ze allemaal te moeten lezen? Van de Schoot heeft met zijn Open-Sourceproject ASReview slimme software ontwikkeld om grote datasets snel en efficiënt door te kunnen spitten. Oorspronkelijk was de software ontwikkeld om, binnen de wetenschappelijke literatuur, systematische reviews te doorzoeken. De hoogleraar publiceerde hierover in het tijdschrift Nature Machine Intelligence. Van de Schoot: “Maar de software kan in principe alle soorten teksten verwerken. Daarom gaan we nu onze software inzetten om Follow the Money te helpen om zo efficiënt mogelijk de zogenoemde Shell Papers te doorzoeken. Met onze hackathon helpen we het journalistenplatform om relevante documenten eerder te vinden door gebruik te maken van actief leren in plaats van het willekeurig lezen van alle documenten.”

Girl behind computer

26 tot 28 november

De hackathon vindt online plaats, van vrijdagavond 26 november tot zondagmiddag 28 november en wordt gecoördineerd door Sofie van den Brand. Van de Schoot geeft aan dat iedereen die wil, mee kan doen. “Je kunt je eigen planning volgen tijdens het weekend: je hoeft natuurlijk niet het hele weekend te hacken als je daar geen zin in hebt.” De Utrechtse hoogleraar vindt dat de hackathon ook bedoeld is om de vaardigheden van de deelnemers te verbeteren. “En het is een goede manier om je Open Science skills te verbeteren aangezien we alles openbaar via Github zullen ontwikkelen. Daarnaast is het een leuke manier om nieuwe mensen te ontmoeten, zoals de data-journalisten van Follow the Money, of onze eigen experts van het Open Science Programma.”

De hackathon is tevens de lancering van de Special Interest Group Active Learning (SIG-AL), die valt onder zowel het focusgebied Applied Data Science als onder Human-centered Artificial Intelligence. Van de Schoot: “Met deze nieuwe SIG brengen we alle aspecten van Active Learning bijeen. En iedereen is welkom aan te sluiten."