6 juli 2018

Puzzelen met data

“Eigenlijk ben ik de hele dag door allerlei puzzels aan het oplossen.” Ron Scholten is datamanager bij Research Data Management Support. “Daarnaast kijk ik hoe je processen beter kunt stroomlijnen. Voor wetenschappers heeft datamanagement een hele grote toegevoegde waarde. Bij het verwerken van de data ondersteunen we ze, zodat zij zich kunnen focussen op de kern van hun werk.”

“Binnen het YOUth-onderzoek help ik bij verschillende generieke vraagstukken waar onderzoekers tegenaan lopen. Langzamerhand specialiseer ik me ook binnen het project waar ik nu voor werk.” Ron Scholten is lid van de datamanagerspool. Vanuit die pool worden datamanagers tijdelijk gedetacheerd bij een faculteit of onderzoeksproject om daar te helpen met vraagstukken over datamanagement. Scholten werkt vanuit die pool drie-en-een-halve dag per week bij het KinderKennisCentrum in De Uithof. Hij werkt daar mee aan dit groots opgezette onderzoek.

Een paraplu voor onderzoek

“YOUth kun je zien als een soort brede paraplu. Hieronder valt onderzoek dat de wisselwerking tussen hersenontwikkeling en omgevingsinvloeden enerzijds en gedrag anderzijds belicht. Gedrag is de te verklaren variabele. Maar YOUth is in die zin ook heel anders. Normaliter heb je een onderzoeksvraag en daar zoek je data bij. De onderzoekers verzamelen veel data met als doel te ontdekken hoe hersenen en gedrag elkaar beïnvloeden. De precieze toekomstige onderzoeksvragen, die moeten nog gedefineerd worden. Ze moeten wel onder die brede paraplu vallen die ik net schetste.”

Van zwangerschap tot pubertijd

“Bij YOUth help ik bij het verzamelen van data die voortvloeit uit allerlei experimenten die onderzoekers daar doen. YOUth onderscheidt twee cohorten: een die loopt vanaf de zwangerschap tot het moment dat het kind zes of zeven jaar is, de ander start als kinderen acht of negen jaar oud zijn. Deze kinderen doen mee tot hun vijftiende of zestiende levensjaar. De ouders maken ook deel uit van de onderzoekspopulatie. In totaal verzamelen de onderzoekers data bij 3000 ouders en hun kind, voor het tweede cohort, dat bij negen jaar begint, zoeken zij in totaal ook 3000 kinderen met hun ouders.”

YOUth onderzoek

“Van de kinderen en ouders verzamelen de onderzoekers uit allerlei experimenten data: zo krijgen zwangere vrouwen bij twintig en bij dertig weken een echo, waarbij onder meer de grootte van de hersenen wordt gemeten. De kinderen doen mee aan experimenten zoals eeg- en MRI-metingen, waarmee hersenactiviteit wordt gemeten. Daarnaast vullen deelnemers online verschillende vragenlijsten in. Van zowel ouders als kinderen wordt ook biologisch materiaal als wangslijmvlies en bloed verzameld. De momenten waarop ouders en kinderen voor een onderzoek komen, noemen we waves. Zo’n meetmoment is bijvoorbeeld bij twintig weken, vijf maanden of twaalf jaar. Gedurende het baby- en kindcohort doen ouders en kinderen op zeven momenten mee aan onderzoeken, bij het kind- en tienercohort is dat driemaal. Zo’n wave bestaat dan uit verschillende experimenten.”

“Uit al die onderzoeken komt heel veel data. Mijn collega Danny de Koning, die twee dagen per week voor YOUth werkt, en ik zorgen dat die data in een beveiligde omgeving terechtkomt. Dat komt nu veelal binnen op allerlei lab computers. Wij zorgen dat het wordt geüpload naar Yoda. Yoda staat voor ‘your data’, een opslagplek gecreëerd door de Universiteit Utrecht. Wij zorgen er dus voor dat data netjes en op een veilige en consistente manier opgeslagen wordt.”

Data in pakketjes

“Daarnaast controleren wij of de data volledig is. Van alle onderzoeken die bij YOUth gebeuren, heb je pas goede data als je een soort datapakketje hebt, waar meerdere bestanden in zitten. Deze bestanden hebben elkaar nodig, wil er sprake zijn van data waarmee verder onderzoek kan worden gedaan. Wij checken of alle bestanden in het pakket zitten die erin horen.”

“De onderzoeker is verantwoordelijk voor de datakwaliteit. Data kan kwalitatief minder zijn wanneer bijvoorbeeld het licht in het lab niet goed is of als een kind van vijf maanden oud zich niet kan concentreren bij een experiment. De onderzoeker probeert tijdens periodieke kwaliteitscontroles, waarvoor wij weer de data aanleveren, die kwaliteit van de data zo goed mogelijk te borgen.”

Privacy

“De onderzoekers verzamelen dus heel veel informatie, ook informatie die privacygevoelig is, zoals biologisch materiaal of MRI-scans. Om die data te mogen gebruiken, vragen de onderzoekers de ouders iedere keer dat data verzameld wordt, om informed consent. Het is belangrijk dat de data niet traceerbaar is naar onze deelnemers. YOUth gebruikt daarom een pseudocode om ze te identificeren. Er wordt geen persoonlijke informatie gebruikt, zoals NAW-gegevens of een geboortedatum.”

“De AVG is eind mei in werking getreden. Daar weet ik wel iets van af, maar vaak klop ik aan bij de specialisten van RDM Support om hen te consulteren. Of ik neem contact op met juridische zaken van de Universiteit Utrecht over vragen rondom privacywetgeving. Als we ergens zelf niet voldoende kennis van hebben, dan is het ook zaak dat je weet waar je die kennis vandaan kunt halen en dat je dat dan samen met die mensen allemaal uitvogelt.”

Vastbijten in een vraagstuk

“Ik vind het leuk om met wetenschappers te overleggen hoe zij het liefst hun data aangeleverd krijgen. Zo zijn we faciliterend voor de onderzoekers. Soms ben je gewoon hele kleine dingen aan het oplossen waar je dan toch heel lang mee bezig bent. Dus je moet je wel echt vast kunnen bijten en willen bijten in de data die je hebt.”

Wilt u ook werken als datamanager?

Research Data Management Support heeft momenteel drie vacatures open staan: het team zoekt twee consultants en een datamanager. Interesse? Surf dan naar www.uu.nl/vacatures en reageer voor 10 juli.