Wat doe je bij ontbrekende data?

Wie empirisch onderzoek doet, kent het probleem van ontbrekende gegevens. Het analyseren van onvolledige data is ingewikkeld, tijdrovend en kan tot foutieve conclusies leiden. Daarom werken we in samenwerking met TNO aan nieuwe methoden om onvolledige gegevens te kunnen analyseren.

MICE

Al in de jaren negentig ontwikkelde TNO een computeralgoritme voor het vervangen van ontbrekende data door synthetische waarden, Multivariate Imputation by Chained Equations (MICE). Dat vervangen van data noemen we imputatie. Wetenschappers gebruiken dit MICE-algoritme bij missingdata-problemen in echte data. De UU onderzoekt nu de statistische eigenschappen van dit algoritme, om het te kunnen verbeteren. Er zijn al twee proefschriften en meerdere researchmasteronderzoeken aan gewijd. In de toekomst wordt MICE omgevormd tot een methode voor het schatten van individuele causale effecten. Dan kan MICE een gedegen methode worden voor gepersonaliseerd advies.

We werken aan methoden om onvolledige data te analyseren

Samenwerking

M&S werkt hierin samen met: