Ontbrekende gegevens

Ontbrekende waarden vormen een alomvattend probleem bij het analyseren van data. Neem bijvoorbeeld de vragenlijstonderzoeken in sociale wetenschappen of binnen de officiële statistiek waar respondenten bijvoorbeeld één of meerdere vragen kunnen overslaan of helemaal niet reageren. Populaire ad-hoc technieken, zoals het invullen van het gemiddelde, hebben ongewenste bijwerkingen en kunnen al snel leiden tot vertekening van de analyse resultaten.

Over ons

Onze missing data groep binnen de Universiteit Utrecht ontwikkelt oplossingen voor incomplete data problemen die juiste statistische eigenschappen opleveren. We ontwikkelen het robuuste en eenvoudig toe te passen Multivariate Imputation by Chained Equations (MICE) algorithme en maken onze oplossingen beschikbaar in het mice pakket in R. Mice bouwt voort op de gevestigde theorie van multiple imputation en richt zich erop de onzekerheid die wordt toegevoegd door de aanwezigheid van de ontbrekende waarden mee te nemen in de kwantitatieve analyse.

Mice heeft zich ontwikkeld tot de de facto standaard voor de wetenschappelijke analyse binnen domeinen als vragenlijstonderzoek, epidemiologie en klinische experimenten. Onze groep zal blijven werken aan snellere en betere imputatie algorithmes, gebruiksvriendelijke software en goed gedocumenteerde methodologien. Wij delen onze kennis door lezingen, cursussen en open-source samenwerking.

Huidige projecten

  • Mice: highly popular open-source R  software for solving missing data problems;
  • Ampute: software to simulate valid missingness mechanisms on multivariate data. See also the Vignette;
  • ShinyMice: model building and evaluation for MICE models.

Boeken

Betrokken onderzoekers