Van stoffige archieven naar de cloud: Een data-Odyssee

Terwijl de technologie voortschrijdt, dreigen gegevens op oude gegevensdragers zoals floppydisks en zipdrives, technologisch verouderd en ontoegankelijk te worden. Maar ook die verborgen schatten kunnen weer tot leven gewekt worden. Lees hier hoe Martin Wassen (SD) met behulp van het Geo Data Team een schat aan gegevens van veertig jaar werk kon terughalen.

Als jonge onderzoeker had Wassen al belangstelling voor ecologie en milieu. Hij nam deel aan talloze projecten. Eén ervan vond plaats in het westen van Siberië, een regio die vergelijkbaar is met Nederland maar op dat moment nog volledig onaangetast was. "We werden vanuit een helikopter gedropt in een gebied waar geen telefoons of andere communicatielijnen waren. De piloot vertelde dat hij ons over twaalf dagen weer op deze plek in the middle of nowhere zou oppikken. Wetenschap bedrijven was toen niet helemaal hetzelfde als nu, vooral als het ging om het gebruik van technologie om gegevens te verwerken. We verzamelden gegevens en zetten die op ponskaarten. De kaarten bewaarden we in een schoenendoos die je dan in Nederland op de fiets naar het computercentrum 12 km verderop bracht. Als er onderweg iets misging, raakte alles in de war. Na het inleveren duurde het ongeveer twee weken voordat je iets kreeg wat je kon verwerken.”

Rond 1988 hadden we één draagbare pc op de afdeling.

Van koffer naar smartphone

“Rond 1988 hadden we één draagbare pc op de afdeling. Het was net een koffer met een klein scherm en een groen lettertype. Je moest je aanmelden om hem te kunnen gebruiken. Dus we moesten altijd coördineren wie die computer in het weekend mocht gebruiken om aan zijn proefschrift te werken”, vertelt Wassen. “Pas in de jaren erna kreeg je op de afdeling computers met een grotere opslagcapaciteit en met een Unix-systeem. Pc’s gebruikte je in die tijd alleen om te e-mailen. Je kunt je afvragen waarom je die oude gegevens nog zou willen bewaren, maar juist dit soort gegevens documenteren de toestand van het milieu op dat moment. Dat is juist heel belangrijk bijvoorbeeld met het oog op klimaatverandering."

Vier decennia aan gegevens

Vorig jaar startte het project waarin het Geo Data Team deze waardevolle onderzoeksgegevens ophaalde, die Martin Wassen in de loop van vier decennia had verzameld. Maisam Mohammadi Dadkan, data steward bij het Geo Data Team, vertelt: ‘Toen we dozen vol diskettes, zipdrives en andere datadragers ontvingen wisten we, dat het grootste probleem was om geschikte apparaten te vinden om deze verouderde opslagmedia te lezen. Daarnaast was het nog maar de vraag of ze het nog zouden doen, gezien hun leeftijd.”  

Een museumstuk

Het duurde enkele maanden om geschikte hardware te vinden en een systeem op te zetten dat gegevens van diskettes en zip-disks kon lezen. Verrassend genoeg bleken de meeste diskettes in goede gezondheid en werden de gegevens met succes opgehaald. Cd's en dvd's bleken daarentegen minder robuust dan de floppy- en zipdrives. Een aanzienlijke hoeveelheid gegevens stond ook op magnetische banden. Om deze gegevens nog op te halen moest het Geo Data Team echt out-of-the-box denken. Ze vonden in het Home Computer Museum in Helmond een geschikte bandlezer.

Toen we dozen vol diskettes, zipdrives en andere datadragers ontvingen wisten we, dat het grootste probleem was om geschikte apparaten te vinden om deze verouderde opslagmedia te lezen.

Meer dan alleen data afstoffen

Alle opgehaalde data werd geconverteerd en gearchiveerd in moderne cloud-datarepositories, waarbij we gelijk ervoor zorgden dat ze voldeden aan de FAIR-principes (Findable, Accessible, Interoperable en Reusable). “Het mooie van dit project is, dat het team data niet alleen ophaalt en overzet, maar ook gelijk in open-source en interoperabele formaten verandert. Elke byte telt! Of het nu gaat om oude diskettes, floppies of cd-roms. Onderschat de kracht van het verleden niet - het kan de sleutel zijn tot toekomstige doorbraken. Ik ben blij dat mijn onderzoeksdata niet verloren gaat en ook lang na mijn pensioen nog kan bijdragen aan onderzoek in de milieuwetenschappen”, aldus Wassen.

Meer informatie

Wilt u advies over het extraheren van uw oude onderzoeksgegevens? Neem dan contact op met RDM Support. Zij kunnen samen met u de mogelijkheden bekijken en u tips geven over hoe u te werk kunt gaan.