25 augustus 2017

Nieuwe online applicatie voor tekst en data mining in ontwikkeling

© iStockphoto.com/faithiecannoise
© iStockphoto.com/faithiecannoise

Steeds meer vakgebieden binnen de Universiteit Utrecht maken gebruik van tekst en data mining  technieken. Het Digital Humanities Lab bouwt aan een nieuwe online TDM-applicatie die gemakkelijker in gebruik is dan andere applicaties en meer flexibel.  

Tekst en data mining

Tekst en data mining (TDM) maakt het eenvoudiger om grote hoeveelheden online beschikbare data te onderzoeken en onderlinge verbanden vast te stellen. Met TDM is het bijvoorbeeld mogelijk systematisch onderzoek te doen naar bijvoorbeeld de inhoud van grote hoeveelheden kranten.

Nieuwe TDM-applicatie

Online oplossingen zoals Voyant bieden vaak beperkte functionaliteit. Offline applicaties zoals SPSS modeler van IBM, hebben vaak een steile leercurve.

Het Digital Humanities Lab van de faculteit Geesteswetenschappen bouwt nu aan een online tekst  en datamining applicatie, die online beschikbaarheid en gebruiksgemak combineert met flexibiliteit. De applicatie biedt voor onderzoekers de mogelijkheid om hun eigen corpus- en/of dataset snel te kunnen aanhaken. Er zijn al geslaagde experimenten uitgevoerd met grote reeksen jaarverslagen van financiële instellingen en een paar honderd jaargangen van de Engelse krant the Times.

Copyright

De applicatie biedt, omdat deze de mogelijkheid geeft om online maar afgeschermd gebruikt te worden, een oplossing voor copyright claims van bijvoorbeeld uitgevers. Toegang tot de bestanden van the Times bijvoorbeeld, zal mogelijk zijn voor onderzoekers van binnen de universiteit.