Digitale corpora

Als u op zoek bent naar gedigitaliseerde bronnen is de universiteitsbibliotheek een goed startpunt. Wij hebben licenties op een groot aantal e-books en digitale tekstcorpora, maar bieden ook toegang tot platformen waarmee deze (en andere) digitale tekstcorpora doorzocht kunnen worden. Dit geldt tevens voor een breed scala aan (audio)visuele corpora. 

De pagina zoeksystemen Geesteswetenschappen biedt een overzicht van de digitale tekst- en (audio)visuele corpora die gebruikt kunnen worden voor Digital Humanities-onderzoek.

  • Filter op de tag ‘text mining' voor de bestanden die beschikbaar zijn voor textmining.
  • Voor (audio)visuele bestanden filtert u op het soort bestand en kiest u ‘beeld en geluid’. 

Ruwe data

Van een aantal tekstcorpora heeft de bibliotheek de ruwe data beschikbaar via Yoda. Vervolgens kunt u de ruwe data bevragen met eigen tools.
Houd bij het gebruik van deze data rekening met de gebruiksvoorwaarden volgens de licentie. Alleen medewerkers van de Universiteit Utrecht mogen de data gebruiken. Vraag toegang via Yoda aan via bibliotheek@uu.nl

Van de volgende bestanden hebben we de ruwe data beschikbaar via Yoda:

  • Eighteenth Century Collections Online
  • Guardian & Observer (1791-1909 en 1910-2003)
  • Nineteenth Century U.K. Periodicals, Module 1
  • Times Digital Archives (1785-2011)
  • Times Literary Supplement (1902-2014)

Wilt u toegang tot de ruwe data die we al hebben, heeft u interesse in de data van e-books of andere tekstbestanden? Neem dan contact met ons op.

Van onderstaande bestanden kunnen we de ruwe data altijd voor u verkrijgen, maar die zijn nog niet in ons bezit:

  • Early English Books Online (1473-1700)
  • The Economist Historial Archive (1843-2015)
  • Entertainment Industry Magazine Archive
  • International Herald Tribune Historical Archive (1887-2013)
  • Nineteenth-century U.S. Newspapers