Lintopdrachten overslaan
Verdergaan naar hoofdinhoud
Universiteitsbibliotheek Utrecht

Een toekomst voor digitaal geesteswetenschappelijk onderzoek

Verslag van het symposium 

Een toekomst voor digitaal geesteswetenschappelijk onderzoek 

Op 11 juni 2010 organiseerden de Universiteitsbibliotheek Utrecht en het Descartes Centre van de Universiteit Utrecht, in samenwerking met Data Archiving and Networked Services (DANS), Digitaal Erfgoed Nederland (DEN) en de universiteitsbibliotheken van Gent en Leiden een symposium over tekstgerichte, digitale bronnen in de geesteswetenschappen en welke mogelijkheden die bieden voor computationele analyses.

Van het symposium vindt u hier een kort verslag, de conclusies en de voorgenomen vervolgstappen.

 Een toekomst voor digitaal geesteswetenschappelijk onderzoek

(Een kort verslag en enkele belangrijke conclusies en afspraken)

 

Onder deze titel werd op 11 juni 2010 door de Utrechtse Universiteitsbibliotheek en het Descartes Centre van de Universiteit Utrecht in samenwerking met Data Archiving and Networked Services (DANS), Digitaal Erfgoed Nederland (DEN) en de universiteitsbibliotheken van Gent en Leiden een symposium georganiseerd over tekstgerichte, digitale bronnen in de geesteswetenschappen en de mogelijkheden die ze bieden voor computationele analyses.

 

Waarom

Er komen steeds meer (oude) teksten vrij beschikbaar via het internet. Veel bibliotheken en archieven maken delen van hun oude collecties digitaal toegankelijk. Daarnaast wordt sinds enkele jaren door Google een aantal grote bibliotheekcollecties gedigitaliseerd en wordt de digitalisering van de totale Nederlandse boekproductie voorbereid (Libratory). Bovendien slaan CLARIN EU en NL (http://www.clarin.nl/node/4) hun vleugels uit en ontwikkelen vertrouwde KNAW-instellingen als DANS (http://www.dans.knaw.nl) en VKS (http://virtualknowledgestudio.nl/) allerlei initiatieven.

 

Wie

De sprekers en de veertig overige deelnemers aan het symposium waren afkomstig uit drie groepen:

1. Wetenschappers uit de humaniora. In deze groep was er een speciale rol weggelegd voor taaltechnologen die technieken beschikbaar kunnen maken om grote hoeveelheden talige data efficiënt te analyseren

2. Technici: degenen die zicht op de (toekomstige) mogelijkheden en de beperkingen kunnen geven.

3. Collectiebeheerders (bibliothecarissen, conservatoren): degenen die moeten toezien op een zorgvuldige digitalisering en kunnen optreden als intermediairs tussen technici en wetenschappers.

 

Er waren vijf bijdragen. Twee gingen over de aanbodkant (Inge Van Nieuwerburgh, UB Gent / Google-partner en Saskia van Bergen, UB Leiden / Libratory), een over de vraagzijde (Wijnand Mijnhardt, Descartes Centre Universiteit Utrecht), een over de interface van ICT-specialisten (Dirk Roorda, DANS), en een van taaltechnologen die de schakel vormen tussen leveranciers en onderzoekers (Jan Odijk, Universiteit Utrecht).

 

Algemeen

De veronderstelling dat er nog veel langs elkaar heen wordt gewerkt, werd tijdens het symposium bevestigd. De deelnemers waren dan ook unaniem van mening dat met het oog op een heldere infrastructuur een betere en frequentere afstemming van activiteiten op elkaar noodzakelijk is. Over de vraag of digitaliseringsprojecten niet beter vraaggestuurd in plaats van aanbodgestuurd kunnen zijn, waren de meningen enigszins verdeeld. Maar onderzoekers en hun studenten in de geesteswetenschappen zijn nog lang niet voldoende doordrongen van de mogelijkheden die dit digitale materiaal hun biedt, en ICT’ers, collectiebeheerders en onderzoekers begrijpen elkaar lang niet altijd. Daaraan twijfelde niemand.

 

Conclusies en afspraken

 

Algemeen

-         Vind niet opnieuw het wiel uit en ga op zoek naar best practices.

-         Maak gebruik van show cases: laat zien welke resultaten zijn geboekt.

-         Werk samen.

 

Onderwijs

-         Het geesteswetenschappelijk onderwijs aan de universiteiten is volstrekt onvoldoende georiënteerd op de snel groeiende mogelijkheden van de “computational humanities”. Digitale tekstanalyse moet dan ook in het curriculum van de universiteiten worden opgenomen. Daarbij is het noodzakelijk dat onderzoekers een inhaalslag maken en hun studenten enthousiasmeren tot het verkennen van de vele mogelijkheden.

-         Het is niet de bedoeling om ICT’ers van de studenten te maken, maar ze moeten wel leren om toepassingen te gebruiken en vooral om de juiste (andere) vragen te stellen. Basale kennis van wiskunde en statistiek lijkt echter noodzakelijk.

-         Het is van wezenlijk belang dat de onderwijsdirecteuren van geesteswetenschappelijke opleidingen van het nut en de noodzaak van digitale technieken doordrongen worden.

 

Techniek

-         CLARIN werkt onder andere aan laagdrempelige toepassingen om het digitaal geesteswetenschappelijk onderzoek eenvoudiger te maken. De afstand tussen techniek en geesteswetenschappen kan daarmee verkleind worden. Belangrijk bij de ontwikkeling van deze instrumenten is het gebruik van show cases.

 

Digitalisering

-         Massadigitalisering van (tekstueel) cultureel erfgoed zou een nationale, of beter internationale aangelegenheid moeten zijn.

-         Universitaire bibliotheken kunnen zich dan in samenwerking met de geesteswetenschappelijke onderzoekers en technici bekommeren om de verrijking van het digitale en gedigitaliseerde materiaal.

-         Bibliotheken zullen (blijven) zorgen (bewaren en beschikbaar stellen) voor het digitally born materiaal.

-         Teksten moeten niet alleen op woordniveau doorzocht kunnen worden, maar dienen ook geschikt te zijn voor analyses waarvoor grotere rekenkracht nodig is.

 

Samenwerking

-         Libratory biedt de mogelijkheid van één digitaal totaalcorpus van de (bijzondere) collecties van alle wetenschappelijke bibliotheken en de KB (de gehele UKB) en zal hopelijk in de nabije toekomst een grote rol gaan spelen. Het project kan, evenals CLARIN, ervoor zorgen dat communicatie tussen de verscheidene, bij digitalisering betrokken organen zoals onderzoekers, docenten, ICT’ers, bibliotheken en taal- en spraaktechnologen kan worden verbeterd en gestroomlijnd.

-         Het digitaal geesteswetenschappelijk onderzoek zal zeer gebaat zijn bij de resultaten van het onderzoek dat in geesteswetenschappelijke laboratoria verricht zal worden. Het geleerdenbrieven project van het Huygens Instituut waarin geesteswetenschappers, technici en collectiebeheerders samenwerken (collaboratory) is daar een goed voorbeeld van.

-         Er zou een vaste groep moeten komen die applicaties maakt voor alle repositories zodat deze interdisciplinair compatibel zijn. Samenwerking tussen alle partijen is daarbij onontbeerlijk en Open access voorwaardelijk.

Het symposium werd afgesloten met de oprichting van een kerncommissie, bestaande uit medewerkers van diverse universiteiten en wetenschappelijke onderzoeksinstellingen die de conclusies van het symposium omwerken tot een plan van aanpak dat een toekomst voor digitaal geesteswetenschappelijk onderzoek zal vormgeven.

 

De deelnemers die zich voor deze commissie hebben opgegeven zijn:

Jan Odijk (UU en CLARIN), Marike van Roon (UB UvA), Wijnand Mijnhardt (UU, Descartes Centre), José de Kruif (UU), Hans Mulder (UB Utrecht), Dirk Roorda (DANS), Maarten Steenhuis (UB Leiden). Huib Zuidervaart (Huygens Instituut), Adriaan van der Weel (UL). En ondertussen heeft ook Paul Doorenbosch (KB en NWO-CATCH) zich bij deze groep gevoegd.

 

Wijnand Mijnhardt en Hans Mulder stellen voor dat de deelnemende universiteiten Leiden, Amsterdam (UvA) en Utrecht elk een deelcommissie benoemen. Die deelcommissie zal binnen de eigen universiteit een pilot project uitvoeren. Het doel van dat project is het opzetten van een cursus digitaal geesteswetenschappelijk onderzoek op bachelorniveau. 
 

 Bijlage

 Hieronder vindt u de stellingen die door de sprekers naar voren werden gebracht om het debat op gang te brengen.

 Wijnand Mijnhardt

  1. Het geesteswetenschappelijk onderwijs aan de universiteiten is volstrekt onvoldoende georiënteerd op de snel groeiende mogelijkheden van de “computational humanities”. Na de database revolutie dreigen de geesteswetenschappen nu ook de boot van de digitale tekstanalyse te missen.

 

  1. Studenten kiezen niet zelden voor geesteswetenschappelijke vakken omdat de interesse voor wiskunde en statistiek ontbreekt. In de Bachelorfase moeten studenten daarom tot deze vakken worden verleid, in de MA/RMA fase moeten ze ertoe worden verplicht.

 

  1. Willen de “computational humanities” een vaste voet verwerven in het wetenschappelijk onderwijs en onderzoek, dan kunnen de Nederlandse wetenschappelijke bibliotheken en archiefbewaarplaatsen niet volstaan met het aanbieden van raadpleegbare digitale edities van hun bezit. Dat dient ook doorzoekbaar te zijn en rekenkundige bewerkingen toe te laten.

 

  1. De digitale revolutie zal het individualistisch karakter van het geesteswetenschappelijk onderzoek grondig veranderen.

 

  1. De digitale revolutie in de geesteswetenschappen heeft ingrijpende consequenties voor de onderzoeksfinanciering. Een forse verhoging van de infrastructurele budgetten is hierbij een eerste vereiste.

 

Dirk Roorda

  1. ICT voor geesteswetenschappelijk onderzoek kan een paar tandjes hoger.

 

  1. De eerste versnelling was: online toegang tot bronnen voor personen.

 

  1. De tweede versnelling is: samenwerken in annoteren en verrijkt publiceren.

 

  1. De derde versnelling zal zijn: al het materiaal beschikbaar voor intensieve rekenprocessen.

 

Jan Odijk

  1. Taaltechnologie en spraaktechnologie bieden grote mogelijkheden om grote hoeveelheden data (tekst en spraak, het materiaal waar geesteswetenschappers mee werken) te ontsluiten.

 

  1. De hoeveelheid beschikbare data is zeer groot en zal alleen maar groeien. Uitgebreide analyse is alleen mogelijk met behulp van digitale technieken.

 

  1. Dat is echter alleen mogelijk op grote schaal en alleen bruikbaar voor geesteswetenschappelijke onderzoekers indien de taaltechnologische tools en de data naadloos op elkaar aansluiten, d.w.z. compatibel met elkaar qua vorm en betekenis (interoperabel zijn), en op eenvoudige wijze (zonder dat uitgebreide technische kennis noodzakelijk is) beschikbaar komen.

 

  1. Daarom is een gezamenlijke inspanning van taaltechnologie-ontwikkelaars en geesteswetenschappers om tot overeenstemming te komen over de daarvoor benodigde standaarden voor formele en semantische interoperabiliteit vereist.

 

  1. Bestaande data en tools moeten aangepast worden aan deze standaarden, en het maken van nieuwe onderzoeksdata en tools volgens deze standaarden moet systematisch als verplicht onderdeel in onderzoeksprojecten ingebouwd worden, gestimuleerd worden door universiteiten en afgedwongen worden door subsidiërende instanties, en activiteiten hiervoor dienen gesubsidieerd te worden!

 

  1. Studenten en jonge onderzoekers moeten vertrouwd gemaakt worden met deze nieuwe manier van werken door deze aanpak al in het normale curriculum te onderwijzen en hen er mee te laten werken.

 

  1. Onderzoekers moeten de attitude aannemen dat in door de overheid gesubsidieerde onderzoeksprojecten onderzoeksdata, onderzoeksresultaten en ontwikkelde tools maximaal vrij beschikbaar gesteld moeten worden aan de gemeenschap, in een omgeving die hergebruik door andere onderzoekers eenvoudig toelaat.

 

Inge Van Nieuwerburgh

  1. Zonder pps (publiek-private samenwerking) is massadigitalisering niet mogelijk.

 

  1.  Er moet meer aandacht zijn voor de preservering / duurzame ontsluiting van digital born materiaal dan voor digitalisering (het zwarte gat van de eeuwwisseling 2000).

 

  1. Open access van onderzoeksresultaten is een cruciale voorwaarde (open data).

 

  1. Mediawijsheid / datamanagement moeten een belangrijk deel uit maken van curricula (doorheen hele onderwijsloopbaan).

 

Saskia van Bergen

  1. Zonder digitalisering dreigt het verleden uit de collectieve herinnering te verdwijnen.

 

  1. Libratory is als de deeltjesversneller voor de Geesteswetenschappen. Zonder Libratory geen vernieuwing van het Geesteswetenschappelijk onderzoek.

 

  1. Collectiebeheerders zouden de digitalisering van het eigen bezit ondergeschikt moeten maken aan het streven naar één digitaal corpus voor onderzoekers, ongeacht het materiaaltype. Om dit te realiseren is meer samenwerking en afstemming noodzakelijk.

 

  1. De oude gedrukte werken in Nederlandse wetenschappelijke bibliotheken behoren tot het publieke domein en behoren dat ook in de digitale wereld te zijn en te blijven.

 

  1. Onderzoekers en studenten hebben geen baat bij een digitale bibliotheek alleen. Om innovatief onderzoek mogelijk te maken dient deze bibliotheek deel uit te maken van een interactieve onderzoeksomgeving.

 

 

Share |