“Via het netwerk leren onderzoekers elkaars expertise kennen”
Jeroen Salman was tussen 2016 en 2018 projectleider van EDPOP. Welke digitale technieken heeft hij daarbij ingezet? En wat was de rol van de Universiteitsbibliotheek Utrecht en het Software Research Lab van het Centre for Digital Humanities (CDH) bij dit project? En is zo’n rol ooit uitgespeeld?
Internationaliseringsproject EDPOP (European Dimensions of popular print culture) is een onderzoeksproject dat met innovatieve middelen onderzoek doet naar populair drukwerk uit de vroegmoderne tijd (1450-1900). Denk hierbij aan centsprenten, almanakken, pamfletten. Aangezien dit drukwerk in de landstaal was geschreven, is lange tijd aangenomen dat populaire cultuur lokaal, regionaal, hooguit landelijk georiënteerd was. Internationaliseringsproject EDPOP doet vergelijkend onderzoek naar de Europese connecties die er wel degelijk blijken te zijn.
Jeroen Salman: "Ik wilde een internationaal netwerk samenstellen op het gebied van populair drukwerk. Ik heb een aanvraag ingediend bij NWO en die is toen gehonoreerd. Via het netwerk leren onderzoekers elkaars expertise kennen en wisselen ze onderzoeksideeën uit. Een voorbeeld van zo’n onderzoeksvraag die uit het netwerk voorkomt is: waarom zijn er genres die in het ene land wel voorkomen en in het andere niet?
Ik vind dat een spannende vraagstelling, maar het antwoord heb ik nog niet kunnen traceren.
Kun je daar een voorbeeld van geven?
"Neem de ‘dying speeches’. Dat waren traktaatjes, korte geschriften met een vaak politieke of godsdienstige inhoud, die gepubliceerd werden bij het executeren van misdadigers. Zo’n executie was in de vroegmoderne tijd een publiek evenement, waarbij allerlei drukwerk werd verspreid. Die 'dying speeches' zijn opgetekende verhalen van de misdadiger met een moraal erachter. ‘Luister goed, ik zat in nood, ik moest gaan stelen en daarbij heb ik per ongeluk iemand vermoord. Nu moet ik hangen, ik accepteer mijn straf en ik vraag om vergeving en ik hoop dat ik toch nog in de hemel kom.’ Soms werden die drukwerkjes al tijdens de executie verspreid, zodat de mensen het thuis nog eens rustig konden nalezen.
Via het netwerk kom je er dan achter dat die ‘dying speeches’ in Engeland voorkomen, in Spanje voorkomen, maar niet in onze Republiek. Waarom is dat? Heeft dat te maken met de aard van de publieke executies, het niveau van geletterdheid in een land, religieuze conventies, initiatieven van uitgevers? Is er misschien een ander genre dat daarvoor gebruikt werd? Ik vind dat een spannende vraagstelling maar het antwoord heb ik nog niet kunnen traceren.
Naast het samenstellen van een internationaal netwerk van experts, bevatte het project een digitale component. We wilden een applicatie maken waarin allerlei Europese bronnen aan elkaar werden geknoopt, doorzoekbaar gemaakt werden en geschikt gemaakt voor analyse. Aangezien de Universiteitsbibliotheek Utrecht een van de partners was in EDPOP hebben we hun aanvankelijk gevraagd of ze zo’n applicatie konden maken. Per slot van rekening zijn mensen van de bibliotheek gewend aan catalogi en metadata, ze zijn op de hoogte van de ontwikkelingen rond Linked Open Data en de formats die daarvoor noodzakelijk zijn. Toen hebben ze op papier een applicatie geschetst en een klein prototype gebouwd, maar door organisatorische redenen konden ze niet aan de verdere ontwikkeling ervan werken."
Per slot van rekening zijn mensen van de bibliotheek gewend aan catalogi en metadata.
Wie nam toen het stokje over?
"De ontwikkelaars van wat tegenwoordig Research Software Lab heet. Overigens wel steeds in samenspraak met de universiteitsbibliotheek. De VRE, Virtual Research Environment, zoals de applicatie heet, was aan het eind van drie jaar EDPOP in rudimentaire vorm aanwezig. Het is een digitale omgeving waarin je gegevens kunt oogsten uit verschillende bronnen en toegankelijk kunt maken voor onderzoekers. De bron waar we mee begonnen was de Heritage of Printed Book Database, de HPB, een grote internationale catalogus die allerlei onderzoekscatalogi bij elkaar brengt."
De VRE is dus nog niet af?
"Nee, want vaak is het geld tekort voor een volledige applicatie en moet je nieuwe potjes aanboren. We hebben nu voor een jaar ontwikkelgeld gekregen van de datahub SSH. En voor een vervolg proberen we de FAIR Research IT call. De vakspecialisten van de universiteitsbibliotheek helpen dan mee met het schrijven van een projectvoorstel want zij hebben verstand van hun collecties, zij kunnen vertellen wat inmiddels gedigitaliseerd is, hoeveel baat onderzoekers kunnen hebben bij collecties die goed en op de modernste manieren zijn ontsloten. Het lab heeft op zijn beurt weer belang bij een goede toegankelijkheid van zo’n collectie. Daarnaast verloopt de samenwerking met de programmeurs van het lab heel prettig, want zij zijn gewend om met onderzoekers samen te werken. Zij bouwen geen dingen waar wij vervolgens niets mee kunnen."
Vaak is het geld tekort voor een volledige applicatie en moet je nieuwe potjes aanboren.
"Binnen zo’n onderzoeksproject is het belangrijk dat we het allemaal over dezelfde populaire genres hebben. We moeten het erover eens zijn wat een pamflet is of wat een almanak, en hoe die termen vertaald zijn in andere talen. Daarom zijn we nu bezig met het bouwen van een glossary, waarbij we gebruik maken van de expertise van andere Europese deskundigen. De glossary is bijna af en wordt deze zomer gepubliceerd en zal uiteindelijk ook geïmplementeerd worden in de VRE.
Dus even terug naar de dying speech. Omdat we de vertalingen van de termen hebben, kunnen we systematisch gaan zoeken in de VRE. Waar en wanneer komt dat genre in Europa voor? Kan het bijvoorbeeld zo zijn dat een moord gepleegd in Engeland in Europa rondzingt in verwante genres? En wat voor beeld wordt er dan gecreëerd van de crimineel? De VRE geeft als het ware een empirische basis aan een aantal hypotheses en vragen die we hebben gegenereerd uit het netwerk."
Komt de VRE ooit af?
"Er schort nogal wat aan de catalogi die hun data internationaal beschikbaar stellen. Data zijn incompleet of niet toegankelijk voor onze VRE. De programmeurs van het lab hebben nog ontwikkeltijd tot eind december en dan hopen we een operationele VRE te hebben waarmee onderzoekers uit de voeten kunnen. En dan willen we weer een nieuw geldpotje vinden om de functionaliteit uit te breiden. Ik wil graag ook een tool voor image recognition implementeren. Onderzoekers zijn niet alleen geïnteresseerd in de tekst, maar ook in de afbeeldingen. Maar die afbeeldingen kunnen nu alleen doorzocht worden op de metadata, dus bijvoorbeeld…
Man aan galg
…man aan galg. Wat we zouden willen is dat onderzoekers niet op metadata kunnen zoeken, maar op visuele kenmerken. Zien we publiek bij de executie? Is de plek historisch juist of is er gebruik gemaakt van een sjabloon uit een ander land? Veel drukwerk is inmiddels gedigitaliseerd. Dus ik maak een uitsnede van een man aan een galg en ik zeg tegen de zoekmachine: vind alle mannen aan een galg in dezelfde of verschillende contexten. Voor vroegmodern drukwerk is dat lastig, want je hebt te maken met houtsneden die soms heel grof zijn, met vette lijnen en beschadigingen of het zijn kopergravures die ingekleurd zijn en dat vertroebelt ook weer het beeld. Dus de daadwerkelijke implementatie van image recognition voor deze periode is nog niet goed mogelijk."
Kan het Research Software Lab hier iets voor betekenen?
"Zij zijn wel vertrouwd met de rudimentaire vormen van image recognition, maar het is nog niet hoe het zou moeten zijn. Je hebt beeldmateriaal nodig, dat moet je annoteren, er moeten algoritmes getraind worden. Daar zijn mensuren en dus geld voor nodig. Maar niet getreurd, we boren wel weer een ander potje aan."