Is onze mening over gas en olie door de tijd heen veranderd?
Digitale tools vergemakkelijken historisch onderzoek naar publieke sentimenten
Dat veel Groningers op dit moment niet blij zijn met de gaswinning in hun provincie is wel duidelijk, dat is te lezen in de krant en te horen op radio en tv. Maar hoe kom je erachter hoe mensen in het verleden dachten over gas en olie? Hebben de overheid en energiebedrijven de publieke mening over fossiele brandstoffen gestuurd in Nederland? Voor historici biedt het krantenarchief van de Koninklijke Bibliotheek Delpher een schat aan informatie waarin het antwoord op deze vragen te vinden is. Maar met meer dan 100 miljoen pagina's uit Nederlandse kranten, boeken en tijdschriften is het voor historici een uitdaging om deze bron slim en effectief te gebruiken. Gelukkig bieden digitale tools een oplossing. Dr. Pim Huijnen, prof. dr. Jaap Verheul en dr. Gertjan Plets kunnen nu, dankzij een bijdrage van het Utrechtse IT Innovation Fund, een tool ontwikkelen waarmee emoties rond het denken rond gas en olie over de tijd heen in kaart worden gebracht.
Sentiment mining
Delpher is een goudmijn en met behulp van, wat in de wetenschap sentiment mining wordt genoemd, ook makkelijker analyseerbaar. Sentiment mining verschaft inzicht in hoe mensen vroeger over bepaalde onderwerpen of personen dachten – en hoe dit door de tijd heen is veranderd. “Sentiment mining”, licht Huijnen toe, “is het automatisch extraheren van opinies (positief – negatief, leuk – niet-leuk, blij – boos) uit grote hoeveelheden tekst. Traditioneel is sentiment mining altijd gebaseerd op een standaard: de baseline. Dat kunnen op voorhand geclassificeerde woordenlijsten zijn, waarbij elk woord een bepaalde score bezit (bijvoorbeeld op een schaal tussen +1 voor zeer positieve termen als ‘geweldig’ en -1 voor erg negatieve termen als ‘verschrikkelijk’). Op basis van zulke woordenlijsten kun je door je data lopen en uitrekenen of een zin, alinea, of tekst een meer negatieve of positieve toon bevat. Of je kunt bepalen wat de toon is waarmee binnen een bepaalde dataset over een onderwerp of persoon wordt gesproken.”
Bewoordingen
Het probleem van veel bestaande vormen van sentiment mining is dat ze niet historisch zijn. Zoals opinies mettertijd kunnen verschuiven, veranderen ook de bewoordingen waarmee we onze opinies uitdrukken. Sentiment mining in de geschiedwetenschap is daarmee per definitie erg contextgebonden. “De uitdrukking ‘een wilde jongen’ had vijftig jaar geleden nog een connotatie met ‘exotisch’ of ‘onbeschaafd’, terwijl we nu eerder de associatie leggen met ‘onopgevoed’ – afhankelijk van de context. Dat maakt het voor historisch onderzoek haast onmogelijk sentiment mining op standaard woordenlijsten te baseren” geeft Huijnen aan.
Een kat, wat is dat?
Machine learning biedt een oplossing, legt Huijnen uit. “Als je een computer een kat wilde laten herkennen, moest je tot voor kort heel precies definiëren wat dat is, een kat. Nu voed je de computer simpelweg met heel veel afbeeldingen van katten en laat je de criteria op basis waarvan hij vervolgens in staat is een kat van andere beesten te onderscheiden aan het algoritme. Net zo willen we de computer in ons onderzoek voeden met een hele hoop teksten die in onze ogen een bepaald sentiment uitdrukken om gelijksoortige sentimenten in andere contexten of andere tijden op te sporen. Dit bevrijdt ons van de verplichting vooraf heel precies aan te geven welke woorden welke sentimenten uitdrukken.”
In Nederland hebben de overheid en grote bedrijven sterke belangen in de gas-, olie- en – vroeger – de steenkoolindustrie. Deze sectoren zijn echter sterk afhankelijk van een positief imago onder de bevolking, omdat ze zo’n impact hebben op samenleving en milieu.
Mening over fossiele brandstoffen
In dit specifieke project willen Pim Huijnen en Gertjan Plets onderzoeken hoe de overheid en energiebedrijven de publieke perceptie van fossiele brandstoffen sturen. “In Nederland hebben de overheid en grote bedrijven immers sterke belangen in de gas-, olie- en – vroeger – de steenkoolindustrie. Deze sectoren zijn echter sterk afhankelijk van een positief imago onder de bevolking, omdat ze zo’n impact hebben op samenleving en milieu”, legt Plets uit. “We weten dankzij analyses van advertenties, overheidscommunicatie en tentoonstellingen die bedrijven als Shell en de NAM hebben gesponsord dat er een bepaald imago van energiewinning wordt gepromoot. Grote multinationals weten al een halve eeuw dat fossiele brandstof leidt tot klimaatverandering en dat te snelle extractie van gas kan leiden tot aardbevingen. Toch proberen ze de publieke opinie vaak te sturen om energietransities zo lang mogelijk uit te stellen.”
Completer beeld
“We gaan er vaak van uit dat de maatschappij in de val loopt van de sector. Binnen ons project willen we meten en analyseren of dat ook echt zo is. Hoe zijn in Nederland de maatschappelijke sentimenten over fossiele brandstof mettertijd veranderd? Hebben de energiebedrijven met succes een bepaald imago hooggehouden of zijn in de Nederlandse media eigenlijk al langer kritische stemmen te horen over bijvoorbeeld gaswinning? Zijn Nederlanders misschien al langer klaar voor verduurzaming dan we nu denken?” Sentiment mining in Delpher geeft uiteindelijk een completer beeld van hoe verschillende lagen van de Nederlandse samenleving kijken naar bijvoorbeeld gaswinning.
Het is cruciaal dat historici een woordje meepraten in de ontwikkeling van sentiment mining, omdat niet iedere tak van wetenschap net zoveel oog heeft voor bronnenkritiek en contextgebondenheid als historici.
Bronnenkritiek
De opgedane ervaring en technieken die uit dit project rollen, zijn natuurlijk generiek en niet alleen inzetbaar op krantendata. Deze kunnen gebruikt worden om bijvoorbeeld politieke teksten te analyseren, of social media. Huijnen: “Tevens is dit project een poging om een heel basaal probleem voor wat betreft geopinieerde discussies op te lossen. Het is de bedoeling dat dit uitmondt in een techniek en in de toepassing daarvan op enkele casestudies. Aangezien er geen historicus meer is die géén gebruik maakt van Delpher of andere databases met gedigitaliseerd historisch materiaal, hebben eigenlijk alle historici iets aan onze bevindingen. Het is cruciaal dat historici een woordje meepraten in de ontwikkeling van sentiment mining, omdat niet iedere tak van wetenschap net zoveel oog heeft voor bronnenkritiek en contextgebondenheid als historici.”
Digitale geschiedenis
Moet de hedendaagse historicus ook zelf algoritmes bouwen om goed onderzoek te kunnen doen? Huijnen is daar dubbel over: “Onze visie op digitale geschiedenis is dat we zoveel mogelijk zelf proberen te doen als het gaat om het gebruik van digitale technieken om historisch materiaal te analyseren. De hoeveelheid gedigitaliseerd materiaal groeit met de dag en hetzelfde geldt voor software en code om daar interessante dingen mee te doen. Met een beetje kennis van programmeertalen is daardoor zoveel méér mogelijk dan je als historicus ooit met de hand zou kunnen doen. Tegelijkertijd zijn wij historici en geen machine learning specialisten - en we hebben ook niet de ambitie dat te worden. Daarom zijn calls zoals die van het Innovatiefonds en samenwerkingsverbanden als het focusgebied Applied Data Science zo essentieel. Die brengen collega’s uit verschillende vakgebieden samen om elk vanuit hun eigen expertise aan een gezamenlijk probleem te werken.”
Deze jaknikker is in 2012 met financiële ondersteuning van de NAM geplaatst in het Openluchtmuseum Arnhem. Het object en de bijbehorende tentoonstelling vertellen het moderniseringsverhaal van hoe olie en gas Nederland na de Tweede Wereldoorlog welvaart hebben gebracht. Uit het bijschrift: “Door de exploitatie (van aardgas) stroomt het geld decennialang de Nederlandse schatkist in en worden we een welvarende verzorgingsstaat.” © Gertjan Plets