Machine learning kan bedrijven met politieke invloed helpen identificeren

Vrouw onderzoekt data op computerscherm

Het lijkt erop dat tijdens de corona crisis het aandeel opdrachten dat aan bedrijven met politieke invloed wordt gegund, overal is toegenomen. Nederland vormt daarop geen uitzondering. Misschien is het veroorzaakt door de crisis en betrof het niet in alle gevallen echt corruptie maar ontbrak het aan fatsoenlijke opdrachtverstrekking vanuit de overheid. Maar het gebrek aan transparantie was evident en deed veel wenkbrauwen fronsen. Naast een pleidooi voor professionele aanbestedingen, vragen toezichthoudende organisaties en het grote publiek om meer inzicht in de invloed van bedrijven op politieke beslissingen.

Deni Mazrekaj, Fritz Schiltz en Vitezslav Titl, assistent professor aan de Utrecht University School of Economics (U.S.E) suggereren dat machine learning kan helpen bij het identificeren van bedrijven die politieke invloed uitoefenen. Een gerichte audit kan daarmee vervolgens potentiële corruptie bij deze bedrijven onderzoeken – op een veel efficiëntere wijze dan door middel van een willekeurige audit. De onderzoekers ontwikkelen een algoritme ('R code’) die ambtenaren kan helpen dit te implementeren.

Corona versterkt aandacht voor bestaande, urgente ontwikkeling

Vitezslav Titl: ‘Het lijkt erop dat het aandeel van de opdrachten dat tijdens de corona crisis aan bedrijven met politieke invloed is toegewezen, overal is toegenomen. Dat gebeurde vrijwel overal tijdens de pandemie. We hebben voorbeelden verzameld uit ten minste twintig landen, van Turkije tot het Verenigd Koninkrijk (VK) en van Kenia tot de VS, Tsjechië en Tunesië. Uit de audit in het VK bleek bijvoorbeeld dat een derde van de bedrijven banden had met politici en hoge ambtenaren. In Nederland werd 100 miljoen euro uitgegeven aan een enorme partij mondkapjes die niet zijn gebruikt (de zaak Sywert van Lienden/Stichting Hulptroepen) en werd meer dan een miljard euro toegekend aan het experiment Testen voor toegang – beide zonder een behoorlijke openbare aanbesteding. Dat wekt argwaan.

Prof. mr. Elisabetta Manunza, hoogleraar Europees en Internationaal aanbestedingsrecht van de Universiteit Utrecht sprak zich daar ook over uit.

Politici of aanbesteders lijken vaak andere voorkeuren te hebben dan de samenleving

De corona crisis toont eens te meer aan dat politici of aanbesteders vaak andere voorkeuren lijken te hebben dan de samenleving,’ voegt Titl daaraan toe. ‘De pandemie lijkt dit te hebben versterkt. De meeste regeringen zijn opdrachten gaan verstrekken in een soort noodregime, met veel minder strenge regels, zodat ze dingen hebben kunnen doen die normaal niet zouden zijn toegestaan of te rechtvaardigen zijn. Het heeft ons onderzoek naar de politieke invloed van ondernemingen nog urgenter en belangrijker gemaakt voor de samenleving. Maar ook moeilijker omdat de gegevens vaak niet beschikbaar zijn.

In veel landen wordt de overheid steeds zwakker in de manier waarop zij kan reageren op corruptie, belastingontduiking en dergelijke. Om een voorbeeld te geven: de belastingdienst van de Verenigde Staten (de IRS) controleerde in 2019 slechts 0,45% van de aangiften van inkomstenbelasting, minder dan de helft van het controlepercentage in 2010. Er is meer gericht beleid nodig en machine learning zou een deel van de oplossing kunnen zijn,’ aldus Titl.

Bedrijven met politieke invloed

In hun Working Paper ‘Identifying Politically Connected Firms: a Machine Learning Approach’ introduceren Deni Mazrekaj, Vitezslav Titl en Fritz Schiltz technieken voor machine learning om bedrijven met politieke invloed te identificeren, d.w.z. bedrijven die banden met politici hebben – die daardoor ernstige belangenconflicten zouden kunnen krijgen. Door informatie uit publiek beschikbare bronnen en de Orbis bedrijvendatabank samen te voegen, construeerden zij een nieuwe dataset van bedrijvenpopulaties in Tsjechië waarin verschillende vormen van politieke connecties kunnen worden getraceerd. Uit de resultaten blijkt dat meer dan 85% van de bedrijven met politieke banden accuraat kan worden geïdentificeerd door de voorgestelde algoritmen. Voor deze hoge nauwkeurigheid kan het model voldoende hebben aan de financiële en industriële indicatoren op bedrijfsniveau die in de meeste landen ruimschoots beschikbaar zijn.

‘Politieke connecties kunnen de vorm aannemen van donaties; bijvoorbeeld wanneer een bedrijf geld geeft aan een politieke partij. Direct – wat te zien is op de lijst van donaties van een politieke partij maar ook indirect, wanneer een CEO of bestuurslid geld geeft aan een politieke partij,’ legt Titl uit. 'Het kan ook gaan om persoonlijke connecties: een CEO of bestuurslid dat tijdens verkiezingen op een kandidatenlijst van een politieke partij heeft gestaan (ook als ze niet daadwerkelijk gekozen zijn).

We hebben deze drie typen gekozen omdat er voor elk bewijs van de negatieve effecten van de connecties is. Meestal leveren zij voordelen op voor de bedrijven; zij kunnen resulteren in meer aanbestedingen, te dure contracten, slecht uitgevoerde openbare werken, werving van minder competente personen, uitholling van de arbeidsnormen, alsmede voordelen op het gebied van de regelgeving en politiek gekanaliseerde leningen. Deze voordelen komen in het algemeen ten goede aan de bedrijven, niet aan de samenleving.’

Data en machine learning leiden tot gerichte audits

‘Ik werk al zo'n tien jaar aan de politieke connecties van bedrijven in Tsjechië en beschik over zeer goede, uitgebreide data. We hebben in feite informatie over bepaalde connecties van elk bedrijf in het land. Deze gegevens waren ideaal om de voorspellende waarde van algoritmen voor machine learning te testen.

Er zijn een half miljoen bedrijven in Tsjechië en ruwweg 10 000 daarvan hebben politieke connecties. Normaal gesproken zou je 50 bedrijven moeten doorlichten om er één te vinden die dergelijke banden heeft. Met het algoritme kun je tien bedrijven vinden en als je die doorlicht, zullen acht of negen bedrijven echt connecties blijken te hebben. Je hoeft naar een veel lager aantal ondernemingen te kijken om de bedrijven met politieke connecties te vinden. Uit ons onderzoek blijkt dat we met deze algoritmen en data (die in de meeste landen beschikbaar zijn) een nauwkeurigheid van ongeveer 85% hebben en dat we deze bedrijven dus aan een audit kunnen onderwerpen.

Het resultaat zou kunnen zijn dat wanneer uit de audits blijkt dat er een probleem is, deze ondernemingen niet langer aan aanbestedingsprocedures van de overheid zouden mogen deelnemen. Dit zou mogelijk problemen en schandalen in de toekomst kunnen voorkomen. In plaats van een willekeurige controle uit te voeren, zou je je dus kunnen richten op de potentieel corrupte bedrijven.’

R-code voor uitvoering door ambtenaren

‘Om de algoritmen te implementeren zoals wij voorstellen, heb je een kleine steekproef van bedrijven met en zonder connecties nodig om het algoritme te trainen. Vervolgens voorspel je of een bedrijf connecties heeft op basis van een dataset van bedrijven met hun financiële basis- en sectorinformatie. In de meeste landen is de tweede dataset in enigerlei vorm beschikbaar. Voor de eerste dataset zouden overheidsfunctionarissen gebruik kunnen maken van historische gevallen, waarin belangenconflicten (een politieke connectie) wel en niet werden aangetroffen. Wij tonen aan dat je slechts ongeveer 100 bedrijven met en 100 zonder politieke connecties nodig hebt om te beginnen met het trainen van het algoritme. Die gegevens zouden bijna overal te krijgen moeten zijn, met een kleine tijdsinvestering.

De implementatie is eenvoudig voor iedereen die ervaring heeft met het gebruik van statistische software zoals 'R' en met programmeren. We stellen zelfs gemakkelijk te implementeren broncode ter beschikking (in 'R'). De procedure zou er dan als volgt uitzien: je moet een noodzakelijke trainingsdataset verzamelen (voor een bepaald land), de dataset laden, en onze code uitvoeren om het algoritme op deze trainingsdataset te laten leren. Vervolgens kan het getrainde algoritme worden gebruikt voor een dataset van alle andere (nog niet gecontroleerde) bedrijven, zodat het voorspelt hoe waarschijnlijk het is dat het bedrijf politieke invloed heeft.

Als u ambtenaar bent en dit zou willen implementeren, kunt u de code downloaden uit de bijlage van een eerdere versie van het document (gepubliceerd op de OESO-website) of een e-mail sturen naar de auteurs. Met een beetje aanpassing zou u de code op nieuwe data kunnen toepassen.  

Lees meer

Lees de Working Paper 'Identifying Politically Connected Firms: a Machine Learning Approach', van Deni Mazrekaj, Vitezslav Title en Fritz Schiltz.

De U.S.E. Working Papers zijn een reeks voorlopige resultaten van lopend onderzoek die geschikt zijn voor vroegtijdige verspreiding. De auteurs werken momenteel aan de omzetting van de paper naar een tijdschriftartikel.

 

Contact

Wilt u meer weten over het onderzoek naar bedrijven met politieke connecties en de aanpak ervan met machine learning? Neem dan contact op met Vitezslav Titl: v.titl@uu.nl.