20 september 2012

Veel Europese talen bedreigd met digitale uitsterving

(iStockphoto.com/alengo)

Minstens 21 Europese talen lopen grote risico’s om het digitale tijdperk niet te overleven. Daarvoor waarschuwen vooraanstaande taaltechnologische experts uit heel Europa in een nieuwe studie. Op 26 september, de Europese dag van de talen, wordt een reeks van 30 ‘witboeken’ oftewel taalrapporten gepresenteerd, die per taal de risico’s inzichtelijk maken. De studie is uitgevoerd door META-NET, een Europees excellentienetwerk met 60 onderzoeksinstellingen in 34 landen. Ook de Universiteit Utrecht participeert, en prof. dr. Jan Odijk is auteur van het witboek voor het Nederlands.

Ruim 200 experts hebben voor 30 van de ongeveer 80 Europese talen vastgesteld in hoeverre zij digitaal worden ondersteund met taaltechnologie. De conclusie luidt dat de digitale ondersteuning voor 21 van de 30 talen “niet-bestaand” is of op zijn best “zwak”. Bekende voorbeelden van taaltechnologische toepassingen zijn programma’s voor spellings- en grammaticacontrole, interactieve persoonlijke assistenten op smartphones (zoals Siri op de iPhone), gesproken telefoonmenu’s, automatische vertaalsystemen, zoekmachines op het web, en de stemmen in autonavigatiesystemen.

Slechte taaltechnologische voorzieningen

Voor iedere taal is de taaltechnologische ondersteuning op vier verschillende gebieden vastgesteld: automatisch vertalen, spraakinteractie, tekstanalyse en de beschikbaarheid van taalbronnen. Verschillende talen, bijvoorbeeld IJslands, Lets, Litouws en Maltees krijgen de laagste score op alle gebieden. In totaal scoren 21 talen slecht op minimaal één gebied. Opmerkelijk is dat geen enkele taal de categorie “excellente ondersteuning” krijgt. Alleen het Engels wordt beschouwd als een taal met “goede ondersteuning”, gevolgd door talen zoals het Nederlands, Frans, Duits, Italiaans en Spaans met “beperkte ondersteuning”.

Blijvende inspanningen nodig voor ondersteuning van het Nederlands

De situatie van het Nederlands geeft aanleiding tot voorzichtig optimisme, aldus hoogleraar Taal- en spraaktechnologie prof. dr. Jan Odijk. Dat er voor het Nederlands “beperkte ondersteuning” is, is te danken aan recente programma’s uitgevoerd in samenwerking met Vlaanderen. Odijk: “De bevindingen van het taalwitboek laten zien dat de Lage Landen na deze succesvolle programma’s moeten doorpakken en hun inspanningen voor de ontwikkeling van taaltechnologische bronnen moeten voortzetten en ze gebruiken om onderzoek, innovatie en ontwikkeling voort te stuwen. Anders zal ook het Nederlands in de gevarenzone komen.”

Europa moet taalbarrières slechten

Europa is erin geslaagd om bijna alle grenzen tussen zijn landen te verwijderen. De onzichtbare grens van de taalbarrières blijkt echter hardnekkig, en deze grens belemmert de vrije stroom van kennis en informatie.Taaltechnologie stelt mensen in staat samen te werken, te leren, zaken te doen en kennis te delen over taalgrenzen heen en onafhankelijk van hun computervaardigheden. De resultaten van de META-NET studie laten echter duidelijk zien dat veel van de Europese talen hier nog niet klaar voor zijn. Voor veel talen ontbreekt de benodigde technologie, onder meer omdat de focus van veel onderzoekers en ontwikkelaars op het Engels ligt. Een gecoördineerde, gezamenlijke inspanning is vereist in Europa om ontbrekende technologieën te ontwikkelen en om technologie ook beschikbaar te maken voor kleinere talen, aldus de experts van META-NET. Alleen zo kan Europa haar talen, een essentieel onderdeel van ons culturele erfgoed, ook in het digitale tijdperk toekomstbestendig maken.

META-NET Witboekserie

De META-NET Witboekserie “Talen in de Europese Informatiemaatschappij” rapporteert over de toestand van 30 Europese talen met betrekking tot taaltechnologie en legt uit wat de meest urgente risico’s en mogelijkheden zijn. Het is voor het eerst dat er per taal een dergelijk veelomvattend overzicht verschijnt. Ieder taalwitboek is geschreven in de taal waarover het rapporteert en bevat ook een volledige Engelse vertaling.

De witboeken zijn geschreven voor de volgende Europese talen: Baskisch, Bulgaars, Catalaans, Deens, Duits, Engels, Ests, Fins, Frans, Galicisch, Grieks, Hongaars, Iers, IJslands, Italiaans, Kroatisch, Lets, Litouws, Maltees, Nederlands, Noors (bokmål en nynorsk), Pools, Portugees, Roemeens, Servisch, Sloveens, Slowaaks, Spaans, Tsjechisch, en Zweeds.

De witboeken zijn zowel digitaal als in drukvorm beschikbaar.

Over META-NET en META

META-NET, een excellentienetwerk van 60 onderzoekscentra uit 34 landen, beoogt de technologische fundamenten te ontwikkelen van een meertalige Europese informatiemaatschappij. META-NET wordt mede gefinancierd door de Europese Commissie. META-NET is ook de initiatiefnemer van META, de Meertalige Europese Technologische Alliantie. Meer dan 600 organisaties uit 55 landen, waaronder onderzoekscentra, universiteiten, midden- en kleinbedrijven en verschillende grote ondernemingen, hebben zich al aangesloten bij deze open technologische alliantie.