16 augustus 2018

Kees van Deemter benoemd tot hoogleraar Natural Language Generation

Kees van Deemter

Kees van Deemter is per februari 2018 benoemd tot hoogleraar Natural Language Generation bij het departement Informatica. “In praktische toepassing van mijn vak gaat het om de vraag: hoe zet je data om naar tekst? Die data kan van alles zijn: formules, sensorgegevens, weersvoorspellingen… Eigenlijk alles dat nog geen tekst is.” Wil Van Deemter dan eigenlijk een digitale weerpresentator ontwikkelen? “Niet zozeer voor het achtuurjournaal. Je mist natuurlijk het persoonlijke aspect van een menselijke presentator. Maar voor een booreiland dat een heel specifiek weerbericht nodig heeft, heeft zo’n systeem veel waarde.”

Het gaat Van Deemter om veel meer dan alleen het maken van grammaticale zinnen. “Daarvan weten we nu wel ongeveer hoe het werkt. Wat ik interessanter vind, is hoe uit zo’n hele bak data een selectie kunt maken van informatie die relevant is om te melden. En hoe groepeer je die informatie?” Hoe meer data, hoe belangrijker die vraag. “In medische toepassingen kan dat bij voorbeeld gaan om metingen aan een patient op de intensive care, die in de gaten wordt gehouden met heel veel sensoren. Wanneer is iets de moeite waard om te melden, en op welke manier? Kan zo’n systeem beter zeggen: ‘de patiënt heeft koorts’ of ‘de lichaamstemperatuur is zoveel graden’?’”

Menselijk taalgedrag

Uiteindelijk gaat het Van Deemter vooral om het begrijpen van menselijk taalgedrag: hoe maken artsen bijvoorbeeld de keuze tussen het gebruiken van een woord als “koorts” en het benoemen van het specifieke aantal graden? Van Deemter werkt dan ook veel samen met taalkundigen en experimenteel psychologen. Zijn rol als informatica-onderzoeker is het vangen van menselijk denken in algoritmes. Op die manier probeert hij te begrijpen hoe het menselijk denken werkt. “Om dat denken in kaart te brengen ontwikkelen we computerprogramma’s die zich op een menselijke manier gedragen.”

Chinees weerbericht

Een van de projecten die Van Deemter aan het opstarten is, richt zich op het Mandarijn. “We vermoeden dat er op dit terrein ook flinke verschillen bestaan tussen culturen. Als we weergegevens hebben uit China en het bijbehorende weerbericht, kunnen we er achter komen of zo’n Chinees weerbericht op dezelfde manier is opgebouwd als het Nederlandse. Als we dat goed begrijpen, leren we iets over verschillen tussen onze culturen. Daarnaast kunnen we dan met behulp van de verworven inzichten praktische toepassingen ontwikkelen die gebruik maken van het Mandarijn.”