In maart 2012 gaat het project Namescape – Mapping the Landscape of Names in Modern Dutch Literature – van start.

In het door CLARIN-NL gehonoreerde project zullen een aantal taalkundige tools rond automatische naamherkenning geschikt worden gemaakt voor letterkundig corpus-onderzoek. De tools en data komen beschikbaar in een CLARIN-compliant formaat.

De achterliggende onderzoeksvragen zijn letterkundig en stilistisch van aard: hoeveel eigennamen komen er gewoonlijk voor in romans? Wat zijn de functies van die namen in de structuur en betekenis van een roman? Wat is het aandeel van verschillende naamtypen zoals persoonsnamen, geografische namen en overige namen? Welke namen zijn fictioneel, en welke verwijzen naar personen en plaatsen in de werkelijke wereld? Zijn er trends te ontdekken in het gebruik van namen als stilistisch element bij verschillende auteurs, in verschillende romangenres of verschillende tijdperioden?

Bestaande Named Entity Recognition and Classification tools bleken voor literaire teksten niet de benodigde snelheidswinst en vergroting van efficiency op te leveren om een groot corpus te kunnen analyseren. De parters van Huygens ING in Namescape, het Instituut voor Nederlandse Lexicologie (INL) en het Institute for Logic, Language and Computation (ILLC) van de Universiteit van Amsterdam gaan ervoor zorgen dat ook namen in literaire teksten op een grootschalige manier gevonden en naar letterkundige maatstaven geclassificeerd kunnen worden. Ook maken zij mogelijk dat het naamgebruik in romans op verschillende manieren gevisualiseerd kan worden. Met de resultaten kunnen onderzoekers het literaire namenlandschap dan gaan exploreren, wat zal leiden tot allerlei spannende ontdekkingen en vele nieuwe vragen en technische wensen.

Comments are closed.