Latente Semantische Analyse (LSA) is een techniek voor de analyse van betekenisaspecten van teksten. Op basis van de woorden die in teksten voorkomen kan LSA bijvoorbeeld de betekenis van teksten vergelijken. Daarbij wordt gebruik gemaakt van een voorafgaande analyse van een referentiecorpus waarin de betekenis van de gebruikte woorden is gekarakteriseerd in termen van de woorden waarmee ze samen voorkomen. LSA heeft toepassingen op vele terreinen. De techniek kan worden gebruikt in zoekmachines, om ook documenten te vinden waarin de precieze woorden uit de zoekopdracht niet voorkomen. In deze context wordt wel gesproken van Latent Semantic Indexing. Een andere toepassing is het automatisch beoordelen van door leerlingen gemaakte tekstsamenvattingen. Een veelbelovende toepassing van LSA is het zoeken van thematisch verwante teksten in digitale tekstcorpora.

LSA is een techniek die dateert uit de jaren ’80. Sinds die tijd zijn verschillende vergelijkbare hulpmiddelen ontwikkeld. Een voorbeeld daarvan is Latent Dirichlet Allocation.

Voorbeelden van de toepassing van LSA in het onderzoek naar literaire teksten Basili & Marocco 2006, Louwerse et al. 2008 en Bassi et al. 2006.

Meer lezen: Thomas K Landauer and Susan Dumais, ‘Latent semantic analysis’, in Scholarpedia 3(11):4356 (http://www.scholarpedia.org/article/Latent_semantic_analysis).