Het eerder aangekondigde corpus met briefteksten uit het ‘Brieven als buit’-project is sinds kort beschikbaar op de site van het INL. Aan de briefteksten is uitgebreide taalkundige en contextuale informatie toegevoegd.

 

 

Al eerder berichtten we over het Brieven als buit-project, waarin een collectie zeventiende-eeuwse brieven taalkundig ontsloten wordt. Inmiddels is de website met een corpus van duizend brieven beschikbaar. Op de fraai vormgegeven site kan gezocht worden op woordvorm, lemma en woordsoort, terwijl het resultaat kan worden gefilterd op basis van gegevens over de brief, de afzender en de geadresseerde. Het is mogelijk om selecties te maken als ‘geef me alle brieven van vrouwen van boven de vijftig die schrijven uit het Caraïbisch gebied’. De resultaten worden getoond per afzonderlijke treffer, of in het document, waarvan ook scans ter beschikking zijn.

 

Erg praktisch zijn de mogelijkheden om de zoekresultaten te groeperen en te sorteren. Sorteren kan bijvoorbeeld op woordvorm, op lemma, en op de woorden volgend op of voorafgaand aan de zoekterm. Groeperen kan op deze tekstuele kenmerken, maar ook bijvoorbeeld op jaar (zie de afbeelding). In deze grafiek kan op de balken worden geklikt op toegang te krijgen tot de betreffende documenten of treffers. Een voor de hand liggende uitbreiding van de mogelijkheden zou zijn om ook te kunnen groeperen op andere metadata: waarom kunnen we niet groeperen naar bijvoorbeeld regio van verzending, geslacht van verzender, of teksttype? Als ik nu twee demografische groepen naast elkaar wil zetten (bijvoorbeeld mannen en vrouwen), moet ik de zoekresultaten eerst filteren op mannen, dan op vrouwen.

Groepering van de gevonden documenten per jaar

Groepering van de gevonden documenten per jaar

 

Wat ik op de site mis, is wat meer beschrijvende informatie over het corpus. Voor zover ik zie, is er geen mogelijkheid om op te vragen hoeveel brieven uit Friesland afkomstig zijn, of zijn geschreven door jonge mannen, terwijl die informatie zonder meer uit de database gehaald zou kunnen worden. Om aantallen treffers te kunnen interpreteren lijkt dergelijke informatie essentieel.

 

Nog een paar suggesties: de mogelijkheid om een spreadsheet te downloaden met alle treffers van een zoekactie, inclusief alle metadata van de betreffende brieven; een mogelijkheid om de query, inclusief toegepaste filtering, te bewaren; en een mogelijkheid om van een toegepast filter afzonderlijke criteria uit te zetten.

 

De ‘Brieven als buit’-collectie is de tweede site die is gemaakt op basis van een selectie uit de ‘sailing letters’, de collectie brieven van en naar Nederlanders overzee die Engelse schepen in het verleden in beslag hebben genomen. Eerder publiceerde het Meertens Instituut een collectie Gekaapte brieven  waarin een wat groter aantal brieven en andere documenten is getranscribeerd (maar minder diep is ontsloten).

 

Peter Boot

 

Geplaatst in weblog digital humanities

Reageer