Dick Bulterman doet een oproep voor een moratorium op metadata. Metadata voor tekst ‘has gone from tedious to insignificant’ in de afgelopen tien jaar; en voor niet-tekstuele media is de definitie van metadata veel te foutgevoelig en arbeidsintensief. Automatisch aangemaakte metadata (bijvoorbeeld door digitale camera’s) is meestal niet te vertrouwen (want worden op het moment van bewerking van een afbeelding vaak automatisch overgenomen uit een bronbestand).

Bulterman’s artikel is skeptisch over de mogelijkheden van het semantisch web en hij twijfelt over de methoden van degenen die de gedachte van een semantisch web verdedigen. Bulterman sluit zijn artikel af met het voorstel voor een ‘multimedia content differentiation competition’: een competitie voor technieken die geschikt zijn om multimedia objecten te localiseren op basis van hun inhoud, mits deze niet berusten op door de maker van de objecten toe te kennen metadata.

Dat metadata voor tekst ‘insignificant’ is, lijkt me een aanvechtbare stelling. Bulterman beweert: ‘Experience has shown that the contents of text documents can be mined directly using a host of existing information retrieval technologies and that metadata descriptions are often superfluous’. Mijns inziens een mateloos optimistische bewering, die alleen maar juist is voor het beantwoorden van de simpelste zoekvragen.

Geplaatst in metadata, weblog digital humanities

Reageer