- agenda (271)
- annotation (24)
- beeldende kunsten (13)
- community created content (16)
- digitale bibliotheek (21)
- diversen (25)
- duurzaamheid (11)
- e-tijdschrift (9)
- editie (134)
- educatief (9)
- handleiding (5)
- humanities computing (15)
- infrastructuur (5)
- institutioneel nieuws (7)
- internet algemeen (12)
- metadata (7)
- naslagwerk (6)
- online boekdiscussie (4)
- open access (1)
- project (8)
- publicatie (26)
- software (48)
- standaard (62)
- tijdschrift (2)
- tijdvak (127)
- 18e eeuw (12)
- 19e eeuw (23)
- 20e eeuw (17)
- middeleeuwen (45)
- niet-westers (1)
- oudheid (9)
- renaissance (36)
- visualisatie (12)
- weblog (3)
Delen via Twitter
Abonneer op RSS feeds
Nieuws
Agenda
Weblog e-tekstualiteit
Achtergrond Deze site is geinitieerd door:
IBM Alphaworks (IBM’s site voor technologie in een experimentele fase) publiceert een hulpmiddel voor interactieve tekstclassificatie. Het hulpmidel voor classificatie wordt getrained door een paar vooraf, handmatig, gelabelde documenten. De classificatie heeft verder automatisch plaats, maar de gebruiker kan de de aangemaakte classificatie aanpassen, waar de software dan weer van leert. Deze benadering vermijdt de nadelen van volledig handmatige classificatie (duurt te lang) en volledig automatische classificatie (lage kwaliteit).
Als we steeds grotere hoeveelheden teksten nog enigszins zinvol willen kunnen ordenen hebben we dit soort technologie nodig. Het zou interessant zijn hiermee eens met eigen materiaal te spelen.
Misschien wat interessante aanvullingen: er is voor het MacOS het tooltje DevonThink (http://www.devon-technologies.com)dat gebruikt maakt van de ingebouwde taaltechnologie van dat OS. Ik heb het een keer getest en werkte al verbluffend goed met een zeer kleine set documenten. Er is ook dergelijke software van Nederlandse makelij: Irion (http://www.irion.nl). Verder vond ik http://www.searchtools.com/info/classifiers-tools.html interessant.