Word Type

Word Type

Voor degenen die geïnteresseerd zijn in een beetje info over deze site: het is een nevenproject dat ik ontwikkelde terwijl ik werkte aan Describing Words and Related Words. Beide projecten zijn gebaseerd op woorden, maar hebben veel grotere doelen. Ik had een idee voor een website die eenvoudig de woordsoorten uitlegt van de woorden waarnaar je zoekt – net als een woordenboek, maar dan toegespitst op het deel van de spraak van de woorden. En omdat ik al veel van de infrastructuur van de andere twee sites had, dacht ik dat het niet al te veel werk meer zou zijn om dit van de grond te krijgen.

Het woordenboek is gebaseerd op het geweldige Wiktionary project van wikimedia. Ik begon aanvankelijk met WordNet, maar realiseerde me toen dat het vele soorten woorden/lemma’s miste (determinatoren, voornaamwoorden, afkortingen, en nog veel meer). Dit bracht me ertoe de 1913 editie van Websters Dictionary te onderzoeken – die nu in het publieke domein is. Echter, na een dag werk om het in een database te proppen realiseerde ik me dat er veel te veel fouten in zaten (vooral met de part-of-speech tagging) om het bruikbaar te maken voor Word Type.

Ten slotte ging ik terug naar Wiktionary – die ik al kende, maar had vermeden omdat het niet goed gestructureerd is voor parsing. Toen stuitte ik op het UBY project – een geweldig project dat meer erkenning verdient. De onderzoekers hebben de hele Wiktionary en andere bronnen geanalyseerd, en alles samengevoegd in één enkele bron. Ik heb gewoon de Wiktionary entries eruit gehaald en ze in deze interface gegooid! Het heeft dus iets meer werk gekost dan verwacht, maar ik ben blij dat ik het heb volgehouden na de eerste paar blunders.

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.