Word Type
För dem som är intresserade av lite information om den här webbplatsen: det är ett sidoprojekt som jag utvecklade medan jag arbetade med Describing Words and Related Words. Båda dessa projekt är baserade på ord, men har mycket större mål. Jag hade en idé om en webbplats som helt enkelt förklarar ordtyperna för de ord du söker efter – precis som en ordbok, men med fokus på ordets taldel. Och eftersom jag redan hade en stor del av infrastrukturen på plats från de andra två webbplatserna, tänkte jag att det inte skulle bli så mycket mer arbete att få igång den här.
Den här ordboken är baserad på det fantastiska Wiktionary-projektet från wikimedia. Jag började först med WordNet, men insåg sedan att det saknades många typer av ord/lemmar (bestämningsord, pronomen, förkortningar och många fler). Detta fick mig att undersöka 1913 års upplaga av Websters Dictionary – som nu är offentligt tillgänglig. Efter en dags arbete med att få in den i en databas insåg jag dock att det fanns alldeles för många fel (särskilt med part-of-speech-taggningen) för att den skulle vara gångbar för Word Type.
Slutligt gick jag tillbaka till Wiktionary – som jag redan kände till, men som jag hade undvikit eftersom den inte är korrekt strukturerad för parsing. Det var då jag snubblade över UBY-projektet – ett fantastiskt projekt som behöver mer erkännande. Forskarna har analyserat hela Wiktionary och andra källor och sammanställt allt till en enda enhetlig resurs. Jag extraherade helt enkelt Wiktionary-posterna och slängde in dem i det här gränssnittet! Det krävde alltså lite mer arbete än väntat, men jag är glad att jag fortsatte efter de första misstagen.