Word Type

Word Type

Pour ceux qui sont intéressés par une petite info sur ce site : c’est un projet parallèle que j’ai développé tout en travaillant sur Describing Words and Related Words. Ces deux projets sont basés sur les mots, mais ont des objectifs beaucoup plus grands. J’ai eu l’idée d’un site Web qui explique simplement les types de mots que vous recherchez – comme un dictionnaire, mais en se concentrant sur la partie du discours des mots. Et comme j’avais déjà une grande partie de l’infrastructure en place à partir des deux autres sites, j’ai pensé que ce ne serait pas trop de travail supplémentaire pour le mettre en place et le faire fonctionner.

Le dictionnaire est basé sur l’incroyable projet Wiktionary de wikimedia. J’ai initialement commencé avec WordNet, mais j’ai ensuite réalisé qu’il manquait de nombreux types de mots/lemma (déterminants, pronoms, abréviations, et bien d’autres). J’ai donc décidé de me pencher sur l’édition 1913 du dictionnaire Websters, qui est désormais dans le domaine public. Cependant, après une journée de travail à l’intégrer dans une base de données, j’ai réalisé qu’il y avait beaucoup trop d’erreurs (en particulier avec le marquage des parties du discours) pour qu’il soit viable pour Word Type.

Enfin, je suis retourné au Wiktionnaire – que je connaissais déjà, mais que j’avais évité parce qu’il n’est pas correctement structuré pour l’analyse syntaxique. C’est alors que je suis tombée sur le projet UBY, un projet étonnant qui mérite d’être mieux connu. Les chercheurs ont analysé l’ensemble de Wiktionary et d’autres sources, et ont compilé le tout en une seule ressource unifiée. J’ai simplement extrait les entrées de Wiktionary et les ai intégrées dans cette interface ! Cela a donc demandé un peu plus de travail que prévu, mais je suis heureux d’avoir continué après les premières maladresses.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.