Archive for April, 2007
Hier, le livre Développer pour le Web 2.0, écrit par Eric Van der Vlist, Danny Ayers, Erik Bruchez, Joe Fawcett et Alessandro Vernet, est paru. Il s’agit de la traduction du livre Professional Web 2.0 Programming. Cette traduction a été réalisée par Eric Van [...]
Définition : à partir d’un ou plusieurs textes ou d’une portion seulement, les outils de lexicométrie fournissent la liste des formes classées alphabétiquement ou par fréquence d’apparition. On peut ainsi étudier le vocabulaire à l’aide statistiques et faire une analyse statistique sur un texte, ou comparatives et [...]
Définition : étiquetage linguistique d’un texte
Exemples d’outils de catégorisation
TreeTagger pour l’anglais, l’allemand, l’italien, le hollandais, l’espagnol, le bulgare, le russe, le français, l’ancien français – n’est pas disponible pour Windows
Winbrill
Définition : Il s’agit d’associer à un mot sa forme canonique. Toutes les flexions d’un même mot renvoie vers cette même forme. Pour toutes les formes conjuguées d’un verbe en français, la forme canonique est le verbe à l’infinitif présent.
Exemples d’outils de lemmatisation automatiques
Morlex : Le verbe [...]
