Partie 3 - Présentation - Projet Perl Tk
L' objectif final était de construire un programme avec interface graphique (via Perl/Tk) permettant de construire les différentes étapes suivantes :
- récupérer une URL ou un texte donnés
- en extraire le texte
- construire le dictionnaire des formes utilisées (forme + fréquence)
- produire un rapport sur l'URL : nombre de mots,, forme la plus fréquente, etc..
- construire une concordance des formes
- étiqueter le texte via treetagger
- extraction de patron syntaxique NOM ADJ