Ce travail a pour but d'approfondir les connaissances en traitement automatisé de l'information, notamment pour filtrer le contenu de fichiers structurés, y appliquer des méthodes d'étiquetage, extraire des patrons morphosyntaxiques prédéfinis à partir d'un fichier étiqueté et ensuite construire des graphes permettant la visualisation de ces patrons.
L'exercice est divisé en quatre parties principales :
Le travail a été exécuté à partir d'une base fournie composée d'une arborescence de fichiers à traiter (voir ci-dessous) et d'un squelette de programme Perl qui permet de parcourir cette arborescence.