Après avoir appliquer l'étiquetage avec Treetagger et Cordial, notre troisième boite à outil a pour objectif d'exploiter ces résultats obtenus en faisant l'extraction des patrons.
L'extraction des patrons consiste à extraire, au sein d'un corpus étiqueté, l'ensemble des graphies qui correspond au patrons recherchés.
Dans la suite de ma troisième boite à outil je vais m'intéresser aux patrons suivants NOM ADJ, NOM NOM et NOM PREP NOM.
Cette opération va se faire avec deux méthodes différentes:
1. Première méthode en utilisant un script Perl qui prend en entrée les sorties brutes de létiquetage en particulier la sortie obtenue avec Cordial.
2. Deuxième méthode en utilisant des Requêtes XPATH sur les fichiers XML génerer en particulier avec treetagger et le programme treetagger2xml.