Présentation:

Après avoir appliquer l'étiquetage avec Treetagger et Cordial, notre troisième boite à outil a pour objectif d'exploiter ces résultats obtenus en faisant l'extraction des patrons.

L'extraction des patrons consiste à extraire, au sein d'un corpus étiqueté, l'ensemble des graphies qui correspond au patrons recherchés.

Dans la suite de ma troisième boite à outil je vais m'intéresser aux patrons suivants NOM ADJ, NOM NOM et NOM PREP NOM.


Cette opération va se faire avec deux méthodes différentes:

1. Première méthode en utilisant un script Perl qui prend en entrée les sorties brutes de l’étiquetage en particulier la sortie obtenue avec Cordial.

2. Deuxième méthode en utilisant des Requêtes XPATH sur les fichiers XML génerer en particulier avec treetagger et le programme treetagger2xml.


  BAO 1

Télécharger le script + Les sorties de BAO1

  BAO 2

Télécharger le script + Les sorties de BAO2

  BAO 3

Télécharger le script + Les sorties de BAO3