Boîte à outils 3

Il s'agit de créer dans cette étape de nouveaux scripts capables d'extraire des patrons syntaxiques à partir des fichiers produits par la BàO2. Pour cela, on utilisera plusieurs méthodes différentes:

1.  Extraction terminologique : avec un script perl sans module.

2.  Extraction terminologique : avec un script perl utilisant le module XML::XPATH.

3.  Extraction terminologique : avec des feuilles de styles XSLT.



Schémas:



Schéma de la boîte 1


Schéma de la boîte 1


Schéma de la boîte 1


SCRIPT PERL SIMPLE


SCRIPT:

En entrée, on utilise non seulement le fichier de sortie de TreeTagger de la BàO2 mais aussi le fichier texte contenant les patrons syntaxiques.


Téléchargement du script en format perl (solution 1): Cliquez-ici

Téléchargement du script en format perl (solution 2): Cliquez-ici


RESULTATS:


On obtient un fichier texte pour chaque patron syntaxique.


• En format txt pour le patron syntaxique 'Nom Prep Nom': Cliquez-ici


• En format txt pour le patron syntaxique 'Nom Adj': Cliquez-ici


• En format txt pour le patron syntaxique 'Adj Nom': Cliquez-ici


• En format txt pour le patron syntaxique 'Nom Nom': Cliquez-ici



XSLT::XPATH


En entrée, on utilise non seulement le fichier de sortie de TreeTagger de la BàO2 (au format XML) mais aussi une feuille de style XSLT suivant le patron syntaxique que l'on veut extraire.
La sortie de cette méthode sera au format txt et html.



Script pour la sortie en format txt:

• En format xsl pour le patron syntaxique 'Nom Prep Nom': Cliquez-ici


• En format xsl pour le patron syntaxique 'Nom Adj': Cliquez-ici


• En format xsl pour le patron syntaxique 'Adj Nom' : Cliquez-ici


• En format xsl pour le patron syntaxique 'Nom Nom': Cliquez-ici



Script pour la sortie en format html:

• En format xsl pour le patron syntaxique 'Nom Prep Nom': Cliquez-ici


• En format xsl pour le patron syntaxique 'Nom Adj': Cliquez-ici


• En format xsl pour le patron syntaxique 'Adj Nom' : Cliquez-ici


• En format xsl pour le patron syntaxique 'Nom Nom': Cliquez-ici



RESULTATS:


On obtient en sortie un fichier en format txt et html pour chaque patron syntaxique.


• En format txt pour le patron syntaxique 'Nom Prep Nom': Cliquez-ici


• En format txt pour le patron syntaxique 'Nom Adj': Cliquez-ici


• En format txt pour le patron syntaxique 'Adj Nom' : Cliquez-ici


• En format txt pour le patron syntaxique 'Nom Nom': Cliquez-ici



• En format html pour le patron syntaxique 'Nom Prep Nom': Cliquez-ici


• En format html pour le patron syntaxique 'Nom Adj': Cliquez-ici


• En format html pour le patron syntaxique 'Adj Nom' : Cliquez-ici


• En format html pour le patron syntaxique 'Nom Nom': Cliquez-ici



XML::XPATH


On crée un nouveau script perl qui prend en entrée non seulement la sortie de Cordial de la BàO2 (au format cnr) mais aussi le fichier texte contenant les patrons syntaxiques.


SCRIPT:

Téléchargement du script en format perl: Cliquez-ici


RESULTATS:


• En format txt pour le patron syntaxique 'Nom masculin singulier Préposition Nom masculin singulier': Cliquez-ici


• En format txt pour le patron syntaxique 'Nom masculin singulier Adjectif numérique': Cliquez-ici


• En format txt pour le patron syntaxique 'Adjectif féminin singulier Nom féminin singulier' : Cliquez-ici


• En format txt pour le patron syntaxique 'Adjectif masculin singulier Nom masculin singulier': Cliquez-ici


• En format txt pour le patron syntaxique 'Déterminant démonstratif Nom féminin singulier': Cliquez-ici