Accueil


Boîte à outils 1


Boîte à outils 2


Boîte à outils 3


Boîte à outils 4


Boîte à outils et le Trameur









© 2008 | Tatiana   MAKOUSKAYA et
 Lionel SHEN (INaLCO)



Boîte à outils

Boîte à outils 3
Boîte à outils 3, il s'agit de réaliser l'extraction de patrons syntaxiques à partir de la sortie digérée par les parseurs présentés plus haut. Ici, nous nous sommes intéressées au patron NOM ADJ (postposition de l'adjectif dans le SN).

Au moins deux solutions s'offrent à nous pour effectuer ce traitement:
  • **l'utilisation d'un script Perl;
  • **l'utilisation de requêtes XPath et une feuille de style Xslt.


Mise en oeuvre 
 Extraction de patrons avec Tree-tagger

Car la sortie au format XML à partir de l'étiquetage par TreeTagger, XPath ne sont approprié.
Le document XML est mis en forme à l'aide d'une feuille de style Xslt, décrivant une suite de règles s'appliquant sur les noeuds ciblés -porteurs de l'information sur les catégories syntaxiques, qui contiennent donc des requêtes Xpath.

On veut que le fichier soit présenté comme "nom ADJ".

La feuille de style utilsée a deux états:

1.Un modèle qui a pour fonction d'extraire les patrons syntaxiques souhaités et de produire une sortie Html.

2.Cette feuille de style modifiée, permet d'obtenir une sortie au format TXT(fichier 1 et fichier 2).



Extraction de patrons avec Cordial
Pour la sortie Cordial, on applique un script Perl. Il prend en arguments la sortie de l'étiquetage et un fichier listant les patrons syntaxiques à extraire.



Voir tous les résultats de Cordial