BAO3
Accueil
BAO1
BAO2
BAO3
BAO4
BAO3 EXTRACTION
DES PATRONS
On
utilise les résultats obtenus par la boîte
à
outils 2 pour en extraire les patrons.
Tout
d'abord, on extrait un à un les fichiers avec X-PATH en
utilisant les patrons NOM
ADJ.
la
requête est :
v:(//element[./data[contains(text(),'NOM')]]/following-sibling::element[1]
[./data[contains(text(),'ADJ')]]/data[3]/text())|(//element[./data[contains(text(),'
ADJ')]]/preceding-sibling::element[1][./data[contains(text(),'NOM')]]/data[3]/text())
En
utilisant les résutats des fichiers
étiquetés par
cordial, on obtient les listes nom-adj
suivantes medias_adj_nom.txt
. Avec les résultats de treetagger,on obtient les listes
nom-adj
nom-adj-examens.txt.
Mais
cette méthode est très laborieuse et nous avons
utilisé le script de Mr Daube, test.pl.
Avec ce
scritp on obtient bien un fichier texte contenant les nom-adj pour
chaque titre.