Boîte à Outils 3
Objectif :
– On doit construire une liste de patrons à
partir des contenus textuels des fils traités
● Liste des patrons à extraire :
– En sortie, on doit obtenir une liste de patrons au format .txt
– Applications :
● un programme qui prend en entrée les sorties «brutes
» de l’étiquetage (par exemple les sorties Cordial)
● programme qui prend en entrée les sorties xml créées à partir de TreeTagger
● requête XPATH sur le fichier XML construit
– Traitement à réaliser :
● à partir de Cygwin B20, pour l'extraction des patrons via les sorties Cordial et TreeTagger
● à partir de Cygwin, pour l'extraction des patrons via la feuille de style XSLT