|
MkCorpus/CorpusPlusBuilder... Module : make corpus tag S. Fleury 01/07/2001 Ce programme traite un corpus XML issu de la chaîne webxref-038 et construit un corpus pour Lexico3 contenant uniquement des balises HTML préalablement sélectionnées. Ce programme prend en arguments 3 paramètres : 1. Le répertoire de sortie des résultats 2. Le corpus XML de travail 3. Le fichier des balises HTML sélectionnées et à extraire du corpus XML
Dans la fenêtre de lancement du programme il faut donc donner : Dir Input : le chemin du répertoire contenant le corpus XML (terminé par /) CorpusXMLName : le nom du fichier/corpus XML Selected Markup FileName : le nom du fichier contenant les balises sélectionnées. Ce fichier est composé de la manière suivante : TAG1tabulationX TAG2tabulationY TAG1 et TAG2 sont des balises HTML, suivies d'une tabulation, puis d'une valeur numérique (X, Y). Dir Output : le chemin du répertoire de sortie (terminé par /)
|