BAO3                      

                                                                                                                                                                                                                                                                                                                                       Accueil              BAO1             BAO2            BAO3             BAO4                                                                                                                                                                                                                         

                                                                                         
                                   
                       BAO3  
EXTRACTION DES PATRONS

                         bao3
                  
                                    On utilise les résultats obtenus par la boîte à outils 2 pour en extraire les patrons.
                                    Tout d'abord, on extrait un à un les fichiers avec X-PATH en utilisant les patrons NOM ADJ.
                                      
                                     la requête est : 


                                 v:(//element[./data[contains(text(),'NOM')]]/following-sibling::element[1]
                                     [./data[contains(text(),'ADJ')]]/data[3]/text())|(//element[./data[contains(text(),'
                                     ADJ')]]/preceding-sibling::element[1][./data[contains(text(),'NOM')]]/data[3]/text())

                                     En utilisant les résutats des fichiers étiquetés par  cordial, on obtient les listes nom-adj
                                     suivantes  medias_adj_nom.txt . Avec les résultats de treetagger,on obtient les listes nom-adj
                                     nom-adj-examens.txt
.
                                     Mais cette méthode est très laborieuse et nous avons utilisé le script de Mr Daube, test.pl.  
                                     Avec ce scritp on obtient bien un fichier texte contenant les nom-adj pour chaque titre.



remonter