Partie 1 - Etape 4 - Exercice 1

Recherche de patrons syntaxiques dans le corpus.

· On utilisera ici la version étiquetée du corpus Prématurés 96 (p96.tag).

· On tentera de mettre au jour des structures syntaxiques récurrentes dans le corpus autour de formes pôles.
Exercice 1 :

1. Vous choisirez cinq formes graphiques différentes. Vous construirez ensuite un programme perl qui prend en entrée le fichier catégorisé et un nombre donné. Ce nombre définira la longueur de la fenêtre de mots que vous souhaitez extraire autour de la forme pôle.

2. Vous appliquerez ce programme sur votre fichier catégorisé.


Forme 1

Script :  Cliquez ici  

Commande: 

Résultat:   Cliquez ici        

Commentaires : En premier argument on a le nom du fichier de travail
                              En deuxième argument on a la forme recherchée entre guillemets
                              En troisième argument on a le nombre de mots des contextes gauche et droite

Forme 2

Script :  Cliquez ici  

Commande: 

Résultat:  Cliquez ici      

Commentaires : En premier argument on a le nom du fichier de travail
                              En deuxième argument on a la forme recherchée entre guillemets
                              En troisième argument on a le nombre de mots des contextes gauche et droite

Forme 3

Script :  Cliquez ici  

Commande: 

Résultat:   Cliquez ici     

Commentaires : En premier argument on a le nom du fichier de travail
                              En deuxième argument on a la forme recherchée entre guillemets
                              En troisième argument on a le nombre de mots des contextes gauche et droite

Forme 4

Script :  Cliquez ici  

Commande: 

Résultat:   Cliquez ici     

Commentaires : En premier argument on a le nom du fichier de travail
                              En deuxième argument on a la forme recherchée entre guillemets
                              En troisième argument on a le nombre de mots des contextes gauche et droite

Forme 5

Script :  Cliquez ici  

Commande: 

Résultat:   Cliquez ici     

Commentaires : En premier argument on a le nom du fichier de travail
                              En deuxième argument on a la forme recherchée entre guillemets
                              En troisième argument on a le nombre de mots des contextes gauche et droite