Etape 4

Recherche de patrons syntaxiques dans le corpus


On utilisera ici la version étiquetée du corpus Prématurés 96 (p96.tag).

On tentera de mettre au jour des structures syntaxiques récurrentes dans le corpus autour de formes pôles.



On choisira cinq formes graphiques différentes. On construira ensuite un programme perl qui prend en entrée le fichier catégorisé et un nombre donné. Ce nombre définira la longueur de la fenêtre de mots que l'utilisateur souhaite extraire autour de la forme pôle.


Fichier contenant le programme: cliquez!!


Les formes recherchées sont: contact, soins, calme, mignonne, pleure.


Dans la console on aura:

e4



Fichier contenant le résultat de la concordance pour p96.tag: cliquez!!