Etape 4
Recherche de patrons syntaxiques dans le corpus
On utilisera ici la version étiquetée du corpus Prématurés 96 (
p96.tag).
On tentera de mettre au jour des structures syntaxiques récurrentes dans le corpus autour de formes pôles.
On choisira cinq formes graphiques différentes. On construira
ensuite un programme perl qui prend en entrée le fichier
catégorisé et un nombre donné. Ce nombre
définira la longueur de la fenêtre de mots que
l'utilisateur souhaite extraire autour de la forme pôle.
Fichier contenant le programme: cliquez!!
Les formes recherchées sont: contact, soins, calme, mignonne, pleure.
Dans la console on aura:
Fichier contenant le résultat de la concordance pour p96.tag: cliquez!!