Boîte à outils 3 : Extraction de patrons (suite)
  • Réalisation : Extraction de patrons avec un script Perl

Nous utilisons un script perl qui prend en paramètre : le fichier de sortie de la boîte à outils 2 issu de Cordial et le fichier de patron NOM-ADJ saisi à la main et enregistré au format texte.

Notre script parcourt le fichier de sortie et crée trois tableaux de scalaires

@token contient la liste des formes
@lemme contient la liste des lemmes
@pos contient la liste des étiquettes

Les patrons sont ensuite recherchés dans le tableau @pos, et les lemmes correspondant extraits du tableau @lemme.

Script chargé d’extraire les patrons ici

Sur la fenêtre de commande cygwin, nous avons tapé la ligne de commande comme suit :


Résultat

Et nous avons obtenu en sortie un fichier nommé liste-patron-cordial.txt

précédent<<suivant>>