- Réalisation : Extraction de patrons avec un script Perl
Nous utilisons un script perl qui prend en paramètre : le fichier de sortie de la boîte à outils 2 issu de Cordial et le fichier de patron NOM-ADJ saisi à la main et enregistré au format texte.
Notre script parcourt le fichier de sortie et crée trois tableaux de scalaires
• @token contient la liste des formes• @lemme contient la liste des lemmes
• @pos contient la liste des étiquettes
Les patrons sont ensuite recherchés dans le tableau @pos, et les lemmes correspondant extraits du tableau @lemme.
Script chargé d’extraire les patrons ici
Sur la fenêtre de commande cygwin, nous avons tapé la ligne de commande comme suit :
Résultat
Et nous avons obtenu en sortie un fichier nommé liste-patron-cordial.txt