Elle se décompose en quatre étapes principales du filtrage du corpus jusqu'à l'extraction de patrons.
Le point de départ du projet est la rubrique "Politique" du journal Le Monde.
PERL (Practical Extraction and Report Language) a été spécialement conçu pour la manipulation de textes dans le cadre de l'administration des systèmes (gestion de fichier, recherche et modifications de données de type texte). Ses principales fonctionnalités en font un langage adapté pour le travail sur tout type de données linguistiques. Perl est trés efficace notamment dans le parcours de fichiers textes, la recherche, l'extraction et la modification de segments de textes. Grâce à la puissance de ses expressions régulières, il est un outil optimal pour tout traitement sur les chaînes de caractères.
Contact:
Laurie Acensio
Kun JIN jin.kun@hotmail.com