Dans le cadre du cours « Programmation et projet encadré 2 » du Master 1 PluriTAL, enseigné par Monsieur Serge Fleury et Monsieur Pierre Magistry, nous avons mené un projet en mettant en oeuvre d'une chaîne de traitement textuel semi-automatique pour extraire et traiter les données linguistiques contenues dans ces flux RSS.
Le projet des boites à outils a pour but d'extraire les titres et description d'un flux RSS afin de les étiqueter et de faire de l'extraction terminologique à partir de patron. Il a également pour but l’apprentissage du langage Perl.
Le corpus de travail est une arborescence de fils RSS disponibles sur le site du journal Le Monde recueillis une fois par jour à 19h pendant l'année 2021.
Etudiante en M1 Traitement Automatique des Langues à la Sorbonne Nouvelle, j’ai fait ma licence en langue et littérature françaises.
Etudiante en M1 Traitement Automatique des Langues à la Sorbonne Nouvelle, j’ai fait ma licence en Sciences du langage.