Olga Semenova

DESS de Traductique (INALCO)

Boîte à outils

 

Introduction


Ce travail a pour but d'approfondir les connaissances en traitement automatisé de l'information, notamment pour filtrer le contenu de fichiers structurés, y appliquer des méthodes d'étiquetage, extraire des patrons morphosyntaxiques prédéfinis à partir d'un fichier étiqueté et ensuite construire des graphes permettant la visualisation de ces patrons.

L'exercice est divisé en quatre parties principales :

  1. [Série 1] Automatisation du filtrage sur un arbre de fils
  2. [Série 2] Etiquetage des contenus des fils: Tree Tagger et Cordial
  3. [Série 3] Extraction terminologique: Tree Tagger et Cordial
  4. [Série 4] Construction des graphes

Le travail a été exécuté à partir d'une base fournie composée d'une arborescence de fichiers à traiter (voir ci-dessous) et d'un squelette de programme Perl qui permet de parcourir cette arborescence.

arborescence
[Retour au sommet]