Documents Structurés

Site réalisé dans le cadre du cours de Documents Structurés par Kelly MASCLEF et Julie SAUVAGE.

Visiter le site

Projet Encadré 1

Programmation et Projet Encadré 1 du Semestre 1 par Kelly MASCLEF et Julie SAUVAGE (et avec Julie BELIAO).

Visiter le site

Projet Encadré 1

Programmation et Projet Encadré 1 du Semestre 1 par Ilaria TIDDI (avec Marcelo MATOSO et Camille DOUDANE).

Visiter le site

TAL

L5T53 / L5T55 (BASH/Emacs/Python) par Kelly MASCLEF

Visiter le site

Environnement-TAL

L5T53 / L5T55 (BASH/Emacs/Python) par Julie SAUVAGE

Visiter le site

Programmation pour le TAL avec PERL

L6T54 / L6T55 (PERL) par Julie SAUVAGE

Visiter le site

Bienvenue chez Perl

L6T54 / L6T55 (PERL) par Kelly MASCLEF

Visiter le site

Boîte à Outils 4

Dans cette dernière boîte à outils, nous allons produire des graphes permettant de mettre en valeur les relations entretenues par les différents éléments à partir des patrons syntaxiques extraits.

Pour créer ces graphes de mots nous allons utiliser le programme patron2graphe.exe. Malheureusement, ce programme n'est exécutable que sous Windows... Amateurs de Mac, abstenez vous ! Ainsi, pour lancer ce programme, tout s'exécute en ligne de commande (pour notre part, nous l'avons fait sous cygwin) et voici dans quel ordre il faut rentrer les arguments:

MmeJe-sais-tout@projet2 /projet-encadre2/
$ patron2graphe.exe "iso-8859-1" patron.txt motif-iso-8859-1.txt

  • patron2graphe.exe : ceci est le nom du programme à exécuter, il se met en premier
  • iso-8859-1 précise l'encodage des caractères dans les fichiers qui suivent
  • patron.txt est le fichier qui contient les patrons extraits à partir de la Bao3
  • motif-iso-8859-1.txt sert à extraire des séquences tournant autour du même motif (le motif peut être par exemple "\béco" si on souhaite récupérer des séquences contenant un mot commençant par "éco").
  •  

    Nous avons extrait dans la BàO3 des patrons sur 5 rubriques (Opinions, Société, À la une, International, Europe) que nous avons séparées selon leur étiquetage (Cordial, TreeTagger). Nous avions choisi 4 patrons: NOM PREP NOM, NOM PREP ADJ, ADJ PREP NOM et ADJ PREP ADJ, les graphes ont donc été construits en fonction des quatre différents patrons mais aussi en fonction de trois motifs: "crim", "économi" et "polit".


    Avec le motif "\bcrim"

  • NOM PREP NOM
  • Avec CordialAvec TreeTagger

     

  • NOM PREP ADJ
  • Avec CordialAvec TreeTagger

     

  • ADJ PREP NOM
  • Avec CordialAvec TreeTagger

     

  • ADJ PREP ADJ
  • Avec CordialAvec TreeTagger

     

     

    Avec le motif "\béconomi"

  • NOM PREP NOM
  • Avec CordialAvec TreeTagger

     

  • NOM PREP ADJ
  • Avec CordialAvec TreeTagger

     

  • ADJ PREP NOM
  • Avec CordialAvec TreeTagger

     

  • ADJ PREP ADJ
  • Avec CordialAvec TreeTagger

     

     

    Avec le motif "\bpolit"

  • NOM PREP NOM
  • Avec CordialAvec TreeTagger

     

  • NOM PREP ADJ
  • Avec CordialAvec TreeTagger

     

  • ADJ PREP NOM
  • Avec CordialAvec TreeTagger

     

  • ADJ PREP ADJ
  • Avec CordialAvec TreeTagger


    [Haut de Page]