BAO4
Dans la BAO 4, nous avons généré des graphes pour mettre en valeur les résultats que nous avons obtenus dans la BAO 2 et 3. Pour ce faire, nous avons généré, dans un premier temps, des graphes généraux (cf. infra, 2- Graphes générés à partir de la sortie de Treetagger ; 3- Graphes générés à partir de la sortie de Cordial).
Dans un second temps, nous avons utilisé des motifs et des graphes généraux pour mettre en valeur certaines erreurs d'étiquetage dans les sorties de Treetagger et de Cordial (cf. infra, 4- Quelques erreurs d'étiquetage). Ceci nous permettra de mettre en valeur les forces et les faiblesses de chaque étiqueteur.
Avant de présenter nos graphes, nous allons voir comment fonctionne le programme patron2graphe.exe
1- Patron2graphe
Patron2graphe.exe est un programme qui est extrait du Trameur. Ce programme permet de générer des graphes.
La ligne de commande à saisir est la suivante :
patrons2graphe.exe "encodage" fichier-de-patrons.txt motif.txt
L'utilisation d'un motif n'est pas obligatoire. En effet, un motif permet de filtrer les patrons pour ne garder que ceux qui sont pertinents. Pour utiliser un motif, il faut crée un fichier au format texte et écrire cette ligne :
Motif=motif (e.g., Motif=exposition).
2- Graphes générés à partir de la sortie de Treetagger
Le patron NOM ADJ
Cliquez sur l'image pour l'agrandir
haut de page
Le patron NOM PREP NOM
Cliquez sur l'image pour l'agrandir
Ce graphe permet de mettre en valeur le nombre important de patrons NOM PREP NOM qui ont été extraits à partir de la sortie de Treetagger.
3- Graphes générés à partir de la sortie de Cordial
Le patron NOM ADJ
Cliquez sur l'image pour l'agrandir
haut de page
Le patron NOM PREP NOM
Cliquez sur l'image pour l'agrandir
4- Quelques erreurs d'étiquetage
L'interprétation de deux noms comme un patron NOM ADJ
Cliquez sur l'image pour l'agrandir
Ce graphe montre que Treetagger interprète l'apposition de deux noms comme un patron NOM ADJ.
Nous avons utilisé le motif "site".
haut de page
L'attirance entre le prénom et le nom
Cliquez sur l'image pour l'agrandir
Ce graphe montre que Treetagger interprète un prénom suivi d'un nom comme un patron NOM ADJ. Nous pouvons constater, néanmoins, l'attirance qui réside entre un prénom et un nom. Rappelons que cette attirance est issue d'un étiquetage erroné.
L'étiquetage de "du"
Cliquez sur l'image pour l'agrandir
On constate, à la lumière de ce graphe, que Treetagger reconnaît "du" comme une préposition, ce qui n'est pas le cas pour Cordial, qui l'étiquette comme un déterminant, d'où l'absence de ce type de patron NOM PREP NOM lorsque nous avons utilisé la sortie étiquetée avec Cordial.
Nous avons utlisé le motif "du".
haut de page
Le patron "vie commune"
Cliquez sur l'image pour l'agrandir
On constate, à la lumière de ce graphe, que Cordial reconnaît "vie commune" comme un patron NOM ADJ, ce qui n'est pas le cas pour Treetagger qui l'étiquette comme une suite de deux noms.
Nous avons utlisé le motif "vie".
Le patron exposition L'
Cliquez sur l'image pour l'agrandir
Ce graphe met en valeur une erreur d'étiquetage. En effet, Cordial reconnaît L' comme un adjectif.
Nous avons utlisé le motif "exposition".
haut de page
D'autres erreurs d'étiquetage dans la sortie de Cordial
Cliquez sur l'image pour l'agrandir
Ce graphe met en valeur certains patrons NOM ADJ, qui sont le résultat d'un étiquetage erroné dans la sortie de Cordial. Ces erreurs ont déjà été évoquées dans la (BAO3).
Un patron NOM PREP NOM incorrect issu d'une erreur d'orthographe
Cliquez sur l'image pour l'agrandir
Ce graphe montre l'extraction du patron NOM PREP NOM "Evoqué par Nicolas", qui est le résultat d'une erreur d'orthographe selon l'étiquetage de Cordial.