dromadaire

T.A.L : Initiation à TK (3/3)

A quoi sert le quatrième onglet qui est «Rapport sur URL»?

Dans cet onglet, le programme indique quatre informations à l’utilisateur concernant le texte étudié. Il indique le nom de l'url, le nombre total de mot dans le texte et la fréquence et la forme maximale d’un mot.
Dans l’image ci-dessous, le programme a trouvé 105 mots dans le texte amants.txt et il nous indique que sa forme et sa fréquence maximales sont: «des» et 5.

fenêtre

A quoi sert le cinquième onglet qui «Treetagger»?

Treetagger est un logiciel mopho-syntaxique. Il prend chaque mot du texte et indique à quelle classe grammaticale appartient le mot, par exemple si c’est un nom, le programme collera l’etiquette «nom», si c’est un adjectif, il lui attribura l’étiquette «adjectif»...
Pour lancer ce programme, il faut d’abord aller dans le menu «Syntaxe» et cliquer sur «treetagger (en Francais)».

fenêtre

Le programme automatiquement va nous donner les différentes étiquettes morpho-syntaxiques de chaque mot du texte. L’image ci-dessous nous montre l’exemple:

fenêtre

A quoi sert le sixième onglet qui est «Extraction pattron»?

Dans ce dernier onglet, il s’aggit d’extraire automatiquement les patrons syntaxiques des séquences «Nom+ Adjectif» à travers le texte. Pour cela, on doit aller dans le menu «Syntaxe», puis on clique sur «Extraire les patrons syntaxiques». Le résultat s’affiche alors dans l’editeur de texte.

fenêtre

Aperçu du programme

En cliquant sur ce lien, vous aller accéder à l’intégralité du code du programme.

Conclusion:

Cette fenêtre graphique complexe et complet en soit permet de manipuler rapidement des données textuelles. En effet, cette fenêtre permet de travailler sur n’importe quel texte que cela soit un texte venant d’un répertoire de travail ou d’une page internet. On peut grâce à des options ou à des programmes mises en place rechercher rapidemment un mot dans le texte, avoir un dictionnaire qui indique en plus la fréquence des mots, faire des concordances ou encore obtenir des informations morpho-syntaxiques grâce à treetagger, en particulier. On peut facilement avoir accès au code du programme qui peut être modifié ou être enrichi par d’autres options.

Copyright 2009 Tubiana Séverine, tous droits réservés