L'extracteur
Dans
cette partie, je vous propose de visualiser le script qui m'a permis de
réaliser l'extracteur puis, dans un deuxième temps, je
vais vous proposer des captures d'écran vous montrant le
résultat.
Si vous voulez directement visualiser une étape, cliquez dessus :
-Le script
-L'interface de base
-Linterface commentée
-Résultat de la page web avec les balises / sans les balises
-La barre de recherches
-Le dictionnaire des occurrences
-La concordance
-Treetagger
-L'extraction de patrons syntaxiques du type Nom/adj
-Le rapport
-Le manuel
++ Le script :
++ L'interface :
++ L'interface commentée :
++ Si vous voulez travailler sur une page web, rentrez dans la
barre de saisie url l'adresse du site, puis appuyer sur Load URL une
fois que vous avez fait ceci voici ce qui apparait :
>>
Ici, le contenu de la page s'affiche avec toutes les balises HTML. Pour
enlever les balises et n'obtenir que le texte brut, pressez URL2txt.
Vous obtiendrez ceci :
Dans cette page, vous pouvez rechercher des occurrences en vous servant de la barre de recherche. Une fois trouvés, les mots clignotent dans le texte.
++ Aperçu du dictionnaire des occurrences (triées par ordre alphabétique) de ce texte :
Pour obtenir une concordance, il suffit de sélectionner un ; ou
plusieurs mots en appuyant sur la touche Ctrl de votre clavier; et
d'appuyer sur le boutton "concordance".
++ Résultat de la concordance :
>>
Ici apparaissent les contextes gauche, le pôle ( c'est a dire les
occurrences recherchées) et le contexte droit. Nous avons
paramétré à 5 le nombre de mots en contexte gauche
et droit.
++ Treetagger (cliquez sur l'image pour voir le script qui s'y rattache )
Ici il annote le texte et le catégorise en patrons syntaxiques.
++ L'extraction de patrons : (cliquez sur l'image pour voir le script qui s'y rattache )
Ici le programme m'a extrait les patrons de la forme Nom/adj.
++ Le rapport fait sur le fichier analysé : (cliquez sur l'image pour voir le script qui s'y rattache )
++ Le manuel : (cliquez sur l'image pour voir le script qui s'y rattache )
Dans le manuel, vous trouverez toutes les grandes applications de
l'extracteur et vous verrez notamment comment les faire marcher.