Ce petit programme exécutable est une synthèse des boîtes à outils numéro 1 et 2.

Il reprend le script utilisant seulement des expressions régulières et ceux utilisant les modules XML::LibXML et XML::XPath.

D'un simple glisser-déposer, ce programme produit la sortie des scripts de la boîte à outils numéro 2.

"Car ceci est une révolution ...."
En effet, ce programme est exécutable sans avoir besoin de modules installés, ni même sans avoir Perl installé sur la machine !
Réalisé avec le module Perl/TK, ce programme a été rendu complètement exécutable avec PerlApp.
De ce fait, ce programme ne nécessite aucune installation de Perl.

Pour l'instant, il fonctionne sous les versions 32bits de Windows à savoir :  Windows 95, 98, ME, 2000, NT, XP, Vista et Windows 7.

Pour télécharger ce programme cliquez ici : 

Comment utiliser ce programme ?

Vous voulez l'utiliser ? Rien de plus simple.

Télécharger l'archive contenant le programme et ses ressources grâce au lien ci-dessus.
L'archive contient un répertoire "2010_test" pour le tester.

Décompresser, ensuite lancer l'exécutable sobrement nommé "BAO".

 
Le programme "BAO" fourni avec tree-tagger indispensable pour son fonctionnement.

Une fois lancé, la fenêtre d'exécution s'ouvre :



Ce programme vous permet de choisir entre 3 méthodes : avec seulement les expressions régulières, avec le module XML::LibXML ou avec le module XML::XPath.
Pour lancer le traitement, selectionner un répertoire contenant les fils rss :



En maintenant le répertoire, faire un glisser-déposer vers la fenêtre du programme au niveau de la méthode voulue (en haut avec seulement les expressions régulières, au milieu avec le module XML::LibXML et en bas avec le module XML::Xpath).



Le fameux "glisser-déposer", ici on lance le traitement avec le module XML::LibXML

Une fois le répertoire déposé, le traitement se lance :



Le programme en cours de traitement ...

Une fenêtre apparait une fois le traitement terminé :



Le programme a fini sa tâche !

Les résultats sont contenus dans un répertoire créé dans celui du programme.

       
Le répertoire contenant les résultats d'extraction

Les résultats sont rangés dans un répertoire Cordial (contenant les fichiers en iso-8859-1 prêts à être utilisés par Cordial) et un répertoire résultat (contenant la sortie au format txt, xml et xml étiquetée par tree-tagger).


Les 2 répertoires de sortie


Le contenu du répertoire résultat


Le contenu du répertoire cordial, le répertoire fichier contient les fichiers de moins de 2Mo


Réalisation du programme BAO

Pour télécharger le script cliquez ici :

Si vous voulez le visualiser cliquez ici :

Le script a été rendu exécutable avec PerlApp qui fait partie de la suite logicielle Perl Dev Kit (PDK) d'Active State.
Merci à Serge Fleury de l'avoir rendu exécutable avec la version complète de PerlApp.

Le script intégre le module Perl/TK qui permet de créer des fenêtres graphiques avec Perl.

L'aspect du programme et le glisser-déposer (drag & drop) sont très largement inspirés du tutoriel proposé par "djibril" sur le site developpez.com.

Le message de fin d'extraction est inspiré du script proposé "djibril" sur le site developpez.com utilisant la méthode "messageBox" de tk.

[haut de page]