Boîte à outils
Boîte à outils 2
La Boîte à outils 2 consiste à étiqueter les contenus textuels des balises <description>avec Tree-Tagger et Cordial.
Ressources
Une arborescence de fils RSS
tokenise-fr.pl : programme pour découper un texte en mots
treetagger2xml.pl : programme permettant de convertir les données en sortie de TreeTagger au format XML
Etiquetage avec Tree-tagger
Avec Tree-Tagger, c'est simple : il suffit de l'appeler dans le programme à l'aide du script ici.
Résultat de l'étiquetage avec Tree-Tagger en XML.
Tout les résultats.
Etiquetage avec Cordial
Notez que Cordial ne veut que du fichier texte.
Pour appliquer Cordial, le paramétrage de l'étiquetage doit être comme ceci.
Il faut les traiter un par un.
Résultat de l'étiquetage avec Cordial en .txt(à la une).
Avec Tree-Tagger, c'est simple : il suffit de l'appeler dans le programme à l'aide du script ici.
Résultat de l'étiquetage avec Tree-Tagger en XML.
Tout les résultats.
Etiquetage avec Cordial
Notez que Cordial ne veut que du fichier texte.
Pour appliquer Cordial, le paramétrage de l'étiquetage doit être comme ceci.
Il faut les traiter un par un.
Résultat de l'étiquetage avec Cordial en .txt(à la une).