Boîtes à outils pour le traitement des fils de presse

Egle Ramdani  (Master TAL, Paris 3)

EXTRACTION DU CONTENU DES BALISES DESCRIPTION


La structure d'un fichier contenant un fil de presse est présentée ci-contre.
A partir de cette structure, un programme perl va extraire le contenu des balises description qui contient l'information textuelle du fil de presse.


Le résultat est un fichier XML qui peut être affiché avec une feuille de style XSLT