accueil | bào1 | bào2 | bào3 | bào4 | bào + le_trameur
Objectif : étiqueter les contenus textuels des balises "description"
Dans un premier temps, bao2-cordial.pl se charge de préparer notre corpus pour un étiquetage manuel. Les fichiers obtenus sont ensuite traités avec Cordial. Enfin, il reste à convertir le résultat de l'étiquetage au format XML avec cordial2xml.pl, une version modifiée de treetagger2xml adaptée au format des sorties Cordial.
fichiers : bao2-cordial.pl, cordial2xml.pl
L'étiquetage se fait en trois étapes :
Le résultat de l'étiquetage est donné à voir à l'aide d'une transformation XSL.
Feuilles de styles : style_cordial.xsl, style_tt.xsl
Cordial : http://www.synapse-fr.com/
TreeTagger : http://www.ims.uni-stuttgart.de/projekte/corplex/TreeTagger/