accueil | bào1 | bào2 | bào3 | bào4 | bào + le_trameur
Objectif : construire une liste de patrons à partir des contenus textuels des fils traités.
L'ensemble des fichiers XML obtenus lors de la phase d'étiquetage morpho-syntaxique.
Ecrire une feuille de styles pour chacun des patrons à extraire. L'évaluation XPath marche aussi bien pour les fichiers étiquetés avec Cordial que ceux étiquetés avec TreeTagger.
Feuille de styles : nom_adj.xsl
<xsl:template match="element"> <xsl:if test="(./data[contains(text(),'NC') or contains(text(),'NOM')]) and (following-sibling::element[1][./data[contains(text(),('ADJ'))]])"> <xsl:value-of select="./data[3]" /> <xsl:text> </xsl:text> <xsl:value-of select="following-sibling::element[1]/data[3]" /> <xsl:text> </xsl:text> </xsl:if> </xsl:template>
Feuille de styles : nom_nom.xsl
<xsl:template match="element"> <xsl:if test="(./data[contains(text(),'NC') or contains(text(),'NOM')]) and (following-sibling::element[1][./data[contains(text(),'NC') or contains(text(),'NOM')]])"> <xsl:value-of select="./data[3]" /> <xsl:text> </xsl:text> <xsl:value-of select="following-sibling::element[1]/data[3]" /> <xsl:text> </xsl:text> </xsl:if> </xsl:template>
Feuille de styles : nom_prep_nom.xsl
<xsl:template match="element"> <xsl:if test="(./data[contains(text(),'PREP') or contains(text(),'PRP')]) and (preceding-sibling::element[1][./data[contains(text(),'NC') or contains(text(),'NOM')]]) and (following-sibling::element[1][./data[contains(text(),'NC') or contains(text(),'NOM')]])"> <xsl:value-of select="preceding-sibling::element[1]/data[3]" /> <xsl:text> </xsl:text> <xsl:value-of select="./data[3]" /> <xsl:text> </xsl:text> <xsl:value-of select="following-sibling::element[1]/data[3]" /> <xsl:text> </xsl:text> </xsl:if> </xsl:template>
Tester les différentes transformations XSL avec un programme comme Cooktop :
Ecriture d'un programme (bao3.pl) chargé d'extraire les suites NOM-ADJ, NOM-NOM et NM-PREP-NOM de chacun des fichiers.
Fichiers : bao3.pl
Cooktop : http://www.xmlcooktop.com/
SLTProc : http://gd.tuwien.ac.at/linuxcommand.org/man_pages/xsltproc1.html