Boîte à outils n°4(BAO4)
Des textes aux graphes
Nous avons utilisé un logiciel de visualisation développé par Pierre Magistry. A partir des données extraites dans la BAO3 lors de l'extraction des relations de dépendance, nous analysons visuellement ces relations lexicales sous forme de graphe. Nous chercherons à répondre à la question suivante : la visualisation du contenu textuel permet-elle d'identifier la rubrique thématique originale des données textuelles ?
Un script PYTHON a été utilisé. Il est détaillé dans le lien ci-dessous :
Sur le terminal, la requête suivante a été lancée python BAO4-visualisation-resultat-python.py corpus-titre-description.udpipe.xml | curl -X POST -H 'Content-Type:text/csv' --data-binary @- "https://padagraph.magistry.fr/post_csv/graphe-culture"
![Requete BAO4 Ubuntu](./images/BAO4_requete_Ubuntu.jpg)
En sortie, le résultat suivant est récupéré :
![BAO4 Visualisation](./images/BAO4_resultat.jpg)
On observe que le mot "pays" est dominant. Cela signifie-t-il que nous sommes dans la rubrique "International"? Les autres mots qui suivent sont "président", "gouvernement", "pouvoir". Le discours est politique.
Le résultat, en regardant le GOUV, est le suivant :
![BAO4 Visualisation GOUV](./images/BAO4_resultat_global_gouv.jpg)
Le résultat, en regardant le DEP, est le suivant :
![BAO4 Visualisation DEP](./images/BAO4_resultat_global_dep.jpg)
Si l'on fait un focus contextuel autour du mot "pays", le résultat, en regardant le GOUV, est le suivant :
![BAO4 Visualisation Pays GOUV](./images/BAO4_resultat_pays_gouv.jpg)
Si l'on fait un focus contextuel autour du mot "pays", le résultat, en regardant le DEP, est le suivant :
![BAO4 Visualisation Pays DEP](./images/BAO4_resultat_pays_dep.jpg)