les segments répétés
Nous avons chargé le texte mois par mois et avons fait les segments répétés pour chaque mois puis nous les avons rassemblés dans un même fichier format txt, suivant les étapes explicités ci-dessous:
A-Cliquer sur le bouton SR «segments répétés» pour obtenir dans un onglet situé sur la droite de lécran nommé "segments répétés" la liste des segments visés, enregistrer la liste dans le rapport. Ensuite, nous avons enregistré le rapport.
B-Nous avons obtenu une liste des segments avec pour chacun sa fréquence et sa longueur : sr.html
C-Nous avons filtré le fichier html pour ne garder que les segments contenant le mot «crise» puis nous lavons nettoyé à la main sur Notepad++, il aurait aussi été possible de faire le nettoyage et le filtrage en utilisant un script Perl...
D-Nous avons concaténé tous les fichiers dans un seul fichier txt :
Le résultat est le suivant:
sr-crise.txt