Etape N°1 :

             On a commencé par rechercher les 50 URL traitant du sens de mot « barrage » nécessaire à notre travail. On a sélectionné trois sens ou  thèmes de             recherches qui sont:

    (hydraulique, routier (circulation), et sport (match de barrage). On a stocké les liens correspondant à chaque sens dans un fichier texte à part. Après on a appliqué la commande WGET –I  pour récupérer ces liens téléchargés et aspirer les pages web.

 

            Commande utilisée : WGET –i  <NOM fichier>

 

            En utilisant cette commande on a comme résultat une liste de pages aspirées.