Site de Lionel.SHEN

Aspect informatique

Retour à Page d'acceil

Réalistion du programme:
Avant de programmer j’ai écrit l'algorithme au format word.

Les étapes importantes sont:

* Aspiration des pages avec wget

** Le dumpage avec lynx

*** La recherche des lignes avec egrep

**** La réalisation du tableau en html.

Remarque: Les fichiers textes enregistrés au format Windows ne marcheront pas sous l'environnement Unix,

(voir le cours de J.F Perrot). En effet, Les retours à la ligne des fichiers textes (tapés sous Windows XP)

sont interprétés différemment par Cygwin (qui émule un système UNIX).

Notepad++, en particulier, permet de régler ce problème(fiche créée Par Pierre.M):

Le script que j'ai fait:

#!/bin/bash
echo "Bonjour, indiquez ou se trouvent les fichiers URL?"
read rep
echo "Comment tu veux appeler ton fichier tableau?"
read fichierTAB
echo "donne le motif a chercher :"
read motif
echo "voici le motif :" $motif
echo "<html><head><title>Sens et traduction du mot procedure</title><body><table border="1" cellspacing="0" cellpadding="0" width="100%"> " > ../tableau/$fichierTAB.html
i=1

for dos in `ls ../$rep/`
{

    for fichier in `ls ../$rep/$dos`
        {
            echo "<table border=1>" >> ../tableau/$fichierTAB.html
            echo "<tr><td colspan=\"3\"><b>Fichier $fichier</b></td></tr>" >> ../tableau/$fichierTAB.html
            for nom in `cat ../$rep/$dos/$fichier`
                {
                wget -O ../pagesAspirees/$i.html $nom
                lynx -dump $nom > ../PAGES_DUMP/$i.txt
                egrep -i "\b$motif\b" ../PAGES_DUMP/$i.txt > ../PAGES_CONTEXTES/$i.txt
                echo "<tr><td><a href=\"$nom\">URL_lien $i</a></td><td><a href=\"../pagesAspirees/$i.html\">PagesAspirees $i</a></td><td><a href=\"../PAGES_DUMP/$i.txt\">PAGES_DUMP</a></td><td><a href=\"../PAGES_CONTEXTES/$i.txt\">PAGES_CONTEXTE</a></td></tr>" >> ../tableau/$fichierTAB.html;
                let "i+=1";
                }
            echo "</table>" >> ../tableau/$fichierTAB.html
            echo "<br>" >> ../tableau/$fichierTAB.html
        }
    }




echo "</body></html>" >> ../tableau/$fichierTAB.html