Script commenté
#!/bin/bash
echo "Donnez le nom du
fichier (html) ou le tableau sera créé:";
Le texte entre les " " s'affiche sur l'écran et demande à l'utilisateur d'interagir
read tablo;
Récupération du nom de fichier entré par l'utilisateur dans une variable nommée tablo
echo
"<html><head><title>TableauURL</title></head><body>"
> $tablo;
Création du fichier html dans ce variable
echo "<table left border="1">" >> $tablo;
Création du tableau dans ce fichier
echo "Donnez le nom du répertoire où sont les
URLs";
Le texte entre les " " s'affiche sur l'écran et demande à l'utilisateur d'interagir
read rep;
Récupération du nom du fichier dans une variable nommée rep
cd $rep;
Déplacement dans le répertoire
for fic in `ls ` Une
boucle qui affiche tous les éléments du répertoire
courant (=des fichiers contenant des URLs dans notre cas) et execute
les instructions suivantes pour tous les éléments
{
mkdir ../Pages/$fic;
Création
d'un sous-répertoire (dans le répertoire Pages) portant
le même nom que le fichier en question
mkdir ../Dump-texte/$fic;
Création d'un sous-répertoire (dans le répertoire Dump-texte) portant le même nom que le fichier en question
mkdir ../Egrep-texte/$fic;
Création d'un sous-répertoire (dans le répertoire Egrep-texte) portant le même nom que le fichier en question
echo "<tr align="center">"
>> ../$tablo;
Création de la première ligne du tableau avec alignement au centre
echo "<td bgcolor="#CCFFFF"
colspan="4"
rowspan="1"><big>Usage:
$fic</big></td></tr>"
>> ../$tablo;
Mise en forme de la première ligne
for url in `cat $fic` Une
boucle qui affiche tous les lignes du fichier courant et execute
les instructions suivantes pour tous les éléments
{
wget $url -O ../Pages/$fic/$(basename
${url}).html;
Récupération (avec wget) de la page web se trouvant à l'adresse indiquée dans le fichier
echo
"<tr><td><a
href=$url>$url</a></td>"
>> ../$tablo;
Création de la premier cellule d'une ligne consacrée
à cette URL en lui associant un lien vers ce URL
echo "<td><a
href=Pages/$fic/$(basename
${url})>$(basename ${url})</a></td>"
>> ../$tablo;
Création
de la deuxième cellule d'une ligne consacrée à
cette URL en lui associant un lien vers la page
enregistrée
lynx -dump $url > ../Dump-texte/$fic/$(basename ${url}).txt;
Récupération (avec lynx) du texte de la page web
echo "<td><a
href=Dump-texte/$fic/$(basename ${url}).txt>$(basename
${url}).txt</a></td>" >>
../$tablo;
Création
de la troisième cellule d'une ligne consacrée à
cette URL en lui associant un lien vers le fichier texte
créé
egrep -i -n -B1 -A1 barrage
../Dump-texte/$fic/$(basename ${url}).txt | egrep -v http:// >
../Egrep-texte/$fic/$(basename ${url})egrep.txt;
Filtrage (avec egrep) des lignes contenant du mot "barrage"
echo "<td><a
href=Egrep-texte/$fic/$(basename ${url})egrep.txt>$(basename
${url})egrep.txt</a></td></tr>"
>> ../$tablo;
Création
de la quatrième cellule d'une ligne consacrée à
cette URL en lui associant un lien vers le fichier contenant les
lignes filtrées
}
}
echo "</table></body></html>"
>> ../$tablo;
Déclaration de la fin du fichier html