Valeur
Accueil
Etapes
Commandes
Script
Tableaux
Commentaire
Script
voici le dernier script
#!usr/bin/bash
mkdir pagesaspirees;
#création de répertoire avec la commande "mkdir".
mkdir contexte
mkdir dump
echo "Pouvez-vous indiquer le dossier où se trouvent les fichiers d'URL? ";
read repertoireURL ;
# permet d'enregistrer la variable repertoireURL
echo "Quel nom veux-tu donner a ton tableau ?";
#c'est le tableau de liens à créer
read tablo;
#enregistre nom donné par utilisateur dans la variable $tablo
echo "Donne le motif recherchésur les pages originales : ";
read motif;
read motif1;
# deux motifs donnés par utilisateur dans les variables $motif et $motif1
for dossier in `ls $repertoireURL`
do
mkdir pagesaspirees/$dossier;
#création de dossier dans le répertoire
mkdir dump/$dossier
mkdir contexte/$dossier
echo "<html><head><title>Valeur</title></head><body>">>$tablo;
#début du document html
echo "<table width=60% border = "4" bordercolor = "#330000">">>$tablo;
echo "<p><TR><TD bgcolor=\"#996666\" colspan=10 align=center><STRONG><FONT SIZE=6><FONT COLOR= "#660000">Sens $dossier</FONT></STRONG></TD></TR>">>$tablo;
for fichier in `ls $repertoireURL/$dossier`
{
cpt=1
{
if echo "$ligne" | egrep -i "^h"
then
let " cpt += 1"
fi
}
nfichier=`basename $fichier .txt`
echo "<TR><TD bgcolor=\"#CC9999\"colspan=4 rowspan=$cpt align=left><FONT SIZE=5><FONT COLOR=\"#993333\">$nfichier</FONT></TD></TR><TR>">>$tablo;
mkdir pagesaspirees/$dossier/$nfichier
#création des fichiers dans chaques dossiers
mkdir dump/$dossier/$nfichier
mkdir contexte/$dossier/$nfichier
compt=0
for ligne in `cat $repertoireURL/$dossier/$fichier`
{
if echo "$ligne" | egrep -i "^h"
#lire tous les urls dans les fichiers textes.
then
let "compt += 1"
echo "<tr><TD width=10% ><a href="$ligne">URL $compt</a></TD>">>$tablo
wget -t 2 $ligne -O pagesaspirees/$dossier/$nfichier/URL_$compt.html
# URL numeroté dans chaques dossiers séparés par les langues.
echo "<TD width=10%> <a href="./pagesaspirees/$dossier/$nfichier/URL_$compt.html">PAGE_$compt</a></TD>" >> $tablo;
# les pages HTML aspiirées par wget
lynx -dump ./pagesaspirees/$dossier/$nfichier/URL_$compt.html >
./dump/$dossier/$nfichier/dump_$compt.txt
echo "<TD width=10%><a href="./dump/$dossier/$nfichier/dump_$compt.txt ">DUMP_$compt</a></TD>" >> $tablo;
#
les fichier .txt avec le texte dumpé par lynx
# si le fichier d'url traité est francais.txt alors
if [ $fichier == "francais.txt" ]
then
egrep -i "\b$motif|$motif1\b" ./dump/$dossier/$nfichier/dump_$compt.txt >./contexte/$dossier/$nfichier/contexte_$compt.html
fi
# si le fichier d'url traité est japonais.txt alors
if [$fichier == "japonais.txt"]
then
perl ./programmes/mini-grep-multilingue.pl "UTF-8" ./dump/$dossier/$nfichier/dump_$compt.txt ./programmes/motifjaponais.txt
cp ./resultat-extraction.html ./contexte/$dossier/$nfichier/contexte_$compt.html
fi
# si le fichier d'url traité est russe.txt alors
if [$fichier == "russe.txt"]
then
perl ./programmes/mini-grep-multilingue.pl "UTF-8" ./dump/$dossier/$nfichier/dump_$compt.txt ./programmes/motifrusse.txt
cp ./resultat-extraction.html ./contexte/$dossier/$nfichier/contexte_$compt.html
fi
#résultat des contextes affichés
echo "<TD width=10%><a href="./contexte/$dossier/$nfichier/contexte_$compt.html">CONTEXTE_$compt</a></TD></tr>" >> $tablo;
fi
}
}
echo "</table></body></html><p>" >> $tablo ;
#fin du document html
done