-LES SCRIPTS ET TABLEAUX:
script anglais ICI
script français ICI
tableau anglais ICI
tableau français ICI
SCRIPT ANGLAIS
##Programme pour l'anglais
##En-tête du script Bash##
#!/bin/bash
## etape 1 :
récupération des données, sous entend que l'on se
trouve dans le répértoire de travail##
## donner le chemin d'accés du fichier texte dans le dossier "URL" (selon notre arborescence)##
echo "Donne moi le nom du fichier url"
read fichier
##préciser le dossier où sera créé le tableau, dans notre cas, le dossier "TABLEAU"
echo "Donnez un nom au tableau"
read nomtableau
##préciser le sens du mot recherché , celui-ci donnera par la même occasion un sous-titre au tableau##
echo "Quel sens du mot: ladder ou scale? "
read sens
##préciser le mot recherché en contexte##
echo "Donnez le motif recherché sur les pages originales : ";
read motif;
## création du tableau ##
echo "<html><head><title></title></head><body>" > $nomtableau
# #etape 2 : traitement d'un tableau = 1 sens/langue##
##Ajout de balise HTML pour un rendu graphique plus lisible##
echo "<table style=\"width:90%\" border=\"1\" >" >> $nomtableau
echo "<tr><td align=\"center\" colspan=\"4\"><font face=\"red\"><b>ANGLAIS : $sens</b></font></td></tr>" >> $nomtableau
##Corps du programme: la boucle For ##
i=1
for ligne in `cat $fichier`
####La commande cat liste le contenu de zéro ou plusieurs
fichiers. La sortie est envoyée sur la sortie standard##
{
##aspiration de pages web via la
commande wget suivie de l'option -O, permettant de rediriger les pages
pages aspirées vers le répertoire définit##
wget -O ./PAGESASPIREES/anglais/$sens/$i.html $ligne
##La commande lynx avec l'option
-dump va permettre de ne garder que le texte. Cette commande est
utilisée sur les fichiers html contenus dans la variable
$fichier et les enregistrent avec l'extension .txt##
lynx -dump $ligne > ./DUMP-TEXT/anglais/$sens/$i.txt
## on applique la commande egrep
avec l'option -i suivi du motif recherché et du fichier dans
lequel on cherche le motif. Le chevron fermant permet d'envoyer
le résultat d'egrep dans un autre fichier ayant l'extension
.txt.##
egrep -i "\b$motif\b" ./DUMP-TEXT/anglais/$sens/$i.txt > ./CONTEXTE/anglais/$sens/$i.txt
#la balise <a ref> nous
permet de créer un lien dans le tableau pour chaque pour
chaque résultat de commande##
echo "<TR><TD><a href=\"$ligne\">$ligne</TD></a><TD><a href=\"../PAGESASPIREES/anglais/$sens/$i.html\">PAGESASPIREES</a></TD><td><a href=\"../DUMP-TEXT/anglais/$sens/$i.txt\">PAGE DUMP</a></td><td><a href=\"../CONTEXTE/anglais/$sens/$i.txt\">PAGE CONTEXTE</a></td></TR>" >> $nomtableau;
let "i+=1"
}
##Fin de la boucle##
echo "</table>" >> $nomtableau
##Fin du tableau pour le premier sens##
## Etape 3: Passage au deuxiéme sens##
##Au deuxiéme passqge, il
est inutile de préciser le nom du tableau car il a
déjà été fourni au début du script##
##les commentaires sont les mêmes qu'au premier passage##
echo "Donne moi le nom du fichier url"
read fichier
echo "Quel sens du mot: ladder ou scale?"
read sens
echo "Donne le motif recherché sur les pages originales : ";
read motif;
echo "<table style=\"width:90%\" border=\"1\" >" >> $nomtableau
echo "<tr><td
align=\"center\" colspan=\"4\"><font
face=\"red\"><b>ANGLAIS :
$sens</b></font></td></tr>" >> $nomtableau
i=1
for ligne in `cat $fichier`
{
wget -O ./PAGESASPIREES/anglais/$sens/$i.html $ligne
lynx -dump $ligne > ./DUMP-TEXT/anglais/$sens/$i.txt
egrep -i "\b$motif\b" ./DUMP-TEXT/anglais/$sens/$i.txt > ./CONTEXTE/anglais/$sens/$i.txt
echo "<TR><TD><a href=\"$ligne\">$ligne</TD></a><TD><a href=\"../PAGESASPIREES/anglais/$sens/$i.html\">PAGESASPIREES</a></TD><td><a href=\"../DUMP-TEXT/anglais/$sens/$i.txt\">PAGE DUMP</a></td><td><a href=\"../CONTEXTE/anglais/$sens/$i.txt\">PAGE CONTEXTE</a></td></TR>" >> $nomtableau;
let "i+=1"
}
echo "</table>" >> $nomtableau
##Fin du tableau pour le deuxième sens##
# etape finale : fin page HTML
echo "</body></html>" >> $nomtableau;
##Fin des tableaux, fermeture des balises html##
SCRIPT FRANCAIS
##Programme pour le francais
##En-tête du script Bash##
#!/bin/bash
## etape 1 : récupération des
données, sous entend que l'on se trouve dans le répértoire de travail##
## donner le chemin d'accés du
fichier texte dans le dossier "URL" (selon notre arborescence)##
echo "Donne moi le nom
du fichier url"
read fichier
##préciser le dossier où sera
créé le tableau, dans notre cas, le dossier "TABLEAU"
echo "Donnez un nom au
tableau"
read nomtableau
##préciser le sens du mot
recherché , celui-ci donnera par la même occasion un sous-titre au tableau##
echo "Quel sens du mot:
outil, mesure ou proportion? "
read sens
##préciser le mot recherché en
contexte##
echo "Donne le motif
recherché sur les pages originales : ";
read motif
## création du tableau ##
echo "<html><head><title></title></head><body>"
> $nomtableau
# etape 2 : traitement d'un
tableau = 1 sens/langue
##Ajout de balise HTML pour un
rendu graphique plus lisible##
echo "<table
style=\"width:90%\" border=\"1\" >" >> $nomtableau
echo "<tr><td
align=\"center\" colspan=\"4\"><font
face=\"red\"><b>FRANCAIS :
$sens</b></font></td></tr>" >> $nomtableau
##Corps du programme: la boucle
For ##
i=1
for ligne in `cat $fichier` ##La commande cat
liste le contenu de zéro ou plusieurs fichiers. La sortie est envoyée sur la
sortie standard##
{
##aspiration de pages web via la
commande wget suivie de l'option -O, permettant de rediriger les pages pages
aspirées vers le répertoire définit##
wget -O
./PAGESASPIREES/francais/$sens/$i.html $ligne
##La commande lynx avec l'option
-dump va permettre de ne garder que le texte. Cette commande est utilisée sur
les fichiers html contenus dans la variable $fichier et les enregistrent avec
l'extension .txt
lynx -dump $ligne >
./DUMP-TEXT/francais/$sens/$i.txt
## on applique la commande egrep
avec l'option -i suivi du motif recherché et du fichier dans lequel on cherche le motif. Le chevron fermant
permet d'envoyer le résultat d'egrep dans un autre fichier ayant l'extension
.txt.##
egrep -i "$motif" ./DUMP-TEXT/francais/$sens/$i.txt
> ./CONTEXTE/francais/$sens/$i.txt
#la balise <a ref> nous
permet de créer un lien dans le tableau
pour chaque pour chaque résultat de commande##
echo
"<TR><TD><a href=\"$ligne\">$ligne</TD></a><TD><a
href=\"../PAGESASPIREES/francais/$sens/$i.html\">PAGESASPIREES</a></TD><td><a
href=\"../DUMP-TEXT/francais/$sens/$i.txt\">PAGE
DUMP</a></td><td><a href=\"../CONTEXTE/francais/$sens/$i.txt\">PAGE
CONTEXTE</a></td></TR>" >> $nomtableau;
let "i+=1"
}
##Fin de la boucle##
echo
"</table>" >> $nomtableau
##Fin du tableau pour le premier
sens##
## Etape 3: Passage au deuxiéme
sens##
##Au deuxiéme passage, il est
inutile de préciser le nom du tableau car il a déjà été fourni au début du
script##
##les commentaires sont les
mêmes qu'au premier passage##
echo "Donne moi le nom
du fichier url"
read fichier
echo "Quel sens du mot:
outil, mesure ou proportion?"
read sens
echo "Donne le motif
recherché sur les pages originales : ";
read motif
echo "<table
style=\"width:90%\" border=\"1\" >" >> $nomtableau
echo "<tr><td
align=\"center\" colspan=\"4\"><font
face=\"red\"><b>FRANCAIS : $sens</b></font></td></tr>"
>> $nomtableau
i=1
for ligne in `cat $fichier`
{
wget -O
./PAGESASPIREES/francais/$sens/$i.html $ligne
lynx -dump $ligne > ./DUMP-TEXT/francais/$sens/$i.txt
egrep -i "$motif"
./DUMP-TEXT/francais/$sens/$i.txt > ./CONTEXTE/francais/$sens/$i.txt
echo
"<TR><TD><a href=\"$ligne\">$ligne</TD></a><TD><a
href=\"../PAGESASPIREES/francais/$sens/$i.html\">PAGESASPIREES</a></TD><td><a
href=\"../DUMP-TEXT/francais/$sens/$i.txt\">PAGE
DUMP</a></td><td><a href=\"../CONTEXTE/francais/$sens/$i.txt\">PAGE
CONTEXTE</a></td></TR>" >> $nomtableau;
let "i+=1"
}
echo "</table></body></html>"
>> $nomtableau;
##Etape 4: troisieme sens, comme
pour le deuxiéme passage, inutile de préciser
un titre##
##les commentaires sont les
mêmes qu'au premier passage##
echo "Donne moi le nom
du fichier url"
read fichier
echo "Quel sens du mot:
outil, mesure ou proportion?"
read sens
echo "Donne le motif
recherché sur les pages originales : ";
read motif
echo "<table
style=\"width:90%\" border=\"1\" >" >> $nomtableau
echo "<tr><td
align=\"center\" colspan=\"4\"><font
face=\"red\"><b>FRANCAIS :
$sens</b></font></td></tr>" >> $nomtableau
i=1
for ligne in `cat $fichier`
{
wget -O ./PAGESASPIREES/francais/$sens/$i.html
$ligne
lynx -dump $ligne >
./DUMP-TEXT/francais/$sens/$i.txt
egrep -i "$motif"
./DUMP-TEXT/francais/$sens/$i.txt >
./CONTEXTE/francais/$sens/$i.txt
echo
"<TR><TD><a href=\"$ligne\">$ligne</TD></a><TD><a
href=\"../PAGESASPIREES/francais/$sens/$i.html\">PAGESASPIREES</a></TD><td><a
href=\"../DUMP-TEXT/francais/$sens/$i.txt\">PAGE
DUMP</a></td><td><a href=\"../CONTEXTE/francais/$sens/$i.txt\">PAGE
CONTEXTE</a></td></TR>" >> $nomtableau;
let "i+=1"
}
echo
"</table></body></html>" >> $nomtableau;
# etape finale : fin page HTML
echo "</body></html>" >> $nomtableau;
##Fin des tableaux, fermeture
des balises html##