Script&résultats

-LES SCRIPTS ET TABLEAUX:
script anglais ICI
script français ICI
tableau anglais ICI
tableau français ICI


SCRIPT ANGLAIS

##Programme pour l'anglais
##En-tête du script Bash##
#!/bin/bash

## etape 1 : récupération des données, sous entend que l'on se trouve dans le répértoire de travail##

## donner le chemin d'accés du fichier texte dans le dossier "URL" (selon notre arborescence)##
echo "Donne moi le nom du fichier url"
read fichier
##préciser le dossier où sera créé le tableau, dans notre cas, le dossier "TABLEAU"
echo "Donnez un nom au tableau"
read nomtableau
##préciser le sens du mot recherché , celui-ci donnera par la même occasion un sous-titre au tableau##
echo "Quel sens du mot: ladder ou scale? "
read sens
##préciser le mot recherché en contexte##
echo "Donnez le motif recherché sur les pages originales : ";
read motif;
## création du tableau ##
echo "<html><head><title></title></head><body>" > $nomtableau

# #etape 2 : traitement d'un tableau = 1 sens/langue##

##Ajout de balise HTML pour un rendu graphique plus lisible##
echo "<table style=\"width:90%\" border=\"1\" >" >> $nomtableau
echo "<tr><td align=\"center\" colspan=\"4\"><font face=\"red\"><b>ANGLAIS : $sens</b></font></td></tr>" >> $nomtableau
##Corps du programme: la boucle For ##
i=1
for ligne in `cat $fichier ####La commande cat liste le contenu de zéro ou plusieurs fichiers. La sortie est envoyée sur la sortie standard##

{
##aspiration de pages web via la commande wget suivie de l'option -O, permettant de rediriger les pages pages aspirées vers le répertoire définit##
wget -O ./PAGESASPIREES/anglais/$sens/$i.html $ligne

##La commande lynx avec l'option -dump va permettre de ne garder que le texte. Cette commande est utilisée sur les fichiers html contenus dans la variable $fichier et les enregistrent avec l'extension .txt##
lynx -dump $ligne > ./DUMP-TEXT/anglais/$sens/$i.txt

## on applique la commande egrep avec l'option -i suivi du motif recherché et du fichier dans lequel  on cherche le motif. Le chevron fermant permet d'envoyer le résultat d'egrep dans un autre fichier ayant l'extension .txt.##
egrep -i "\b$motif\b" ./DUMP-TEXT/anglais/$sens/$i.txt > ./CONTEXTE/anglais/$sens/$i.txt

#la balise <a ref> nous permet de créer un lien  dans le tableau pour chaque pour chaque résultat de commande##
echo "<TR><TD><a href=\"$ligne\">$ligne</TD></a><TD><a href=\"../PAGESASPIREES/anglais/$sens/$i.html\">PAGESASPIREES</a></TD><td><a href=\"../DUMP-TEXT/anglais/$sens/$i.txt\">PAGE DUMP</a></td><td><a href=\"../CONTEXTE/anglais/$sens/$i.txt\">PAGE CONTEXTE</a></td></TR>" >> $nomtableau;
let "i+=1"
}
##Fin de la boucle##   
echo "</table>" >> $nomtableau
##Fin du tableau pour le premier sens##



## Etape 3: Passage au deuxiéme sens##

##Au deuxiéme passqge, il est inutile de préciser le nom du tableau car il a déjà été fourni au début du script##
##les commentaires sont les mêmes qu'au premier passage##

echo "Donne moi le nom du fichier url"
read fichier
echo "Quel sens du mot: ladder ou scale?"
read sens
echo "Donne le motif recherché sur les pages originales : ";
read motif;

echo "<table style=\"width:90%\" border=\"1\" >" >> $nomtableau
echo "<tr><td align=\"center\" colspan=\"4\"><font face=\"red\"><b>ANGLAIS : $sens</b></font></td></tr>" >> $nomtableau
i=1
for ligne in `cat $fichier`
{
wget -O ./PAGESASPIREES/anglais/$sens/$i.html $ligne
lynx -dump $ligne > ./DUMP-TEXT/anglais/$sens/$i.txt
egrep -i "\b$motif\b" ./DUMP-TEXT/anglais/$sens/$i.txt > ./CONTEXTE/anglais/$sens/$i.txt

echo "<TR><TD><a href=\"$ligne\">$ligne</TD></a><TD><a href=\"../PAGESASPIREES/anglais/$sens/$i.html\">PAGESASPIREES</a></TD><td><a href=\"../DUMP-TEXT/anglais/$sens/$i.txt\">PAGE DUMP</a></td><td><a href=\"../CONTEXTE/anglais/$sens/$i.txt\">PAGE CONTEXTE</a></td></TR>" >> $nomtableau;
let "i+=1"
}
echo "</table>" >> $nomtableau
##Fin du tableau pour le deuxième sens##

# etape finale : fin page HTML
echo "</body></html>" >> $nomtableau;
##Fin des tableaux, fermeture des balises html##



SCRIPT FRANCAIS



##Programme pour le francais
##En-tête du script Bash##
#!/bin/bash
## etape 1 : récupération des données, sous entend que l'on se trouve dans le répértoire de travail##
 ## donner le chemin d'accés du fichier texte dans le dossier "URL" (selon notre arborescence)##
echo "Donne moi le nom du fichier url"
read fichier
##préciser le dossier où sera créé le tableau, dans notre cas, le dossier "TABLEAU"
echo "Donnez un nom au tableau"
read nomtableau
##préciser le sens du mot recherché , celui-ci donnera par la même occasion un sous-titre au tableau##
echo "Quel sens du mot: outil, mesure ou proportion? "
read sens
##préciser le mot recherché en contexte##
echo "Donne le motif recherché sur les pages originales : ";
read motif
 ## création du tableau ##
echo "<html><head><title></title></head><body>" > $nomtableau
  # etape 2 : traitement d'un tableau = 1 sens/langue
 ##Ajout de balise HTML pour un rendu graphique plus lisible##
echo "<table style=\"width:90%\" border=\"1\" >" >> $nomtableau
echo "<tr><td align=\"center\" colspan=\"4\"><font face=\"red\"><b>FRANCAIS : $sens</b></font></td></tr>" >> $nomtableau
##Corps du programme: la boucle For ##
i=1
for ligne in `cat $fichier`  ##La commande cat liste le contenu de zéro ou plusieurs fichiers. La sortie est envoyée sur la sortie standard##
 {
##aspiration de pages web via la commande wget suivie de l'option -O, permettant de rediriger les pages pages aspirées vers le répertoire définit##
wget -O ./PAGESASPIREES/francais/$sens/$i.html $ligne
 ##La commande lynx avec l'option -dump va permettre de ne garder que le texte. Cette commande est utilisée sur les fichiers html contenus dans la variable $fichier et les enregistrent avec l'extension .txt
lynx -dump $ligne > ./DUMP-TEXT/francais/$sens/$i.txt
 ## on applique la commande egrep avec l'option -i suivi du motif recherché et du fichier dans lequel  on cherche le motif. Le chevron fermant permet d'envoyer le résultat d'egrep dans un autre fichier ayant l'extension .txt.##
egrep -i "$motif" ./DUMP-TEXT/francais/$sens/$i.txt > ./CONTEXTE/francais/$sens/$i.txt
 #la balise <a ref> nous permet de créer un lien  dans le tableau pour chaque pour chaque résultat de commande##
echo "<TR><TD><a href=\"$ligne\">$ligne</TD></a><TD><a href=\"../PAGESASPIREES/francais/$sens/$i.html\">PAGESASPIREES</a></TD><td><a href=\"../DUMP-TEXT/francais/$sens/$i.txt\">PAGE DUMP</a></td><td><a href=\"../CONTEXTE/francais/$sens/$i.txt\">PAGE CONTEXTE</a></td></TR>" >> $nomtableau;
let "i+=1"
}
##Fin de la boucle##
echo "</table>" >> $nomtableau
##Fin du tableau pour le premier sens##
## Etape 3: Passage au deuxiéme sens##
##Au deuxiéme passage, il est inutile de préciser le nom du tableau car il a déjà été fourni au début du script##
##les commentaires sont les mêmes qu'au premier passage##
 
echo "Donne moi le nom du fichier url"
read fichier
echo "Quel sens du mot: outil, mesure ou proportion?"
read sens
echo "Donne le motif recherché sur les pages originales : ";
read motif
echo "<table style=\"width:90%\" border=\"1\" >" >> $nomtableau
echo "<tr><td align=\"center\" colspan=\"4\"><font face=\"red\"><b>FRANCAIS : $sens</b></font></td></tr>" >> $nomtableau
i=1
for ligne in `cat $fichier`
{
wget -O ./PAGESASPIREES/francais/$sens/$i.html $ligne
lynx -dump $ligne > ./DUMP-TEXT/francais/$sens/$i.txt
egrep -i "$motif" ./DUMP-TEXT/francais/$sens/$i.txt > ./CONTEXTE/francais/$sens/$i.txt
echo "<TR><TD><a href=\"$ligne\">$ligne</TD></a><TD><a href=\"../PAGESASPIREES/francais/$sens/$i.html\">PAGESASPIREES</a></TD><td><a href=\"../DUMP-TEXT/francais/$sens/$i.txt\">PAGE DUMP</a></td><td><a href=\"../CONTEXTE/francais/$sens/$i.txt\">PAGE CONTEXTE</a></td></TR>" >> $nomtableau;
let "i+=1"
}
echo "</table></body></html>" >> $nomtableau;
 ##Etape 4: troisieme sens, comme pour le deuxiéme passage, inutile de préciser  un titre##
##les commentaires sont les mêmes qu'au premier passage##
 echo "Donne moi le nom du fichier url"
read fichier
echo "Quel sens du mot: outil, mesure ou proportion?"
read sens
echo "Donne le motif recherché sur les pages originales : ";
read motif
echo "<table style=\"width:90%\" border=\"1\" >" >> $nomtableau
echo "<tr><td align=\"center\" colspan=\"4\"><font face=\"red\"><b>FRANCAIS : $sens</b></font></td></tr>" >> $nomtableau
i=1
for ligne in `cat $fichier`
{
wget -O ./PAGESASPIREES/francais/$sens/$i.html $ligne
lynx -dump $ligne > ./DUMP-TEXT/francais/$sens/$i.txt
egrep -i "$motif" ./DUMP-TEXT/francais/$sens/$i.txt > ./CONTEXTE/francais/$sens/$i.txt
 echo "<TR><TD><a href=\"$ligne\">$ligne</TD></a><TD><a href=\"../PAGESASPIREES/francais/$sens/$i.html\">PAGESASPIREES</a></TD><td><a href=\"../DUMP-TEXT/francais/$sens/$i.txt\">PAGE DUMP</a></td><td><a href=\"../CONTEXTE/francais/$sens/$i.txt\">PAGE CONTEXTE</a></td></TR>" >> $nomtableau;
let "i+=1"
}
echo "</table></body></html>" >> $nomtableau;
  # etape finale : fin page HTML
echo "</body></html>" >> $nomtableau;
##Fin des tableaux, fermeture des balises html##