II
AUTOMATISATION DES TACHES
III
PROBLEMES RENCONTRES
I RECHERCHE
D'INFORMATIONS SUR LE MOT "BARRAGE"
Premièrement,
nous
cherchons les différents sens du mot barrage à l'aide de
moteur de recherche sur Internet. Nous tapons seulement le mot barrage.
Nous
découvrons plusieurs sens, et nous créons cinq
groupes: hydroélectrique, sport, obstacle, expression, et titre.
En effet,
on peut avoir un barrage hydroélectrique, mais le
terme "barrage" est souvent utilisé au football, il sert aussi
d'expression "faire barrage à tel homme politique", il
peut
aussi désigner un obstacle, un barrage pour empêcher les
enfants de descendre un escalier par exemple, et enfin ce mot peut
aussi être le nom de restaurants ou de livres.
On
constate déjà certains problèmes: quelques
sites ne contiennent que des photos et pas de texte, pour affiner la
recherche on cherche des pages qui ne contiennent pas les mots
"construction", "hydroélectrique, "football", "tir", "rupture".
A la suite de ces nouvelles recherches on trouve des pages qui
contiennent une très faible occurence du mot "barrage" (en
général une seulement). Par conséquent pour
faciliter la recherche on peut regarder en mode "cache".
Enfin, on
choisit cinquante URL (Uniform
Ressource Locator) pertinentes qui contiennent différents sens
du mot "barrage" pour constituer notre corpus et on les met toutes dans
cinq fichiers "URL" différents: fichier hydroélectrique,
sport, expression, titre, obstacle.
Le
programme ci-dessous permet de générer un tableau de
ces URLs dans une pages html :
#!/bin/bash
echo "donne nom de fichier contenant les liens http"; #c'est la liste
des pages wgettées
read fic; #le programme connait le fichier de liens sous le nom $fic
echo "donne nom de fichier html où stocker ces liens"; #c'est le
tableau de liens à créer
read tablo; #enregistre nom donné par utilisateur dans la
variable $tablo
echo "<html><head><title>tableau de
liens</title></head><body bgcolor="#CCFFFF"><table
border=1>" > $tablo; #code de début de tableau
for nom in `cat $fic` #$nom est la variable dans laquelle sera
stocké chaque lien
do
echo "<tr><td><a
href="$nom">$nom</a></td></tr>" >> $tablo;
#création d'un tableau à une colonne et autant de lignes
qu'il y a d'URL
done
echo "</table></body></html>" >> $tablo; #code
de fin de tableau
#le fichier dont le nom correspond à la variable tablo est
maintenant créé, ouvrez-le |
En appliquant ce programme on donne
les cinq fichiers d'URLs en
argument et on obtient ce tableau.