Journal des activités et
problèmes rencontrés:
Liste des étapes de création du projet:
- Séance
1: Recherche des sens possibles du mot "barrage",
choix des moteurs et de l'organisation du "site".
- Séance
2: Recherche et collecte des pages.
- Séance
3: Programmation des différents petits
outils.
- Séance
4: Finalisation et rédaction de la
page d'accueil et de ce journal
Liste des problèmes
rencontrés et limitations:
- Les pages une fois aspirées, elles ont été
"post traitées" avec lynx et quelques coups de "couteaux
suisses". Nous n'avons pas approfondi le fait que le mot
recherché pouvait se trouver à plusieurs endroits de la
page ( une frame particulière, un entête meta, etc.. ). Il
faudrait faire des hypothèses sur la "cartographie" des pages
aspirées pour rechercher et traiter le mot là où
son apparition est pertinente ( typiquement dans un texte, et non dans
un menu ou un nom d'image etc..)
- Les pages aspirées ont été choisies comme
n'étant pas dynamiques, car nous n'avons eu le temps de voir
comment wget "aspire" dans ce cas. Nous nous sommes donc
limités à des pages html , mais là encore nous
n'avons pas
pu controler si elles même font référence à
des pages dynamiques, d'où des possibles erreurs si on consulte
notre site sans être
connecté à Internet.
- Notre méthode pour nommer les pages aspirées sans
ambiguité, faire la correspondance avec l'URL , et
vérifier que l'aspiration s'est effectivement bien
passée, est insuffisante...