bienvenue à vous sur ce
site de la vie des mots sur le web
Notre site de la vie des mots sur le web
a été crée dans le but de
répondre aux exigences de l'examen du premier semestre de
Master
PluriTAL de l'Université
Paris 3.
Le bon mot
Le but de ce projet est de réaliser un script
prenant en entrée une liste d’URLs contenues dans
un fichier texte et dont les pages web contiennent un
mot-clé. Ce script rend en sortie une page au format HTML,
contenant un tableau, qui lui-même contient des liens vers :
- chaque page listée
- une copie locale de chaque page
- une version texte brut de chaque page
ET surtout, une ligne de concordance,
c’est à dire le mot choisi dans son contexte.
Le mot choisi pour ce projet est le mot "char"
Les scripts et les résultats se trouvent dans les
sections correspondantes de Bash ou de Perl,
en fonction du langage de programmation souhaité.