Journal de bord 1
Bonjour! Je m'appelle Noriko, je suis japonaise, je n'avais jamais étudié l'informatique, ni lu un seul mode d'emploi dans ma vie. Pour moi, l'ordinateur = internet, itune, photos, DVD, word...etc. Je n'avais jamais pensé écrire un jour un script... mais la vie est imprévnible!
☆ mi-novembre ☆
Ma collègue et moi, on écrivait un script avec l'ordinateur de Paris 3.Nous n'avions pas rencontré de problèmes jusqu'ici.
1: prendre 50 urls concernant le mot "relation" en japonais et en chinois.
2: créer des fichiers textes en japonais + en chinois.
3: créer le répertoire "projet-mot-sur-web"
PROGRAMMES-stocker les programmes
URLS-urls stockés en fichier texte
TABLEAUX-tableaux créés par chaque programmes
DUMP-TEXT-fichiers textes stockés par lynx
CONTEXTES-filtrage des textes par egrep ou perl
IMAGES-images stockées
3: utiliser la commande wget pour stocker les pages aspirées.(faire le tableau à deux colonnes)
4: utiliser lynx-dums pour filtrer le texte
5: utiliser egrep pour obtenir des contextes