Valeur
Accueil Etapes Commandes Script Tableaux Commentaire
Mise en travail
Première étape
A. Rechercher un mot
Pour la première étape, nous avons cherché un mot ambigue en
français. Nous avons selectionné quelques mots, par
exemple, "évolution" ou "unité" etc. Enfin nous avons choisi le mot « valeur ».
En effet, ce mot « valeur » a
beaucoup de sens différents et c’est difficile de traduire sa
signification
précise
dans d’autres langues.
B. Rechercher le sens du «valeur» dans des dictionnaires.
- Petit Robert
- TLFi : le mot valeur
- Définition
C. Rechercher au moins 50 URLs en français, en japonais et en russe sur des sites
- français -> toutes les deux
Google : http://www.google.fr
Yahoo : http://fr.yahoo.com/
- japonais -> Wakako
Google : http://www.google.co.jp
Yahoo! JAPAN : http://www.yahoo.co.jp
- russe -> Tatiana
Google : http://www.google.com/intl/ru/
Yahoo! по-русски : http://ru.yahoo.com/
Dexième étape
A. Créer des fichiers textes en chaque langue.
- Nous avons créé 3 fichier textes, "francais.txt, japonais.txt et russe.txt".
- Dans chaque texte, nous avons mis des urls.
B. Créer le répertoire
« Projet-Master »
- LISTES-URL : URLs stockés en fichier texte selon les langues.
- programmes : pour stocker les programmes que nous avons créés.
- PAGES-ASPIREES : pages aspirées stockées localement par wget
- DUMP-TEXT : fichiers texte stockés par lynx
- CONTEXTES : filtrage des textes par egrep ou par perl
- images : des images sockés
Troisème étape
- Faire le tableau en une colonne.
Pour réaliser ce tableau 1, nous avons appris les commandes, echo, read [nom de variable] et
for .... in 'cat $..... '. Nous avons aussi appris le HTML
Quatrième étape
- Faire le tableau à deux colonnes.
Pour obtenir les pages aspirées, nous avons utilisé la commande wget .
URL + Pages aspirées -> wget .
Cinquième étape
- Faire le tableau à trois colonnes.
Pour filtrer le texte, nous avons utilisé Lynx -dump.
URL +
Pages Aspirées + Lynx > Lynx-dump
Sixième étape
A. Nous avons revu les sens de « valeur ».
- Au début,
nous avions separé en 6 ou 7 sens. Pour simplifier, nous avons choisi 3 sens.
B. Filtrer les pages avec une commande « egrep» et faire une dernière colonne.
Pour les pages en français, nous pouvions utiliser « egrep» sans problème. Mais les langues
russe et japonaise ne pouvaient pas l'utiliser. En effet, leur codage est "UTF-8". Pour résoudre
ce problème, nous avons utilisé mini-grep-multilingue en perl.
D'abord, nous avons téléchagé minigrepmultilingueV2.zip et créé les fichiers textes dans
chaque langue. Dans chaque texte, nous avons écrit des traductions qui correspondent
au mot valeur .
Septième étape
- Créer un site & une mise en page de tableaux.
Avec le logiciel Nvu , c'est facile de créer une site web!!! L'utilisation est très simple!!!
Même si nous ne connaîssions pas HTML, nous pouvions écrire librement comme sur Word.
- Accompli de nos tableaux voir ici
-