Pourquoi ce mot ?
Présentation multilingue...
FRONTIÈRE est un
mot qui dans les langues que nous avons choisies possède toujours au
moins deux sens distincts. Un que l'on pourrait qualifier d'abstrait,
l'autre de concret.
Ce mot est très présent sur le web
dans ses deux sens, mais selon la langue son environnement textuel peut
varier. Ce projet nous permet de constater les différences sémantique
mais aussi d'usage qui se rattache au mot d'une langue à l'autre.
Mais on verra également qu'au delà
un variation d'usage, de graphie et quelque fois d'emploi, la FRONTIÈRE
entre les langue est parfois bien ténue...
Voici les équivalences pour lesquelle nous avons opté :
Français : frontière
Anglais : border
Allemand : Grenze
Espagnol : frontera
Italien : frontiera
Portugais : fronteira
Finnois : raja
Russe : граница
Pour réaliser ce travail nous avons
travaillé sur un environnement unix, soit sur le shell pour ceux
utilisant Linux (ou MAC) ou sur Cygwin pour les autres.
Nous avons codé en BASH un script
qui nous permet de récupérer à partir d'un fichier d'urls, le contenu
de ces urls, des les réencoder en utf-8 si besoin et d'extraire le
contexte textuel de nos mots cibles.
Vous trouverez sur ce script après l'avoir téléchargé, chaque ligne commentée et expliquée pour une meilleure compréhension de notre travail, nous avons eu quelques problèmes techniques par rapport à ce qui était demandé et si la solution qui est parfois adoptée n'est pas la meilleure c'est parceque souvent c'est la seule qui fonctionnait.