Les Mots Et Les Urls
Le but de cette première étape était de rechercher environ 50 urls, représentant le mot "environnement" sur le web.
Etant donné que nous avions trois langues (français, portugais et espagnol), nous avons décidé de rechercher chacune environ 25 urls.
Le choix n'a pas été facile, car il fallait sélectionner des pages avec un contenu assez pertinent pour qu'elles soient analysées.
Pour sélectionner les urls, nous avons d’abord défini quels sens du mot "environnement" choisir, étant donné sa polysémie. Notre démarche a été de partir du français et de trouver les contextes dans lesquels le mot "environnement" était utilisé.
On peut donner en français la définition suivante du mot environnement :
Ensemble des conditions naturelles ou artificielles (physiques, chimiques et biologiques) et culturelles (sociologiques) dans lesquelles les organismes vivants se développent (dont l'homme, les espèces animales et végétales).
On trouve en français pour le mot environnement 4 acceptions très fréquentes, il en va de même pour le mot ambiente en espagnol et en portugais :
Définition n°1
Environnement Naturel(fr), Ambiente Natural(es), Ambiente Natural(pt)
Définition n°2
Environnement Socio-Culturel(fr), Ambiente Socio-Cultural(es), Ambiente Socio-Cultural(pt)
Définition n°3
Environnement Linguistique(fr), Ambiente Linguistico(es), Ambiente Linguistico(pt)
Définition n°4
Environnement Informatique(fr), Ambiente Informatico(es), Ambiente Informatico(pt)
Il est bien évident que ce choix est totalement subjectif et ne dépend que de notre envie d'analyser le mot "environnement"
dans les sens choisis. Nous aurions pu tout aussi bien choisir d'autres définitions du mot.
Nous avons ensuite commencé à travailler sur les scripts qui vont nous permettre d’analyser nos données linguistiques.