Bienvenue sur notre Site !

Présentation de notre projet encadré...

Ce site vous est présenté dans le cadre du cours «Projet encadré et programmation» du M1 « Ingénierie Linguistique » .

Vous pourrez y trouver le travail effectué tout au long du semstre pour mettre en oeuvre une chaîne de traitement textuel semi-automatique depuis la récupération des données jusqu'à leur présentation.
Il s'agit donc d'un projet qui allie à la fois linguistique et informatique. Un processus de traitement semi-automatisé a été mis en place afin de gérer les contenus textuels des pages web contenant le mot à analyser.
Plus précisément, il s'agit de choisir un mot qui présente une ambiguïté lexicale, et d'en rechercher les différentes occurrences qui apparaissent sur Internet. Pour complexifier le tout, le corpus constitué doit être multilingue !

Nous avons choisi le mot FRONTIÈRE.
Ce mot présente l'(dés)avantage de pouvoir être perçu selon plusieurs sens dans toutes les langues que nous avons choisi d'étudier

Les différentes étapes de la chaîne de traitement se présentent sous la forme d'un tableau récapitulatif des résultats. L'étape ultime étant l'extraction des contextes dans lesquels le mot "environnement" apparaît. Vous pourrez admirer à partir de ces dits contextes de superbes masses nuageuses... on ne vous en dit pas plus.

Nous avons choisi 8 langues pour l'analyse de notre mot: français, espagnol, portugais, italien, allemand, russe, anglais et finnois.
Ce large echantillonnage devrait permettre à toute personne interessée par la sémantique et l'emploi du mot FRONTIÈRE un large pannel de son utilisation sur le web.

N'hésitez pas à jeter un oeil sur notre blog qui vous renseignera sur tout nos (cruels) dilemmes, nos erreurs et surtout les solutions qui ont été trouvées.

SCHÉMA DES ÉTAPES DU PROJET



Enfin pour réaliser ce projet, plusieurs grandes étapes ont été nécessaires :
  • Codage du Script: 45h (dont 15h pour les pbs d'encodage)
  • Blog: 5h
  • Site: 25h

Enfin en ce qui concerne les critiques de cet enseignement, nous pensons que le nombre assez élevé d'étudiants a pu être un frein à l'avancée de notre projet qui nous a donné beaucoup de fil à retordre dès que nous avons entamé l'étape encodage. Le travail en groupe est à la fois un point négatif et positif: nous avons pu nous répartir les tâches et ainsi avancer plus vite mais avons rencontré de gros problèmes d'incompatibilité de systèmes d'exploitation (ce qui peut être tout de même considéré comme un point positif puisque nous avons pu apprendre sur trois environnements différents).

copyleft