Bienvenue sur notre site !
Ce site, réalisé dans le cadre du cours « Projet encadré et programmation » du M1 « PluriTAL » (Paris III, INALCO, Paris X), présente le travail effectué pour mettre en œuvre une chaîne de traitement textuel semi-automatique depuis la récupération des données jusqu'à leur présentation.
Plus précisément, il s'agit de choisir un mot qui présente une ambiguïté lexicale, et d'en rechercher les différentes occurrences qui apparaissent sur Internet. Pour complexifier le tout, le corpus constitué doit être multilingue !
Vous trouverez sur le site le travail accompli par le groupe tout au long du semestre, depuis le choix du bon mot jusqu'à la génération de tableaux récapitulant les données collectées. Les différentes catégories vous permettront de découvrir notre démarche de travail, les résultats obtenus et d'autres informations utiles, ainsi que... nos accidents de parcours !
Nous avons également consigné l'avancement du projet au fil des semaines dans un blog, consultable à cette adresse.
Plus précisément, il s'agit de choisir un mot qui présente une ambiguïté lexicale, et d'en rechercher les différentes occurrences qui apparaissent sur Internet. Pour complexifier le tout, le corpus constitué doit être multilingue !
Vous trouverez sur le site le travail accompli par le groupe tout au long du semestre, depuis le choix du bon mot jusqu'à la génération de tableaux récapitulant les données collectées. Les différentes catégories vous permettront de découvrir notre démarche de travail, les résultats obtenus et d'autres informations utiles, ainsi que... nos accidents de parcours !
Nous avons également consigné l'avancement du projet au fil des semaines dans un blog, consultable à cette adresse.