TyPWEB
TYpologie et Profilage de sites WEB (LOT 1)
Documents de travail
- Rapport Constitution de corpus
- Aude Maisondieu, Andréa Kuncova, "Constitution d'un corpus Web, Projet Typweb", 2000 : format HTML.
- Aude Maisondieu, Andréa Kuncova, "Constitution d'un corpus Web, Projet Typweb", 2000 : Slides.
- Equipe Typweb, Travail sur corpus de Test avec WebXref, mktipo
- Présentation du travail réalisé avec WEBXREF_Typweb dans la phase de pré-traitement des sites : Phase 1
- Présentation du travail réalisé avec WEBXREF_Typweb dans la phase de pré-traitement des sites : Phase 2 (PDF)
- Equipe Typweb, Travail sur corpus de sites : PP/SM
- Travail in-progress sur les corpus PPété99, PPMars2000, SM1, SM2 et 15.000 pages, avec Lexico3 : Corpus PP-SM & Lexico 3(PDF 07/02/2001) (attention plus de 16Mo)
- Travail in-progress sur le corpus 100.000 pages : Corpus 100000, préparation et tâches à réaliser (PDF 27/05/2001)
- Travail in-progress sur les corpus PPété99, PPMars2000, SM1, SM2 (version TAGs HTML) : Corpus SMPP-TAGs (PDF 17/06/2001)
- Travail in-progress sur le corpus 100.000 pages : corp100000-lexico-0, corp100000-lexico-1, corp100000-lexico-2 (PDF 10/05/2002)
- Cyril Grouin, "Le Décanteur" Avril 2001
- Extraction des coordonnées personnelles incluses dans des corpus de pages web : le Décanteur pour le projet TyPWeb
- Andréa Kuncova, Mémoire de maîtrise (09/10/2001)
- Etude de la structuration des pages web à travers la balise <FONT> (version slide)
- Etude de la structuration des pages web à travers la balise <FONT> (version PDF)
- Aude Maisondieu, Mémoire de maîtrise (09/10/2001)
- Etude linguistique de mots étiquetés InCoNus dans un corpus web (version slide)
- Etude linguistique de mots étiquetés InCoNus dans un corpus web (version PDF)
- Equipe Typweb, Chaîne de traitements TYPWEB
- Présentation de la chaîne de traitement TYPWEB (Webxref Version 038, préparation des corpus, construction des matrices de traits...) : Version finale (PDF)
- Présentation de la chaîne de traitement TYPWEB (Webxref Version 038, préparation des corpus, construction des matrices de traits...) : Version slides
Publications autour de Typweb
- 1999, G. Illouz (LIMSI-Université Paris XI), S. Fleury, H. Folch, S. Heiden, P. Lafon (UMR 8503-ENS Fontenay/St-Cloud), "Maîtriser les déluges de données hétérogènes", in Actes de l'Atelier thématique TALN 1999 : Corpus et Traitement Automatique des Langues : pour une réflexion méthodologique, TALN'99, 12-17 juillet 1999, Cargèse (Version Postscript)
- 2000, G. Illouz (LIMSI-Université Paris XI), S. Fleury, H. Folch, S. Heiden, P. Lafon (UMR 8503-ENS Fontenay/St-Cloud), "Profilage de textes : cadre de travail et expérience", JADT 2000, 9-10-11 Mars 2000, Lausanne, (Version Postscript)
- 2000, V. Beaudouin, J. Velkovska, C. Vié, S. Fleury (CNET/DIH/UCE), "Analyse des espaces de communication sur internet et intranet", JADT 2000, 9-10-11 Mars 2000, Lausanne, (Version HTML)
- 2001, Valérie Beaudouin, Serge Fleury, Benoît Habert, Gabriel Illouz, Christian Licoppe, Marie Pasquier, "TyPWeb : décrire la Toile pour mieux comprendre les parcours", CIUST'01, Colloque International sur les Usages et les Services des Télécommunications, e-Usages, Paris, 12-14 juin 2001, (Version PDF)
Dernière modification le 10.05.2002 par