La revue LEXICOMETRICA s’adresse aux chercheurs, aux Ă©tudiants, aux professionnels de la communication et de la fouille de donnĂ©es textuelles… intĂ©ressĂ©s par les travaux thĂ©oriques et pratiques menĂ©s dans les domaines suivants : LexicomĂ©trie / statistique textuelle, linguistiques de corpus, extraction d’informations Ă partir de corpus de texte, acquisition de connaissances…
Elle est publiĂ©e sur Internet et rassemble des articles de recherche ou des comptes-rendus d’expĂ©riences. AssistĂ© d’un rĂ©seau de correspondants, son comitĂ© de rĂ©daction sĂ©lectionne les articles Ă paraĂ®tre.
Lexicometrica, publications novembre 2009
N° SpĂ©cial “Topographie et topologie textuelles” (2009)
N° SpĂ©cial “Explorations textomĂ©triques” (2009)
N° SpĂ©cial “Topographie et topologie textuelles” (2009)
Responsables du numéro Sylvie Mellet , André Salem
Présentation :
Depuis ses dĂ©buts la statistique linguistique, y compris lorsqu’elle s’applique Ă l’étude des textes et des discours, a principalement recouru Ă des modèles qui tendent Ă nĂ©gliger ce fait majeur qu’un texte est une structure ordonnĂ©e ; les dĂ©nombrements, les relevĂ©s de frĂ©quences, les calculs de spĂ©cificitĂ©s reposent tous sur le fameux schĂ©ma d’urne et renoncent Ă prendre en compte le positionnement dans le texte des unitĂ©s dĂ©nombrĂ©es. Certes, les rĂ©sultats ainsi obtenus sont gĂ©nĂ©ralement intĂ©ressants et bien interprĂ©tables, et ils ont largement contribuĂ© au dĂ©veloppement et aux succès de la discipline. Mais ils se pourraient qu’ils soient en train d’atteindre leurs limites. Ou, du moins, de ne plus suffire pour donner entière satisfaction au chercheur. De plus en plus souvent en effet, ceux-ci souhaitent pouvoir Ă©tablir, Ă cĂ´tĂ© de la dimension paradigmatique apprĂ©hendĂ©e par ce type de calculs statistiques traditionnels, la dimension syntagmatique des donnĂ©es textuelles, saisies Ă courte ou Ă longue portĂ©e : distribution rĂ©gulière ou non d’une entitĂ© linguistique (mot ou catĂ©gorie grammaticale) susceptible d’arriver Ă intervalles Ă peu près Ă©gaux ou, au contraire, en paquets plus ou moins denses ; rĂ©partition d’un Ă©lĂ©ment au fil du texte, selon la structure globale de celui-ci et ses parties constituantes ; phĂ©nomènes d’échos et d’alignements dans la mise en parallèle de deux textes ou deux portions de textes ; etc. Bien sĂ»r, des travaux, dont certains sont dĂ©jĂ anciens, ont abordĂ© ces questions : parmi les plus connus citons tous ceux d’A. Salem qui ont Ă©tabli la pertinence de la fameuse notion de « segment rĂ©pĂ©té » et qui ont mis en place les outils pour les repĂ©rer et les analyser ; citons aussi les travaux de P. Lafon sur les « rafales » et son article “Statistique des localisations des formes d’un texte” paru en 1984 dans la revue Mots ; ou encore l’article de D. SĂ©rant et Ph. Thoiron sur la « topographie des formes rĂ©pĂ©tĂ©es » (Revue Informatique et Statistique dans les Sciences humaines 24, pp. 333-343) ; etc. Actuellement, cette question reprend de l’acuitĂ© et les Ă©tudes, ainsi que les dĂ©veloppements logiciels affĂ©rents, se multiplient. Le moment nous semble donc venu de faire le point. Ce numĂ©ro de Lexicometrica accueille des contributions consacrĂ©es aux notions de topographie et topologie textuelles, c’est-Ă -dire Ă la prise en compte, dans les exploitations automatiques des textes numĂ©risĂ©s et dans leur traitement quantitatif de la linĂ©aritĂ© intrinsèque du texte, voire de sa structure en rĂ©seau avec d’autres textes au sein d’un corpus fortement cohĂ©rent (cas des recueils par exemple).
Sommaire Sylvie Mellet (1), Jean-Pierre BarthĂ©lemy (2) (1 Laboratoire BCL, UniversitĂ© Nice Sophia-Antipolis, CNRS ; MSH de Nice, 98 bd E. Herriot, 06200 NICE, 2 ENST de Bretagne, BP 832, 29285 Brest CĂ©dex). “
L’analyse de donnĂ©es textuelles aujourd’hui : du corpus comme une urne au corpus comme un plan. Retour sur les travaux actuels de topographie/topologie textuelle (partie I)”
Étienne Brunet (Laboratoire BCL (UMR 6039), UniversitĂ© de Nice, MSH, 98 Bd Edouard Herriot, BP 3209, 06204 Nice cedex 3.) “
FrĂ©quences et sĂ©quences. Mise en Ĺ“uvre dans Hyperbase.“
Julien Bourdaillet, Jean-Gabriel Ganascia, Jean-Louis Lebrave (Laboratoire d’Informatique de Paris 6 UniversitĂ© Pierre et Marie Curie 104 avenue du prĂ©sident Kennedy - 75016 Paris, Institut des Textes et Manuscrits Modernes Ecole Normale SupĂ©rieure 45 rue d’Ulm - 75005 Paris). “
Topologie et gĂ©nĂ©tique textuelles : un dialogue mĂ©diĂ© par la machine.“
Stephan Vonfelt (UniversitĂ© de Toulouse Le Mirail - Laboratoire Lettres, Langages et Arts ). “
Le graphonaute ou Molière retrouvĂ©.“
N° SpĂ©cial ” Explorations textomĂ©triques” (2009)
Responsables du numéro André Salem , Serge Fleury
Présentation :
Nous avons rassemblĂ© plusieurs compte-rendus d’expĂ©riences rĂ©alisĂ©es avec les logiciels de la famille Lexico au cours de nombreuses recherches et dans le cadre de collaborations diverses. Les navigations rassemblĂ©es ici ont Ă©tĂ© choisies pour mettre en Ă©vidence la très vaste gamme des domaines d’application des mĂ©thodes textomĂ©triques ainsi que les fonctionnalitĂ©s des logiciels Lexico3 et mkAlign. Elles sont publiĂ©es sous la forme de trois volumes (volume 1 : corpus et problèmes, volume 2 : sĂ©ries textuelles chronologiques, volume 3 : corpus multilingues).
Sommaire Volume 1 : corpus et problèmes A. Salem,
Tutoriel n°1 : Exploration du corpus Père Duchesne E. Nee,
Insécurité et élections présidentielles dans le journal Le Monde C. Pineira-Tresmontant, A. Salem,
Discours royal espagnol Liangcai Shen, André Salem,
Qu’en pensent les Chinois ? Essai d’exploration de l’opinion publique chinoise Ă travers des documents disponibles sur la toile.F. Abbassi,
Discours thĂ©orique et discours d’action. Approche textomĂ©trique de l’Ă©volution de groupements islamistes P. Couton-Wyporek,
Blogs & environnement L. Sansonetti,
Interactions adulte/enfantM. Leenhardt,
Communications homme-machine A. Salem, Romuald Schummer,
Textométrie hiéroglyphique Volume 2 : séries textuelles chronologiquesA. Salem,
Tutoriel n°2 : Séries textuelles chronologiquesJ-M. Leblanc,
Vœux présidentiels A. Salem, Li-Chi Wu,
Essai de textométrie politique chinoise. Les congrès du Parti Communiste Chinois (1921-2007) Serge A. de Sousa,
Le discours de Fidel Castro. Essai de lexicométrie politiqueVolume 3 : corpus multilingues S. Fleury,
Tutoriel n°3 : Exploration du corpus Traductions alignĂ©es du discours d’investiture de B. ObamaM. Zimina,
Equivalences traductionnelles J. Miao, A. Salem,
Comparaisons textométriques de traductions franco-chinoises J-H. Cho,
Traductions franco-coréennesChristian Jean,
Le thaĂŻ. De la segmentation aux maux ————————————————————————
L’Ă©quipe Lexicometrica
Coordinateurs de la rédaction : André Salem, Serge Fleury
Contacts: lexicometrica@univ-paris3.fr
LEXICOMETRICA
ILPGA, 19 rue des Bernardins, 75005 Paris France