wiki (TAL-Lexicométrie) GADT

GlossaireL

PagePrincipale :: DerniersChangements :: DerniersCommentaires :: ParametresUtilisateur :: Vous êtes ec2-54-196-127-107.compute-1.amazonaws.com
 
Page à créer :

Glossaire pour la statistique textuelle


Lettre L


Glossaire A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

Abréviations :

ac Analyse factorielle des correspondances
acm Analyse des correspondances multiples
cla Classification
sp Méthode des Spécificités
sr Analyse des segments répétés
ling Linguistique
stat Statistique
sa Segmentation automatique

lemmatisation
regroupement sous une forme canonique (en général à partir d'un dictionnaire) des occurrences du texte. En français, ce regroupement se pratique en général de la manière suivante :

lexical (ling)
qui concerne le lexique ou le vocabulaire.

lexicométrie
ensemble de méthodes permettant d'opérer des réorganisations formelles de la séquence textuelle et des analyses statistiques portant sur le vocabulaire d'un corpus de textes.

lexique (ling)
ensemble virtuel des mots d'une langue.

longueur (sa) (d'un corpus, d'une partie de ce corpus, d'un fragment de texte, d'une tranche, d'un segment, etc.)
le nombre des occurrences contenues dans ce corpus (resp. : partie, fragment, etc.). Synonyme : taille.

On note: T la longueur du corpus; t j celle de la partie (ou tranche) numéro j du corpus.

longueur d'un segment (sr)
le nombre des occurrences entrant dans la composition de ce segment.
Il n'y a pas de commentaire sur cette page. [Afficher commentaires/formulaire]