Glossaire pour la statistique textuelle
Lettre L
Glossaire A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
Abréviations :
ac Analyse factorielle des correspondances
acm Analyse des correspondances multiples
cla Classification
sp Méthode des Spécificités
sr Analyse des segments répétés
ling Linguistique
stat Statistique
sa Segmentation automatique
lemmatisation
regroupement sous une forme canonique (en général à partir d'un dictionnaire) des occurrences du texte. En français, ce regroupement se pratique en général de la manière suivante :
- les formes verbales à l'infinitif,
- les substantifs au singulier,
- les adjectifs au masculin singulier,
- les formes élidées à la forme sans élision.
lexical (ling)
qui concerne le
lexique ou le
vocabulaire.
lexicométrie
ensemble de méthodes permettant d'opérer des réorganisations formelles de la séquence textuelle et des analyses statistiques portant sur le
vocabulaire d'un corpus de textes.
lexique (ling)
ensemble virtuel des mots d'une langue.
longueur (sa) (d'un corpus, d'une partie de ce corpus, d'un fragment de texte, d'une tranche, d'un segment, etc.)
le nombre des occurrences contenues dans ce corpus (resp. : partie, fragment, etc.). Synonyme : taille.
On note: T la longueur du corpus; t j celle de la partie (ou tranche) numéro j du corpus.
longueur d'un segment (sr)
le nombre des occurrences entrant dans la composition de ce segment.