wiki (TAL-Lexicométrie) GADT

GlossaireV

PagePrincipale :: DerniersChangements :: DerniersCommentaires :: ParametresUtilisateur :: Vous êtes ec2-54-166-188-64.compute-1.amazonaws.com
 
Page à créer :

Glossaire pour la statistique textuelle


Lettre V


Glossaire A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

Abréviations :

ac Analyse factorielle des correspondances
acm Analyse des correspondances multiples
cla Classification
sp Méthode des Spécificités
sr Analyse des segments répétés
ling Linguistique
stat Statistique
sa Segmentation automatique


valeur modale (stat)
valeur pour laquelle une distribution atteint son maximum.

valeurs propres (ac ou acm)
quantités permettant de juger de l'importance des facteurs successifs de la décomposition factorielle. La valeur propre notée la. mesure la dispersion des éléments sur l' axe.a.

valeurs-tests (ac ou acm)
quantités permettant d'apprécier la signification de la position d'un élément supplémentaire (ou illustratif) sur une axe factoriel. Brièvement, si une valeur test dépasse 2 en valeur absolue, il y a 95 chances sur 100 que la position de l'élément correspondant ne puisse être due au hasard.

variables actives
variables utilisées pour dresser une typologie, soit par analyse factorielle, soit par classification. Les typologies dépendent du choix et des poids des variables actives, qui doivent de ce fait constituer un ensemble homogène.

variables supplémentaires (ou illustratives)
variables utilisées a posteriori pour illustrer des plans factoriels ou des classes. Une variable supplémentaire peut-être considérée comme une variable active munie d'un poids nul.

variables de type T
variable dont la fréquence est à peu près proportionnelle à l'allongement du texte. (ex : la fréquence maximale)

variables de type V
variable dont l'accroissement a tendance à diminuer avec l'allongement du texte (ex : le nombre des formes, le nombre des hapax).

ventilation (sa) (des occurrences d'une unité dans les parties du corpus)
La suite des n nombres (n = nombre de parties du corpus) constituée par la succession des sous-fréquences* de cette unité dans chacune des parties, prises dans l'ordre des parties.

vocabulaire (sa)
ensemble des formes attestées dans un corpus de textes.

vocabulaire commun (sa)
l'ensemble des formes attestées dans chacune des parties du corpus.

vocabulaire de base (sp)
ensemble des formes du corpus ne présentant, pour un seuil fixé, aucune spécificité (négative ou positive) dans aucune des parties , (i.e. l'ensemble des formes qui sont "banales" pour chacune des parties du corpus).

vocabulaire original (sp) (pour une partie du corpus)
l'ensemble des formes originales pour cette partie.

voisinage d'une occurrence (sa)
pour une occurrence donnée du texte, tout segment (suite d'occurrences consécutives, non séparées par un délimiteur de séquence) contenant cette occurrence.

Commentaires [Cacher commentaires/formulaire]