wiki (TAL-Lexicométrie) GADT

GlossaireT

PagePrincipale :: DerniersChangements :: DerniersCommentaires :: ParametresUtilisateur :: Vous êtes ec2-54-224-214-93.compute-1.amazonaws.com
 
Page à créer :

Glossaire pour la statistique textuelle


Lettre T


Glossaire A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

Abréviations :

ac Analyse factorielle des correspondances
acm Analyse des correspondances multiples
cla Classification
sp Méthode des Spécificités
sr Analyse des segments répétés
ling Linguistique
stat Statistique
sa Segmentation automatique


tableau de contingence (stat)
synonyme de tableau de fréquences ou de tableau croisé: tableau dont les lignes et les colonnes représentent respectivement les modalités de deux questions (ou deux variables nominales) , et dont le terme général représente le nombre d'individus correspondant à chaque couple de modalités.

tableau lexical entier (TLE)
tableau à double entrée dont les lignes sont constituées par les ventilations des différentes formes dans les parties du corpus. Le terme générique k(i,j) du TLE est égal au nombre de fois que la forme i est attestée dans la partie j du corpus. Les lignes du TLE sont triées selon l' ordre lexicométrique des formes correspondantes.

tableau des segments répétés (TSR)
tableau à double entrée dont les lignes sont constituées par les ventilations des segments répétés dans les parties du corpus. Les lignes du TSR sont triées selon l'ordre lexicométrique* des segments. (i.e. longueur décroissante, fréquence décroissante, ordre lexicographique).

tableau lexical
tableau à double entrée résultant du TLE par suppression de certaines lignes (par exemple celles qui correspondent à des formes dont la fréquence est inférieure à un seuil donné).

taille (sa) (d'un corpus)
sa longueur* mesurée en occurrences (de formes simples).

terme (sr)
nom générique s'appliquant à la fois aux formes et aux polyformes. Dans le premier cas on parlera de termes de longueur 1. Les polyformes sont des termes de longueur 2,3, etc.

termes contraints / termes libres
un terme S1 est contraint dans un autre terme S2 de longueur supérieure si toutes ses occurrences sont des sous-segments de segments correspondant à des occurrences du segment S2. Si au contraire un terme possède plusieurs expansions distinctes, qui ne sont pas forcément récurrentes, c'est un terme libre.

types généralisés (Tgens)
unités de dépouillement définies par l'utilisateur à l'aide d'outils permettant d'effectuer automatiquement des regroupements d'occurrences du texte (ex : les occurrences des formes qui commencent par la séquence de caractère patr : patrie, patriotes, patriotisme, etc.).
Il n'y a pas de commentaire sur cette page. [Afficher commentaires/formulaire]