Exercices sur le « Corpus Prématurés » (niveau 0)
* Déterminer les différentes catégories présentes dans le corpus (leur nombre et leur fréquence)
J’ai tout d’abord créé une liste des differentes catégories avec une macro Emacs :
Ensuite, je suis passée dans le terminal pour ne garder qu’une occurrence de chaque des catégories, dans une nouvelle liste :
Avec la ligne de commande « wc -l liste-cat2.txt », je peux voir combien il y a de catégories différentes en tout.
* Pour chaque catégorie déterminer tous les mots associés.
ADV, ADVNE, ADVPAS :
AFP :
« 1 match for "AFP" in buffer: liste-mots.txt
64:sympa_AFP »
AFS :
AMP :
« 1 match for "AMP" in buffer: liste-mots.txt
194:réceptif_AMP »
- AMS :
COCO :
1 match for "COCO" in buffer: liste-mots.txt
10:mais_COCO
COSUB :
1 match for "COSUB" in buffer: liste-mots.txt
8:lorsque_COSUB
DETMS :
2 matches for "DETMS" in buffer: liste-mots.txt
22:un_DETMS
176:un_DETMS
NFS :
NMP :
1 match for "NMP" in buffer: liste-mots.txt
132:traits_NMP
NMS :
PDEMMS :
4 matches for "PDEMMS" in buffer: liste-mots.txt
6:c'_PDEMMS
87:c'_PDEMMS
89:c'_PDEMMS
125:c'_PDEMMS
PINDMS :
1 match for "PINDMS" in buffer: liste-mots.txt
233:tout_PINDMS
PPER1S :
1 match for "PPER1S" in buffer: liste-mots.txt
84:je_PPER1S
PPER3FS :
3 matches for "PPER3FS" in buffer: liste-mots.txt
7:elle_PPER3FS
107:elle_PPER3FS
124:elle_PPER3FS
PPER3MS :
1 match for "PPER3MS" in buffer: liste-mots.txt
75:il_PPER3MS
PREFMP :
1 match for "PREFMP" in buffer: liste-mots.txt
59:se_PREFMP
PREFMS :
PREP :
5 matches for "PREP" in buffer: liste-mots.txt
135:avant_PREP
136:après_PREP
137:malgré_PREP
162:par_PREP
172:des_PREPDES
PREPDES :
1 match for "PREPDES" in buffer: liste-mots.txt
172:des_PREPDES
V3S :
VE3S :
1 match for "VE3S" in buffer: liste-mots.txt
160:est_VE3S
VPPFS :
4 matches for "VPPFS" in buffer: liste-mots.txt
9:détendue_VPPFS
44:endormie_VPPFS
51:détendue_VPPFS
57:détendue_VPPFS