PARTIE 3 (egrep)
Utilisation TextUtils
Niveau 0
Télécharger les textes de travail
Textes de travail : index des mots du corpus prématurés.
On trouvera dans l'archive précédente un fichier regroupant l'ensemble des mots du corpus (un par ligne).
1. Déterminer les différentes catégories présentes dans le corpus (leur nombre et leur fréquence)
Pour déterminer les différentes catégories présentes dans le corpus (leur nombre et leur fréquence), il faut utiliser cette ligne de commande :
egrep -o -i "_[A-Z][A-Z][A-Z]$" liste-mots-utf-8.txt | sort | uniq -c| sed "s/\_//" | sort -u
2. Pour chaque catégorie déterminer tous les mots associés.
Retourner en haut de la page
Précédent
Suivant