Liens vers les exercices:
- Exercice 1(Exercices sur le « Corpus Prématurés » avec emacs)
- Exercice 2(Exercices sur le « Corpus Prématurés » avec egrep)
- Exercice 3(Exercices sur le « Corpus Prématurés » (textutils niveau 0))
- Exercice 4(Exercices sur le « Corpus Prématurés » (niveau 1))
- Exercice 5(Exercices sur le « Corpus Prématurés » (niveau 2))
lien vers les parties
Exercice 4(Exercices sur le « Corpus Prématurés » (niveau 1))
Cet exercice comporte deux étapes :
- Etape 1 : un index des adjectifs
- Etape 2 : filtrages
Essayer de construire un index de tous les adjectifs présents dans le corpus. (Outils disponibles : commandes TextUtils)
Ce travail peut être fait en plusieurs étapes :
Dans une première commande on peut commencer par filtrer les adjectifs dans p96.tag et subsituer dans le résultat les blancs par un dièse et les slash par un underscore pour obtenir des lignes du type :
§très_ADV#bon_AMS#contact_NMS#._YPFOR#
§ commandes utilisées : egrep, tr
on pourra ensuite projeter les pseudos colonnes et ne garder que les lignes qui contiennent les adjectifs
§ commandes utilisées : cut, egrep
On concatènera l’ensemble des adjectifs trouvés avant de les trier…
§ commandes utilisées : cat, sort
pour aller sur cet exercice cliquez ici
Après avoir choisi 5 adjectifs de cet index :
extraire les zones textuelles contenant les adjectifs choisis et le numéro de l'infirmière associée
extraire le premier mot des zones textuelles précédentes, les classer par infirmière, en faire le tri et les compter
pour aller sur cet exercice cliquez ici