Partie 3
Exercices sur le «Corpus Pématurés» avec emacs
Dans cette partie, on utilisera le menu de recherche de chaînes de caractères pour réaliser les opérations suivantes :
Rechercher les fiches contenant une interrogation
Rechercher les fiches pour lesquelles le score médical est de 12
Faire de même pour un score de 10.
Rechercher les fiches du jour 0 pour lesquels le bébé est né à 28 semaines
Exercices sur le «Corpus Prématurés» avec egrep
Dans cette partie, on doit obtenir en sortie un fichier pour chaque requête demandée.
Extraire les fiches contenant une interrogation
Extraire les fiches correspondant au bébé 12
Extraire les fiches correspondant au bébé 1
Extraire les fiches pour lesquelles le score médical est de 12
Faire de même pour un score de 10.
Quelles sont les fiches qui vont être extraites si l'on recherche les fiches commençant par 13 ? Expliquer ?
Extraire les fiches correspondant aux bébés faisant au moins 1000 grammes.
Dans cette partie, on doit obtenir en sortie un fichier pour chaque requête demandée.
Extraire les fiches concernant les bébés 10 à 12
Extraire les fiches concernant les bébés 10 et 12, c'est-a-dire sans 11 et 13
Trouver le nombre de bébés de 23, ..., 30 semaines
Extraire les fiches du jour 0 pour lesquels le bébé est né à 28 semaines
Extraire les fiches des bébés nés entre 23 et 29 semaines
Extraire les fiches pour lesquels le bébé à la naissance faisait au m oins 1000 grammes
Extraire les fiches pour lesquels le bébé à la naissance faisait moins de 1000 grammes
Extraire les fiches rédigées par les infirmières 12 et 22
Extraire les fiches concernant le bébé 10 et ne correspondant pas au jour 0
Exercices sur le «Corpus Prématurés» (niveau 1)
Etape 1 : un index des adjectifs
Essayer de construire un index de tous les adjectifs présents dans le corpus. (Outils disponibles : commandes TextUtils)
Ce travail peut être fait en plusieurs étapes :
Dans une première commande on peut commencer par filtrer les adjectifs dans p96.tag et subsituer dans le résultat les blancs par un dièse et les slash par un underscore pour obtenir des lignes du type :
très_ADV#bon_AMS#contact_NMS#._YPFOR#
Commandes utilisées : egrep, tr
On pourra ensuite projeter les pseudos colonnes et ne garder que les lignes qui contiennent les adjectifs
Commandes utilisées : cut, egrep
On concatènera l’ensemble des adjectifs trouvés avant de les trier…
Commandes utilisées : cat, sort
Etape 2 : filtrages
Après avoir choisi 5 adjectifs de cet index :
Extraire les zones textuelles contenant les adjectifs choisis et le numéro de l'infirmière associée
Extraire le premier mot des zones textuelles précédentes, les classer par infirmière, en faire le tri et les compter