T.A.L
GARCIA Charline
Paris 3-ILPGA
Sciences du langage, parcours TAL
charline.garcia@live.fr
Partie
3
Exercices sur le "Corpus Prématurés" avec emacs
Fichier de travail : p96.tab
Rechercher les fiches contenant une interrogation :
Rechercher les fiches correspondant au bébé 12 :
Rechercher les fiches correspondant au bébé 1 :
Rechercher les fiches pour lesquelles le score médiacal est de 12 :
Rechercher les fiches pour lesquelles le score médiacal est de 10 et expliquer le résultat :
Pour cette recherche il faut faire attention car on peut croire que le score médical est en fin de ligne, parfois c'est le cas mais dans certaines fiches, le score médical est suivi de tabulation(s), il faut donc adapter l'expression régulière aux deux cas.
Quelles fiches vont être extraites si l'on demande les fiches commençant par 13 ?
Lors de cette demande, on obtiendra le bébé dont le numéro est 1 au troisième jour d'observation en plus des fiches du bébé numéro 13.
Extraire les fiches correspondant aux bébés faisant au moins 1000 grammes :
Fichier de travail : p96.bal
Rechercher les fiches concernant les bébés 10 à 12 :
Rechercher les fiches concernant les bébés 10 et 12, c'est à dire sans 11 :
Rechercher le nombre de bébés de 23 à 30 semaines :
Rechercher les fiches du jour 0 pour lesquels le bébé est né à 28 semaines :
Rechercher les fiches des bébés né entre 23 et 29 semaines :
Rechercher les fiches pour lesquels le bébé à la naissance faisait au moins 1000 grammes :
Rechercher les fiches pour lesquels le bébé à la naissance faisait moins de 1000 grammes :
Extraire les fiches rédigées par les infirmières 12 et 22 :
Extraire les fiches concernant le bébé 10 et ne correspondant pas au jour 0 :
Exercice sur le "corpus prématurés" avec egrep
Fichier de travail : p96.tab
Extraire les fiches contentant une interrogation :
Extraire les fiches correspondant au bébé 12 :
Extraire les fiches correspondant au bébé 1 :
Extraire les fiches pour lesquelles le score médical est de 12 :
Faire de même pour un score de 10 :
Quelles sont les fiches qui vont être extraites si l'on recherche les fiches commençant par 13 ?
Lors de cette demande, on obtiendra le bébé dont le numéro est 1 au troisième jour d'observation en plus des fiches du bébé numéro 13.
Extraire les fiches correspondant au bébé faisant au moins 1000 grammes :
Fichier de travail : p96.bal
Extraire les fiches concernant les bébés 10 à 12 : (lorsque, dans ce cas, les résultats ne sont pas visibles sur la capture d'écran c'est parce qu'il y en a trop et qu'ils ne peuvent pas être visibles avec l'expression régulière qui n'apparaît plus dans la fenêtre Cygwin)
Extraire les fiches concernant les bébés 10 et 12 (sans 11 ni 13) :
Trouver le nombre de bébés de 23 à 30 semaines :
Extraire les fiches du jour 0 pour lesquelles le bébé est né à 28 semaines :
Extraire les fiches des bébés nés entre 23 et 29 semaines :
Extraires les fiches pour lesquelles le bébé à la naissance faisait au moins 1000 grammes :
Extraires les fiches pour lesquelles le bébé à la naissance faisait moins de 1000 grammes :
Extraires les fiches rédigées par les infirmières 12 et 22 :
Quel est l'inconvénient d'utiliser la solution suivante pour extraire les fiches réfigées par les infirmières 2, 12, 22 :
egrep "<INFIRMIERE>[2|12|22]" p96.bal
Extraire les fiches concernant le bébé 10 et ne correspondant pas au jour 0 :
Exercices sur le "Corpus Prématurés" (textutils niveau 0) :
Déterminer les différentes catégories présentes dans le corpus (leur nombre et leur fréquence), et pour chaque catégorie déterminer tous les mots associés :
Dans ce corpus, il y a :
-63 noms (sans tenir compte du genre et du nombre)
-115 adjectifs (sans tenir compte du genre et du nombre)
-20 verbes (sans tenir compte de la personne)
-4 participes passé (sans tenir compte de l'accord)
-26 adverbes
-4 prépositions
Voici la liste des noms :
Et voici leur fréquence :
Voivi la liste des adjectifs, puis leur fréquence :
Voici la listre des verbes, puis leur fréquence :
Voici la liste des participes passé, puis leur fréquence :
Voici la liste des adverbes, puis de leur fréquence :
Voici la liste des prépositions, puis leur fréquence :