Plongez dans les profondeurs du T.A.L. !

++ Partie 03 : Commandes Unix avancées
++ Présentation du Corpus : Prématurés 1996
++ Présentation des versions textuelles

Il existe quatre versions :
– La première‚ brute (p96.tab)‚ est issue d’un tableur (Un tableur manipule des cellules organisées en lignes et colonnes‚
et permet de faire calculer la valeur d’une cellule à partir du contenu d’une ou de plusieurs autres cellules). C’est la
version qui a été constituée dans le service de réanimation néonatale à partir des fiches papier remplies par les
infirmières. Dans ce fichier‚ le nombre débutant la ligne concatène le numéro du bébé‚ celui du jour de l’observation et
celui de l’observation dans la journée. Chaque champ est délimité par des tabulations.
– La seconde (p96.bal) nomme les différentes informations contenues dans une fiche sur un bébé un jour donné à
un moment déterminé. Pour faciliter l’utilisation du corpus et son retraitement‚ les champs positionnels ont été
remplacés par des champs nommés‚ dont une balise ouvrante indique le contenu (Il n’y a pas par contre de balise
fermante).
– On dispose aussi de p96.fic qui regroupe toutes les fiches.
– Enfin‚ on dispose de p96.tag qui correspond à une version étiquetée du corpus bébé.


Haut de page