Secteur TAL Informatique
ILPGA Université Paris 3
Parcours TAL : ressources
Etats du corpus Prématurés96
Le fichier de départ
Parcours TAL : ressources
Etats du corpus Prématurés96
Le fichier de départ
Les fiches papier remplies par les infirmières du service de réanimation néo-natale ont été entrées dans un tableur (Excel).
Les lignes saisies sont de la forme :
101 N° 101 - Bébé réactif. - Etablit un contact au moment des soins. - Bébé attachant de par son histoire, mais aussi son physique, son apparence et son comportement. - A déjà ouvert les yeux. - Prend et cherche contact avec ses mains lorsqu'on le touche 101 s'aggrippe au doigt). 101 23,8 0 29,0 1 1 6,5 3 1580 3 5 0 5 5 2 17
Les intitulés des différentes colonnes sont les suivants :
n° fiche
texte n° fiche
complément texte n°
fiche
age en h
age en j terme en sem
mode accoucht lieu heure saisie
code inf poids (g)
sédation freq visit parents
relat inf/par relat mère/bb
occup bb Pntic moral
score med
Leur signification est la suivante :
Intitulé | Valeurs et consignes | Commentaire |
n° fiche | ||
texte | Consigne : aujourd'hui, comment pouvez-vous décrire ce bébé ? Comment se comporte-t-il, que fait-il ? Quel genre de bébé est-ce ? | |
n° fiche | ||
complément texte | La description libre ne tient pas toujours dans une seule cellule de texte | |
n° fiche | ||
age en h(eures) | ||
age en j(ours) | ||
terme en sem(aines) | nombre de semaines d'aménorrhée | |
mode accouch(emen)t | 1 voie basse 2 césarienne | |
lieu | 1 Centre hospitalier où est le service de réanimation, 2 ailleurs | |
heure saisie (de la fiche) | ||
code inf(irmière) | On connait par ailleurs son âge, son niveau d'études, son cursus professionnel et son ancienneté dans le service. | |
poids (g(rammes)) | ||
sédation | 1 Hynovel, 2 Fentanyl, 3 non, 4 Hypnovel + Fentanyl | |
freq(uence) visit(es des) parents | 1 très souvent (tous les jours), 2 souvent, 3 de temps en temps, 4 rarement ou jamais, 5 enfant à J0, question sans objet. | |
relat inf(irmière)/par(entes) | 0 je ne connais pas les parents, 1 bon contact avec eux, 2 contact moyen, 3 mauvais contact. | |
relat mère/b(é)b(é) | 1 très bonne mère (mère à l'aise, fait passer beaucoup de choses), 2 plutôt bonne, 3 plutôt mauvaise (tension, distance, agressivité), 4 très mauvaise, 5 je ne sais pas, pas vue. | |
occup b(é)b(é) | Combien de fois vous êtes-vous déjà occupée de ce bébé (compter le jour courant) ? | |
Pntic (pronostic) | Quel est votre pronostic sur ce bébé ? Actuellement, comment voyez-vous son avenir ? 1 très bon, 2 plutôt bon, 3 plutôt mauvais, 4 très mauvais, 5 je ne sais pas. | |
moral | Comment vous sentez-vous aujourd'hui (moral, fatigue, etc.) 1 très bien, 2 plutôt bien, 3 plutôt mal, 4 très mal | |
score med(ical) | gravité de l'état du bébé (plus le score est élevé, plus l'état de santé est inquiétant). |
Le code général pour non-réponse est 99.
Restructuration
Pour faciliter l'utilisation du corpus et son retraitement, les champs positionnels ont été remplacés par des champs nommés, dont une balise ouvrante indique le contenu (il n'y a pas par contre de balise fermante). L'exemple donné supra devient :<FICHE>101
<TXT> bébé réactif. établit un contact au
moment des soins. bébé attachant de par son histoire, mais
aussi son physique, son apparence et son comportement. a déjà
ouvert les yeux. prend et cherche contact avec ses mains lorsqu'on le touche
(s'aggrippe au doigt). <BEBE>1 <JOURS>0
<INFIRMIERE>3 <HEURES>23,8 <OBSERVATION>1
<TERME>29,0 <ACCOUCHEMENT>1<LIEU>1 <HEURE_SAISIE>6,5
<POIDS>1580 <SEDATION>3
<VISITES_PARENTS>5 <INFIRMIERE-PARENTS>0
<MERE-BEBE>5 <CONTACTS-INFIRMIERE-BEBE>1
<PRONOSTIC>5 <MORAL>2 <SCORE>17
Présentation des versions textuelles
Plusieurs versions sont utilisables :- la première, brute (p96.tab), est issue d'un tableur (un tableur manipule des cellules organisées en lignes et colonnes, et permet de faire calculer la valeur d'une cellule à partir du contenu d'une ou de plusieurs autres cellules). C'est la version qui a été constitué dans le service de réanimation néonatale à partir des fiches papier remplies par les infirmières. Dans ce fichier, le nombre débutant la ligne concatène le numéro de bébé, celui du jour de l'observation et celui de l'observation dans la journée.
- la seconde (p96.bal) nomme les différentes informations contenues dans une fiche sur un bébé un jour donné à un moment déterminé.
- On dispose aussi de (p96.fic) qui regroupe toutes les fiches.
- Enfin, on dispose de (p96.tag) qui correspond à une version étiquetée du corpus bébé
La seconde version (p96.bal) est disponible (au format HTML) : visualisation p96bal.htm.
La première version (p96.tab)
est disponible (au format TXT) : visualisation p96.tab.
La seconde version (p96.bal)
est disponible (au format TXT) : visualisation p96.bal.
La version (p96.fic)
est disponible (au format TXT) : visualisation p96.fic.
La version (p96.tag)
est disponible (au format TXT) : visualisation p96.tag.
Les 4 fichiers dans une archive : Prem96.zip
Pour la visualisation des versions textuelles brutes, une étape de téléchargement
est parfois nécessaire.
Si tel est le cas placer le fichier cherché dans votre envirionnement de travail avant de le manipuler.
Présentation de la version hypertextuelle
Navigation et HTML
Les principes de la navigation hypertextuelle sont présentés dans le document associé au lien précédent !Pour une présentation du langage HTML, on se reportera aux documents
présentés sur le site TAL-Paris3.
Lecture du corpus Prématurés
Le point d'entrée est fourni sur la page de sommaire. On peut y trouver des informations- la présentation générale du corpus
- les précisions sur l'état de départ du corpus
- les indications sur la prématurité
- par bébé (avec indication du jour et de l'observation) ;
- par infirmière ;
- catégorisé par un étiqueteur avec les catégories mises en évidence par des changements de couleur (visualisables ou non selon la machine utilisée) ou par des changements de police (gras, italiques, etc.).