Vendredi 20 Octobre 2006 22:37:17

Projection sur un fichier au format Lexico3 d'un fichier de segments répétés issus de Lexico3, de ses hapax et des 2 fichiers d'hapax associés aux 2 parties de textes constituant l'ensemble du texte.

Mode d'emploi du programme (à lancer dans une fenêtre MSDOS ou "Invites de commandes") :
projette-segments-hapax fichier-SR fichier longueur-plancher-segment frequence-plancher-segment fichier-hapax fichier-hapax1 fichier-hapax2

Ci-dessous, les différentes versions avec le résultat de la projection. En rouge les segments et en bleu les hapax.
Ces 2 types d'unités sont aussi encapsulés dans des balises appelées respectivement SR et HAPAX.

On distingue aussi les hapax du texte n°1 (qui ne sont pas hapax du n°2), ceux du texte n°2 (qui ne sont pas hapax du n°1) et les hapax du texte complet.

FICHIER 1

§ <MOIS="200601"><JOUR="20060127"><HEURE="2006012717">
<HAP2><HAP1-et-2>Une</HAP1-et-2></HAP2> caractéristique génétique <HAP2><HAP1-et-2>commune</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>aux</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>différentes</HAP1-et-2></HAP2> souches des
virus de la grippe aviaire est <HAP2><HAP1-et-2>absente</HAP1-et-2></HAP2> dans la <HAP2><HAP1-et-2>version</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>humaine</HAP1-et-2></HAP2> de la
grippe, ce qui pourrait <HAP2><HAP1-et-2>expliquer</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>leur</HAP1-et-2></HAP2> plus <HAP2><HAP1-et-2>grande</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>nocivité</HAP1-et-2></HAP2> quand ils
infectent l'homme. "Les virus de la grippe aviaire ont tous une
caractéristique <HAP2><HAP1-et-2>moléculaire</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>particulière</HAP1-et-2></HAP2> dont sont dépourvus les
virus de la grippe chez l'homme, ce qui pourrait les <HAP2><HAP1-et-2>rendre</HAP1-et-2></HAP2> plus
<HAP2><HAP1-et-2>toxiques</HAP1-et-2></HAP2> quand ils infectent des <HAP2><HAP1-et-2>cellules</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>humaines</HAP1-et-2></HAP2>", ont <HAP2><HAP1-et-2>expliqué</HAP1-et-2></HAP2> des
épidémiologistes <HAP2><HAP1-et-2>américains</HAP1-et-2></HAP2> dont les travaux ont <HAP2><HAP1-et-2>paru</HAP1-et-2></HAP2> dans la <HAP2><HAP1-et-2>revue</HAP1-et-2></HAP2>
<HAP2><HAP1-et-2>Science</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>datée</HAP1-et-2></HAP2> du 27 <HAP2><HAP1-et-2>janvier</HAP1-et-2></HAP2>.
Le virus de la grippe aviaire qui a <HAP2><HAP1-et-2>infecté</HAP1-et-2></HAP2> depuis 2003 au <HAP2><HAP1-et-2>moins</HAP1-et-2></HAP2> 152
personnes en Asie et en <HAP2><HAP1-et-2>Turquie</HAP1-et-2></HAP2> dont 83 sont <HAP2><HAP1-et-2>mortes</HAP1-et-2></HAP2> , <HAP2><HAP1-et-2>aussi</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>bien</HAP1-et-2></HAP2> que
la <HAP2><HAP1-et-2>souche</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>responsable</HAP1-et-2></HAP2> de la pandémie très <HAP2><HAP1-et-2>meurtrière</HAP1-et-2></HAP2> de 1918, <HAP2><HAP1-et-2>avaient</HAP1-et-2></HAP2>
cette caractéristique, ont-ils souligné. Les virus <HAP2><HAP1-et-2>responsables</HAP1-et-2></HAP2> des
<HAP2><HAP1-et-2>autres</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>grandes</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>épidémies</HAP1-et-2></HAP2> de grippe (1957 et 1968) à <HAP2><HAP1-et-2>faible</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>taux</HAP1-et-2></HAP2> de
<HAP2><HAP1-et-2>mortalité</HAP1-et-2></HAP2>, en <HAP2><HAP1-et-2>étaient</HAP1-et-2></HAP2> dépourvus.
Ces chercheurs <HAP2><HAP1-et-2>pensent</HAP1-et-2></HAP2> que cette caractéristique génétique <HAP2><HAP1-et-2>permet</HAP1-et-2></HAP2> au
virus d'<HAP2><HAP1-et-2>origine</HAP1-et-2></HAP2> aviaire d'<HAP2><HAP1-et-2>interférer</HAP1-et-2></HAP2> avec le <HAP2><HAP1-et-2>fonctionnement</HAP1-et-2></HAP2> de
<HAP2><HAP1-et-2>certaines</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>protéines</HAP1-et-2></HAP2> dans le <HAP2><HAP1-et-2>corps</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>humain</HAP1-et-2></HAP2>.
"<HAP2><HAP1-et-2>VÉRITABLE</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>MINE</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>D</HAP1-et-2></HAP2>'<HAP2><HAP1-et-2>INFORMATIONS</HAP1-et-2></HAP2>"
<HAP2><HAP1-et-2>Cette</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>découverte</HAP1-et-2></HAP2> a été <HAP2><HAP1-et-2>faite</HAP1-et-2></HAP2> dans le <HAP2><HAP1-et-2>cadre</HAP1-et-2></HAP2> d'une analyse de 2 196
<HAP2><HAP1-et-2>gènes</HAP1-et-2></HAP2> de virus de la grippe aviaire et de 169 <HAP2><HAP1-et-2>génomes</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>complets</HAP1-et-2></HAP2> de ces
pathogènes <HAP2><HAP1-et-2>tirés</HAP1-et-2></HAP2> de <HAP2><HAP1-et-2>divers</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>échantillons</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>prélevés</HAP1-et-2></HAP2> sur des oiseaux
sauvages depuis <HAP2><HAP1-et-2>trente</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>ans</HAP1-et-2></HAP2>.
Ces travaux, <HAP2><HAP1-et-2>conduits</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>par</HAP1-et-2></HAP2> John Obenauer à l'<HAP2><HAP1-et-2>hôpital</HAP1-et-2></HAP2> Saint Jude de
l'<HAP2><HAP1-et-2>université</HAP1-et-2></HAP2> du <HAP2><HAP1-et-2>Tennessee</HAP1-et-2></HAP2>, "<HAP2><HAP1-et-2>donnent</HAP1-et-2></HAP2> le <HAP2><HAP1-et-2>premier</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>éclairage</HAP1-et-2></HAP2> de <HAP2><HAP1-et-2>fond</HAP1-et-2></HAP2> sur
l'<HAP2><HAP1-et-2>évolution</HAP1-et-2></HAP2> des virus de la grippe dans la <HAP2><HAP1-et-2>nature</HAP1-et-2></HAP2>, à la <HAP2><HAP1-et-2>source</HAP1-et-2></HAP2> de
<HAP2><HAP1-et-2>toutes</HAP1-et-2></HAP2> les souches <HAP2><HAP1-et-2>virales</HAP1-et-2></HAP2> de la grippe <HAP2><HAP1-et-2>infectant</HAP1-et-2></HAP2> les humains, les
<HAP2><HAP1-et-2>animaux</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>domestiques</HAP1-et-2></HAP2> et les oiseaux sauvages", a souligné <HAP2><HAP1-et-2>Robert</HAP1-et-2></HAP2>
<HAP2><HAP1-et-2>Webster</HAP1-et-2></HAP2>, l'un des <HAP2><HAP1-et-2>grands</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>experts</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>mondiaux</HAP1-et-2></HAP2> de la grippe et <HAP2><HAP1-et-2>professeur</HAP1-et-2></HAP2> à
Saint Jude. "<HAP2><HAP1-et-2>C</HAP1-et-2></HAP2>'est une <HAP2><HAP1-et-2>véritable</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>mine</HAP1-et-2></HAP2> d'<HAP2><HAP1-et-2>informations</HAP1-et-2></HAP2>, et nous <HAP2><HAP1-et-2>invitons</HAP1-et-2></HAP2>
tous les chercheurs à nous <HAP2><HAP1-et-2>aider</HAP1-et-2></HAP2> à <HAP2><HAP1-et-2>percer</HAP1-et-2></HAP2> les <HAP2><HAP1-et-2>secrets</HAP1-et-2></HAP2> de la grippe",
a-t-il ajouté.
"L'<HAP2><HAP1-et-2>intérêt</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>majeur</HAP1-et-2></HAP2> de ce <HAP2><HAP1-et-2>projet</HAP1-et-2></HAP2> est qu'il <HAP2><HAP1-et-2>donne</HAP1-et-2></HAP2> à la <HAP2><HAP1-et-2>communauté</HAP1-et-2></HAP2>
<HAP2><HAP1-et-2>scientifique</HAP1-et-2></HAP2> un <HAP2><HAP1-et-2>nombre</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>beaucoup</HAP1-et-2></HAP2> plus <HAP2><HAP1-et-2>grand</HAP1-et-2></HAP2> de <HAP2><HAP1-et-2>nouvelles</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>données</HAP1-et-2></HAP2> et
d'<HAP2><HAP1-et-2>outils</HAP1-et-2></HAP2> d'analyse <HAP2><HAP1-et-2>pouvant</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>faire</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>avancer</HAP1-et-2></HAP2> la <HAP2><HAP1-et-2>compréhension</HAP1-et-2></HAP2> de ces
virus <HAP2><HAP1-et-2>potentiellement</HAP1-et-2></HAP2> très <HAP2><HAP1-et-2>dangereux</HAP1-et-2></HAP2>", a ajouté John Obenauer. "<HAP2><HAP1-et-2>Cela</HAP1-et-2></HAP2>
<HAP2><HAP1-et-2>devrait</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>déboucher</HAP1-et-2></HAP2> sur des <HAP2><HAP1-et-2>stratégies</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>efficaces</HAP1-et-2></HAP2> pour le <HAP2><HAP1-et-2>contrôle</HAP1-et-2></HAP2> de ces
pathogènes chez les <HAP2><HAP1-et-2>volatiles</HAP1-et-2></HAP2> et les humains", a-t-il ajouté.
Le virus H5N1 <HAP2><HAP1-et-2>actuel</HAP1-et-2></HAP2> de la grippe aviaire n'a <HAP2><HAP1-et-2>pas</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>encore</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>muté</HAP1-et-2></HAP2> pour <HAP2><HAP1-et-2>se</HAP1-et-2></HAP2>
<HAP2><HAP1-et-2>transmettre</HAP1-et-2></HAP2> de personne à personne <HAP2><HAP1-et-2>mais</HAP1-et-2></HAP2>, <HAP2><HAP1-et-2>selon</HAP1-et-2></HAP2> les épidémiologistes,
ce n'est qu'une <HAP2><HAP1-et-2>question</HAP1-et-2></HAP2> de <HAP2><HAP1-et-2>temps</HAP1-et-2></HAP2>. Le virus pourrait <HAP2><HAP1-et-2>alors</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>provoquer</HAP1-et-2></HAP2>
une pandémie <HAP2><HAP1-et-2>tuant</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>plusieurs</HAP1-et-2></HAP2> millions de personnes dans le <HAP2><HAP1-et-2>monde</HAP1-et-2></HAP2>.
Les personnes malades ont été <HAP2><HAP1-et-2>infectées</HAP1-et-2></HAP2> à la <HAP2><HAP1-et-2>suite</HAP1-et-2></HAP2> de <HAP2><HAP1-et-2>contacts</HAP1-et-2></HAP2> avec
des volailles malades. L'<HAP2><HAP1-et-2>épizootie</HAP1-et-2></HAP2> de grippe aviaire a <HAP2><HAP1-et-2>entraîné</HAP1-et-2></HAP2>
l'<HAP2><HAP1-et-2>abattage</HAP1-et-2></HAP2> de <HAP2><HAP1-et-2>centaines</HAP1-et-2></HAP2> de millions de volailles, <HAP2><HAP1-et-2>surtout</HAP1-et-2></HAP2> en Asie.