Vendredi 20 Octobre 2006 22:40:07

Projection sur un fichier au format Lexico3 d'un fichier de segments répétés issus de Lexico3, de ses hapax et des 2 fichiers d'hapax associés aux 2 parties de textes constituant l'ensemble du texte.

Mode d'emploi du programme (à lancer dans une fenêtre MSDOS ou "Invites de commandes") :
projette-segments-hapax fichier-SR fichier longueur-plancher-segment frequence-plancher-segment fichier-hapax fichier-hapax1 fichier-hapax2

Ci-dessous, les différentes versions avec le résultat de la projection. En rouge les segments et en bleu les hapax.
Ces 2 types d'unités sont aussi encapsulés dans des balises appelées respectivement SR et HAPAX.

On distingue aussi les hapax du texte n°1 (qui ne sont pas hapax du n°2), ceux du texte n°2 (qui ne sont pas hapax du n°1) et les hapax du texte complet.

FICHIER 1

§ <MOIS="200605"><JOUR="20060503"><HEURE="2006050320">
<HAP1><HAP1-et-2>Une</HAP1-et-2></HAP1> <HAP1>alerte</HAP1> au tsunami a été <HAP1><HAP1-et-2>lancée</HAP1-et-2></HAP1>, mercredi 3 <HAP1><HAP1-et-2>mai</HAP1-et-2></HAP1>, pour la
<HAP2>Nouvelle</HAP2>-<HAP2>Zélande</HAP2> et <HAP2>les</HAP2> <HAP1><HAP1-et-2>îles</HAP1-et-2></HAP1> <HAP2>Fidji</HAP2>, <HAP1>après</HAP1> un puissant <HAP1>séisme</HAP1> <HAP1><HAP1-et-2>survenu</HAP1-et-2></HAP1>
dans le Pacifique sud, a indiqué le Centre d'information <HAP1>sur</HAP1> <HAP2>les</HAP2>
tsunamis pour le Pacifique, <HAP1>situé</HAP1> dans <HAP1>l</HAP1>'<HAP1>archipel</HAP1> <HAP1>américain</HAP1> d'Hawaï.
"<HAP1><HAP1-et-2>Cela</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>veut</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>dire</HAP1-et-2></HAP1> qu'<HAP2>il</HAP2> est <HAP1><HAP1-et-2>probable</HAP1-et-2></HAP1> qu'un tsunami <HAP1><HAP1-et-2>va</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>se</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>produire</HAP1-et-2></HAP1> et
qu'<HAP2>il</HAP2> <HAP1><HAP1-et-2>faut</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>que</HAP1-et-2></HAP1> la <HAP2>Nouvelle</HAP2>-<HAP2>Zélande</HAP2> et <HAP2>Fidji</HAP2> <HAP1><HAP1-et-2>prennent</HAP1-et-2></HAP1> des <HAP1><HAP1-et-2>mesures</HAP1-et-2></HAP1>
<HAP1><HAP1-et-2>appropriées</HAP1-et-2></HAP1>", a indiqué <HAP1><HAP1-et-2>Nathan</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>Becker</HAP1-et-2></HAP1>, <HAP1><HAP1-et-2>océanographe</HAP1-et-2></HAP1> au Centre
d'information.

FICHIER 2

§ <MOIS="200605"><JOUR="20060503"><HEURE="2006050321">
<HAP2><HAP1-et-2>Les</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>autorités</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>ont</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>décrété</HAP1-et-2></HAP2> la <HAP2><HAP1-et-2>fin</HAP1-et-2></HAP2> de <HAP1>l</HAP1>'<HAP1>alerte</HAP1> au tsunami, <HAP2><HAP1-et-2>déclenchée</HAP1-et-2></HAP2>
<HAP1>après</HAP1> un puissant <HAP1>séisme</HAP1> jeudi matin dans le Pacifique sud, a-t-<HAP2><HAP1-et-2>on</HAP1-et-2></HAP2>
<HAP2><HAP1-et-2>appris</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>auprès</HAP1-et-2></HAP2> du Centre d'information <HAP1>sur</HAP1> <HAP2>les</HAP2> tsunamis pour le
Pacifique, <HAP1>situé</HAP1> dans <HAP1>l</HAP1>'<HAP1>archipel</HAP1> <HAP1>américain</HAP1> d'Hawaï. "L'<HAP1>alerte</HAP1> au
tsunami a été <HAP2><HAP1-et-2>annulée</HAP1-et-2></HAP2> pour <HAP2><HAP1-et-2>toute</HAP1-et-2></HAP2> la <HAP2><HAP1-et-2>région</HAP1-et-2></HAP2> du Pacifique", a <HAP2><HAP1-et-2>déclaré</HAP1-et-2></HAP2>
<HAP2><HAP1-et-2>Vindel</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>Hsu</HAP1-et-2></HAP2>, <HAP2><HAP1-et-2>géophysicien</HAP1-et-2></HAP2> au Centre. "<HAP2><HAP1-et-2>Il</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>n</HAP1-et-2></HAP2>'<HAP2><HAP1-et-2>y</HAP1-et-2></HAP2> a <HAP2><HAP1-et-2>maintenant</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>plus</HAP1-et-2></HAP2> de
<HAP2><HAP1-et-2>danger</HAP1-et-2></HAP2>", a-t-<HAP2>il</HAP2> <HAP2><HAP1-et-2>ajouté</HAP1-et-2></HAP2>. L'<HAP2><HAP1-et-2>organisme</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>avait</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>lancé</HAP1-et-2></HAP2> une <HAP1>alerte</HAP1> pour la
<HAP2>Nouvelle</HAP2>-<HAP2>Zélande</HAP2> et <HAP2>Fidji</HAP2>, et un <HAP2><HAP1-et-2>état</HAP1-et-2></HAP2> de <HAP2><HAP1-et-2>vigilance</HAP1-et-2></HAP2> pour le <HAP2><HAP1-et-2>reste</HAP1-et-2></HAP2> du
Pacifique <HAP1>après</HAP1> un <HAP1>séisme</HAP1> de <HAP2><HAP1-et-2>magnitude</HAP1-et-2></HAP2> 8 <HAP1>sur</HAP1> <HAP1>l</HAP1>'<HAP2><HAP1-et-2>échelle</HAP1-et-2></HAP2> du centre
<HAP1>américain</HAP1> d'<HAP2><HAP1-et-2>études</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>géologiques</HAP1-et-2></HAP2> (<HAP2><HAP1-et-2>USGS</HAP1-et-2></HAP2>). <HAP2><HAP1-et-2>La</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>secousse</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>s</HAP1-et-2></HAP2>'est <HAP2><HAP1-et-2>produite</HAP1-et-2></HAP2>
jeudi à 4 h 26 du matin (mercredi 15 h 26 <HAP2><HAP1-et-2>GMT</HAP1-et-2></HAP2>, <HAP2><HAP1-et-2>soit</HAP1-et-2></HAP2> 17 h 26 à <HAP2><HAP1-et-2>Paris</HAP1-et-2></HAP2>)
et <HAP2><HAP1-et-2>son</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>épicentre</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>était</HAP1-et-2></HAP2> <HAP1>situé</HAP1> à <HAP2><HAP1-et-2>proximité</HAP1-et-2></HAP2> de <HAP1>l</HAP1>'<HAP1>archipel</HAP1> de <HAP2><HAP1-et-2>Tonga</HAP1-et-2></HAP2>. <HAP2><HAP1-et-2>Seule</HAP1-et-2></HAP2>
une <HAP2><HAP1-et-2>vague</HAP1-et-2></HAP2> de 50 <HAP2><HAP1-et-2>cm</HAP1-et-2></HAP2> a <HAP2><HAP1-et-2>atteint</HAP1-et-2></HAP2> <HAP1>l</HAP1>'<HAP1>archipel</HAP1> des <HAP2><HAP1-et-2>Samoa</HAP1-et-2></HAP2>, <HAP2><HAP1-et-2>selon</HAP1-et-2></HAP2> le centre
d'information.