Vendredi 20 Octobre 2006 22:38:43

Projection sur un fichier au format Lexico3 d'un fichier de segments répétés issus de Lexico3, de ses hapax et des 2 fichiers d'hapax associés aux 2 parties de textes constituant l'ensemble du texte.

Mode d'emploi du programme (à lancer dans une fenêtre MSDOS ou "Invites de commandes") :
projette-segments-hapax fichier-SR fichier longueur-plancher-segment frequence-plancher-segment fichier-hapax fichier-hapax1 fichier-hapax2

Ci-dessous, les différentes versions avec le résultat de la projection. En rouge les segments et en bleu les hapax.
Ces 2 types d'unités sont aussi encapsulés dans des balises appelées respectivement SR et HAPAX.

On distingue aussi les hapax du texte n°1 (qui ne sont pas hapax du n°2), ceux du texte n°2 (qui ne sont pas hapax du n°1) et les hapax du texte complet.

FICHIER 1

§ <MOIS="200603"><JOUR="20060319"><HEURE="2006031914">
<HAP1><HAP1-et-2>Les</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>Béninois</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>doivent</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>choisir</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>un</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>successeur</HAP1-et-2></HAP1> <HAP1>au</HAP1> président <HAP1><HAP1-et-2>sortant</HAP1-et-2></HAP1>,
<HAP1><HAP1-et-2>Mathieu</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>Kérékou</HAP1-et-2></HAP1>, qui <HAP1>a</HAP1> <HAP1><HAP1-et-2>dirigé</HAP1-et-2></HAP1> <HAP2>le</HAP2> pays <HAP1><HAP1-et-2>pendant</HAP1-et-2></HAP1> 30 <HAP1><HAP1-et-2>ans</HAP1-et-2></HAP1>. <HAP1><HAP1-et-2>Selon</HAP1-et-2></HAP1> <HAP1>les</HAP1>
<HAP1><HAP1-et-2>chiffres</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>officiels</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>communiqués</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>par</HAP1-et-2></HAP1> <HAP1>la</HAP1> <HAP1><HAP1-et-2>Cour</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>constitutionnelle</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>jeudi</HAP1-et-2></HAP1>,
<HAP1><HAP1-et-2>Yayi</HAP1-et-2></HAP1> Boni <HAP1><HAP1-et-2>avait</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>obtenu</HAP1-et-2></HAP1> 35,63 % <HAP1>et</HAP1> <HAP1><HAP1-et-2>Adrien</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>Houngbèdji</HAP1-et-2></HAP1> 24,12 %, <HAP1><HAP1-et-2>lors</HAP1-et-2></HAP1> du
<HAP2>premier</HAP2> tour.<HAP1><HAP1-et-2>Plusieurs</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>candidats</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>malheureux</HAP1-et-2></HAP1> du <HAP2>premier</HAP2> tour <HAP1><HAP1-et-2>ont</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>appelé</HAP1-et-2></HAP1>
<HAP1><HAP1-et-2>à</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>voter</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>pour</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>M</HAP1-et-2></HAP1>.Boni qui <HAP1><HAP1-et-2>apparaît</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>désormais</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>comme</HAP1-et-2></HAP1> <HAP2>le</HAP2> <HAP1><HAP1-et-2>favori</HAP1-et-2></HAP1> <HAP1>de</HAP1> ce
scrutin.

FICHIER 2

§ <MOIS="200603"><JOUR="20060320"><HEURE="2006032009">
<HAP2><HAP1-et-2>La</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>Commission</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>électorale</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>nationale</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>autonome</HAP1-et-2></HAP2> (CENA) <HAP1>au</HAP1> <HAP2><HAP1-et-2>Bénin</HAP1-et-2></HAP2> <HAP1>a</HAP1>
<HAP2><HAP1-et-2>annoncé</HAP1-et-2></HAP2>, <HAP2><HAP1-et-2>dimanche</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>soir</HAP1-et-2></HAP2> 19 <HAP2><HAP1-et-2>mars</HAP1-et-2></HAP2>, <HAP1>la</HAP1> <HAP2><HAP1-et-2>fin</HAP1-et-2></HAP2> des <HAP2><HAP1-et-2>opérations</HAP1-et-2></HAP2> <HAP1>de</HAP1> vote du
second tour <HAP1>de</HAP1> <HAP2><HAP1-et-2>l</HAP1-et-2></HAP2>'<HAP2><HAP1-et-2>élection</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>présidentielle</HAP1-et-2></HAP2>. "<HAP2><HAP1-et-2>Le</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>dépouillement</HAP1-et-2></HAP2> est
<HAP2><HAP1-et-2>terminé</HAP1-et-2></HAP2> dans <HAP1>les</HAP1> bureaux <HAP1>et</HAP1> <HAP2><HAP1-et-2>nous</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>avons</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>déjà</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>commencé</HAP1-et-2></HAP2> <HAP1>la</HAP1>
<HAP2><HAP1-et-2>centralisation</HAP1-et-2></HAP2> des <HAP2><HAP1-et-2>résultats</HAP1-et-2></HAP2>", <HAP1>a</HAP1> <HAP2><HAP1-et-2>déclaré</HAP1-et-2></HAP2> <HAP2>le</HAP2> second <HAP2><HAP1-et-2>vice</HAP1-et-2></HAP2>-président <HAP1>de</HAP1>
<HAP1>la</HAP1> CENA, <HAP2><HAP1-et-2>Bio</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>Yarou</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>Tanga</HAP1-et-2></HAP2>, <HAP2><HAP1-et-2>annonçant</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>que</HAP1-et-2></HAP2> "<HAP1>les</HAP1> <HAP2><HAP1-et-2>premières</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>tendances</HAP1-et-2></HAP2>
<HAP2><HAP1-et-2>provisoires</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>ne</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>seront</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>pas</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>connues</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>avant</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>quatre</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>jours</HAP1-et-2></HAP2>". <HAP2><HAP1-et-2>Ce</HAP1-et-2></HAP2> second tour
<HAP2><HAP1-et-2>s</HAP1-et-2></HAP2>'est <HAP2><HAP1-et-2>globalement</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>bien</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>passé</HAP1-et-2></HAP2> dans <HAP1>les</HAP1> 17 480 bureaux <HAP1>de</HAP1> vote du pays,
<HAP2><HAP1-et-2>avec</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>quelques</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>problèmes</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>technique</HAP1-et-2></HAP2> <HAP1>et</HAP1> des <HAP2><HAP1-et-2>retards</HAP1-et-2></HAP2> <HAP1>au</HAP1> <HAP2><HAP1-et-2>démarrage</HAP1-et-2></HAP2>, <HAP2><HAP1-et-2>mais</HAP1-et-2></HAP2>
<HAP2><HAP1-et-2>moindres</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>qu</HAP1-et-2></HAP2>'<HAP1>au</HAP1> <HAP2>premier</HAP2> tour, <HAP2><HAP1-et-2>malgré</HAP1-et-2></HAP2> <HAP1>la</HAP1> <HAP2><HAP1-et-2>précipitation</HAP1-et-2></HAP2> dans <HAP2><HAP1-et-2>laquelle</HAP1-et-2></HAP2> ce
scrutin <HAP1>a</HAP1>
<HAP2><HAP1-et-2>été</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>organisé</HAP1-et-2></HAP2>.