Vendredi 20 Octobre 2006 22:42:06

Projection sur un fichier au format Lexico3 d'un fichier de segments répétés issus de Lexico3, de ses hapax et des 2 fichiers d'hapax associés aux 2 parties de textes constituant l'ensemble du texte.

Mode d'emploi du programme (à lancer dans une fenêtre MSDOS ou "Invites de commandes") :
projette-segments-hapax fichier-SR fichier longueur-plancher-segment frequence-plancher-segment fichier-hapax fichier-hapax1 fichier-hapax2

Ci-dessous, les différentes versions avec le résultat de la projection. En rouge les segments et en bleu les hapax.
Ces 2 types d'unités sont aussi encapsulés dans des balises appelées respectivement SR et HAPAX.

On distingue aussi les hapax du texte n°1 (qui ne sont pas hapax du n°2), ceux du texte n°2 (qui ne sont pas hapax du n°1) et les hapax du texte complet.

FICHIER 1

§ <MOIS="200609"><JOUR="20060907"><HEURE="2006090720">
C'est <HAP1>un</HAP1> groupe <HAP1>de</HAP1> premier plan dans <HAP1>les</HAP1> équipements télécoms,

FICHIER 2

§ <MOIS="200609"><JOUR="20060908"><HEURE="2006090807">
C'est <HAP1>un</HAP1> groupe <HAP1>de</HAP1> premier plan dans <HAP1>les</HAP1> équipements télécoms,
<HAP2><HAP1-et-2>générant</HAP1-et-2></HAP2> <HAP1>un</HAP1> <HAP2><HAP1-et-2>chiffre</HAP1-et-2></HAP2> d'<HAP2><HAP1-et-2>affaires</HAP1-et-2></HAP2> d'<HAP2><HAP1-<HAP1-et-2>et</HAP1-et-2>-2>environ</HAP1-<HAP1-et-2>et</HAP1-et-2>-2></HAP2> 21 <HAP2><HAP1-et-2>milliards</HAP1-et-2></HAP2> d'<HAP2><HAP1-et-2>euros</HAP1-et-2></HAP2>, <HAP2><HAP1-et-2>qui</HAP1-et-2></HAP2>
<HAP2><HAP1-<HAP1-et-2>et</HAP1-et-2>-2>voit</HAP1-<HAP1-et-2>et</HAP1-et-2>-2></HAP2> <HAP2><HAP1-<HAP1-et-2>et</HAP1-et-2>-2>le</HAP1-<HAP1-et-2>et</HAP1-et-2>-2></HAP2> <HAP2><HAP1-et-2>jour</HAP1-et-2></HAP2>. <HAP2><HAP1-<HAP1-et-2>et</HAP1-et-2>-2>Les</HAP1-<HAP1-et-2>et</HAP1-et-2>-2></HAP2> <HAP2><HAP1-et-2>actionnaires</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>des</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>équipementiers</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>en</HAP1-et-2></HAP2>
<HAP2><HAP1-et-2>télécommunications</HAP1-et-2></HAP2> <HAP2><HAP1-<HAP1-et-2>et</HAP1-et-2>-2>français</HAP1-<HAP1-et-2>et</HAP1-et-2>-2></HAP2> <HAP2><HAP1-et-2>Alcatel</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>et</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>américain</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>Lucent</HAP1-et-2></HAP2> <HAP2><HAP1-<HAP1-et-2>et</HAP1-et-2>-2>ont</HAP1-<HAP1-et-2>et</HAP1-et-2>-2></HAP2> <HAP2><HAP1-et-2>donné</HAP1-et-2></HAP2>,
<HAP2><HAP1-<HAP1-et-2>et</HAP1-et-2>-2>jeudi</HAP1-<HAP1-et-2>et</HAP1-et-2>-2></HAP2> 7 <HAP2><HAP1-et-2>septembre</HAP1-et-2></HAP2>, <HAP2><HAP1-<HAP1-et-2>et</HAP1-et-2>-2>leur</HAP1-<HAP1-et-2>et</HAP1-et-2>-2></HAP2> <HAP2><HAP1-<HAP1-et-2>et</HAP1-et-2>-2>feu</HAP1-<HAP1-et-2>et</HAP1-et-2>-2></HAP2> <HAP2><HAP1-et-2>vert</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>au</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>projet</HAP1-et-2></HAP2> <HAP1>de</HAP1> <HAP2><HAP1-et-2>fusion</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>entre</HAP1-et-2></HAP2> <HAP1>les</HAP1> <HAP2><HAP1-et-2>deux</HAP1-et-2></HAP2>
<HAP2><HAP1-et-2>groupes</HAP1-et-2></HAP2>.