Vendredi 20 Octobre 2006 22:41:13

Projection sur un fichier au format Lexico3 d'un fichier de segments répétés issus de Lexico3, de ses hapax et des 2 fichiers d'hapax associés aux 2 parties de textes constituant l'ensemble du texte.

Mode d'emploi du programme (à lancer dans une fenêtre MSDOS ou "Invites de commandes") :
projette-segments-hapax fichier-SR fichier longueur-plancher-segment frequence-plancher-segment fichier-hapax fichier-hapax1 fichier-hapax2

Ci-dessous, les différentes versions avec le résultat de la projection. En rouge les segments et en bleu les hapax.
Ces 2 types d'unités sont aussi encapsulés dans des balises appelées respectivement SR et HAPAX.

On distingue aussi les hapax du texte n°1 (qui ne sont pas hapax du n°2), ceux du texte n°2 (qui ne sont pas hapax du n°1) et les hapax du texte complet.

FICHIER 1

§ <MOIS="200603"><JOUR="20060318"><HEURE="2006031815">
<HAP1><HAP1-et-2>C</HAP1-et-2></HAP1>'<HAP1><HAP1-et-2>est</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>parti</HAP1-et-2></HAP1>, la <HAP1><HAP1-et-2>manifestation</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>a</HAP1-et-2></HAP1> <HAP2>commencé</HAP2> à Paris <HAP1><HAP1-et-2>samedi</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>après</HAP1-et-2></HAP1>-<HAP1><HAP1-et-2>midi</HAP1-et-2></HAP1>.
<HAP1><HAP1-et-2>En</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>province</HAP1-et-2></HAP1>, <HAP2>les</HAP2> <HAP1><HAP1-et-2>manifestations</HAP1-et-2></HAP1> <HAP1>ont</HAP1> <HAP2>commencé</HAP2> un <HAP1><HAP1-et-2>peu</HAP1-et-2></HAP1> plus <HAP1><HAP1-et-2>tôt</HAP1-et-2></HAP1>. A <HAP1><HAP1-et-2>Lyon</HAP1-et-2></HAP1>
<HAP1><HAP1-et-2>comme</HAP1-et-2></HAP1> à <HAP1><HAP1-et-2>Toulouse</HAP1-et-2></HAP1>, <HAP2>les</HAP2> <HAP1><HAP1-et-2>manifestants</HAP1-et-2></HAP1> seraient plus de 20 000. A
<HAP1><HAP1-et-2>Poitiers</HAP1-et-2></HAP1>, <HAP1><HAP1-et-2>ils</HAP1-et-2></HAP1> seraient <HAP1><HAP1-et-2>entre</HAP1-et-2></HAP1> 7 000 <HAP1>et</HAP1> 10 000. <HAP1><HAP1-et-2>Plus</HAP1-et-2></HAP1> de 160
<HAP1><HAP1-et-2>rassemblements</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>sont</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>prévus</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>dans</HAP1-et-2></HAP1> la journée.

FICHIER 2

§ <MOIS="200603"><JOUR="20060318"><HEURE="2006031816">
<HAP2><HAP1-et-2>Troisième</HAP1-et-2></HAP2> journée de <HAP2><HAP1-et-2>mobilisation</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>nationale</HAP1-et-2></HAP2> contre le <HAP2><HAP1-et-2>contrat</HAP1-et-2></HAP2>
<HAP2><HAP1-et-2>première</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>embauche</HAP1-et-2></HAP2>. <HAP2><HAP1-et-2>Des</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>dizaines</HAP1-et-2></HAP2> de <HAP2><HAP1-et-2>milliers</HAP1-et-2></HAP2> d'<HAP2><HAP1-et-2>étudiants</HAP1-et-2></HAP2>, de <HAP2><HAP1-et-2>lycéens</HAP1-et-2></HAP2> <HAP1>et</HAP1>
de <HAP2><HAP1-et-2>salariés</HAP1-et-2></HAP2> <HAP1>ont</HAP1> <HAP2>commencé</HAP2> à <HAP2><HAP1-et-2>défiler</HAP1-et-2></HAP2> contre le <HAP2><HAP1-et-2>CPE</HAP1-et-2></HAP2> place
<HAP2><HAP1-et-2>Denfert</HAP1-et-2></HAP2>-<HAP2><HAP1-et-2>Rochereau</HAP1-et-2></HAP2> à Paris, <HAP2><HAP1-et-2>avec</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>l</HAP1-et-2></HAP2>'<HAP2><HAP1-et-2>assistance</HAP1-et-2></HAP2> d'un <HAP2><HAP1-et-2>important</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>service</HAP1-et-2></HAP2>
d'<HAP2><HAP1-et-2>ordre</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>fourni</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>par</HAP1-et-2></HAP2> <HAP2>les</HAP2> <HAP2><HAP1-et-2>confédérations</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>syndicales</HAP1-et-2></HAP2>. <HAP2><HAP1-et-2>Les</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>leaders</HAP1-et-2></HAP2>
<HAP2><HAP1-et-2>syndicaux</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>Bernard</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>Thibault</HAP1-et-2></HAP2> (<HAP2><HAP1-et-2>CGT</HAP1-et-2></HAP2>), <HAP2><HAP1-et-2>François</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>Chérèque</HAP1-et-2></HAP2> (<HAP2><HAP1-et-2>CFDT</HAP1-et-2></HAP2>),
<HAP2><HAP1-et-2>Jean</HAP1-et-2></HAP2>-<HAP2><HAP1-et-2>Claude</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>Mailly</HAP1-et-2></HAP2> (<HAP2><HAP1-et-2>FO</HAP1-et-2></HAP2>) <HAP1>et</HAP1> <HAP2><HAP1-et-2>Gérard</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>Aschieri</HAP1-et-2></HAP2> (<HAP2><HAP1-et-2>FSU</HAP1-et-2></HAP2>) <HAP1>ont</HAP1> <HAP2><HAP1-et-2>pris</HAP1-et-2></HAP2> place <HAP2><HAP1-et-2>en</HAP1-et-2></HAP2>
<HAP2><HAP1-et-2>tête</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>du</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>cortège</HAP1-et-2></HAP2>.