Vendredi 20 Octobre 2006 22:42:21

Projection sur un fichier au format Lexico3 d'un fichier de segments répétés issus de Lexico3, de ses hapax et des 2 fichiers d'hapax associés aux 2 parties de textes constituant l'ensemble du texte.

Mode d'emploi du programme (à lancer dans une fenêtre MSDOS ou "Invites de commandes") :
projette-segments-hapax fichier-SR fichier longueur-plancher-segment frequence-plancher-segment fichier-hapax fichier-hapax1 fichier-hapax2

Ci-dessous, les différentes versions avec le résultat de la projection. En rouge les segments et en bleu les hapax.
Ces 2 types d'unités sont aussi encapsulés dans des balises appelées respectivement SR et HAPAX.

On distingue aussi les hapax du texte n°1 (qui ne sont pas hapax du n°2), ceux du texte n°2 (qui ne sont pas hapax du n°1) et les hapax du texte complet.

FICHIER 1

§ <MOIS="200609"><JOUR="20060913"><HEURE="2006091321">
<HAP1><HAP1-et-2>Des</HAP1-et-2></HAP1> traces du riz OGM <HAP1><HAP1-et-2>LL</HAP1-et-2></HAP1> 601, <HAP1><HAP1-et-2>interdit</HAP1-et-2></HAP1> dans l'<HAP1><HAP1-et-2>UE</HAP1-et-2></HAP1>, ont été détectées
<HAP1><HAP1-et-2>sur</HAP1-et-2></HAP1> sept des dix-neuf <HAP1><HAP1-et-2>échantillons</HAP1-et-2></HAP1> de riz américain <HAP1><HAP1-et-2>testés</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>en</HAP1-et-2></HAP1>
<HAP1><HAP1-et-2>laboratoire</HAP1-et-2></HAP1>, <HAP1><HAP1-et-2>selon</HAP1-et-2></HAP1> une source <HAP1><HAP1-et-2>proche</HAP1-et-2></HAP1> du <HAP1><HAP1-et-2>dossier</HAP1-et-2></HAP1>. <HAP1><HAP1-et-2>Dès</HAP1-et-2></HAP1> le <HAP1><HAP1-et-2>lendemain</HAP1-et-2></HAP1> de
l'<HAP1><HAP1-et-2>annonce</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>par</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>la</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>Commission</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>européenne</HAP1-et-2></HAP1>, le 23 <HAP1><HAP1-et-2>août</HAP1-et-2></HAP1>, d'une <HAP1><HAP1-et-2>suspicion</HAP1-et-2></HAP1> de
traces d'OGM dans des <HAP1><HAP1-et-2>lots</HAP1-et-2></HAP1> de riz <HAP1><HAP1-et-2>américains</HAP1-et-2></HAP1>, "une <HAP1><HAP1-et-2>alerte</HAP1-et-2></HAP1> a été
<HAP1><HAP1-et-2>déclenchée</HAP1-et-2></HAP1> et les <HAP1><HAP1-et-2>autorités</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>compétentes</HAP1-et-2></HAP1> ont <HAP1><HAP1-et-2>fait</HAP1-et-2></HAP1> dix-neuf
prélèvements <HAP1><HAP1-et-2>chez</HAP1-et-2></HAP1> dix-<HAP1><HAP1-et-2>huit</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>importateurs</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>français</HAP1-et-2></HAP1> de riz américain", a
<HAP1><HAP1-et-2>indiqué</HAP1-et-2></HAP1>, <HAP1><HAP1-et-2>mercredi</HAP1-et-2></HAP1> 13 <HAP1><HAP1-et-2>septembre</HAP1-et-2></HAP1>, <HAP1><HAP1-et-2>cette</HAP1-et-2></HAP1> source. "<HAP1><HAP1-et-2>Sur</HAP1-et-2></HAP1> les dix-neuf
prélèvements, sept <HAP1><HAP1-et-2>se</HAP1-et-2></HAP1> sont <HAP1><HAP1-et-2>révélés</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>positifs</HAP1-et-2></HAP1> et <HAP1><HAP1-et-2>douze</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>négatifs</HAP1-et-2></HAP1>." <HAP1><HAP1-et-2>Les</HAP1-et-2></HAP1>
traces détectées sont "<HAP1><HAP1-et-2>légères</HAP1-et-2></HAP1>", <HAP1><HAP1-et-2>inférieures</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>à</HAP1-et-2></HAP1> 0,1 %.
§