Centre de textométrie - SYLED / CLA2T
[U. Paris 3 Sorbonne nouvelle]
http://www.cavi.univ-paris3.fr/ilpga/syled/cla2t.htm
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
mkAlign |
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
(mise à jour : juin 2009, 2.00)
Manuel d’utilisation
Serge Fleury
Maria Zimina
URL : http://tal.univ-paris3.fr/mkAlign/
Téléchargement : http://tal.univ-paris3.fr/mkAlign/
Contact : serge.fleury@univ-paris3.fr
Version exécutable sous Windows disponible en ligne
Version script Perl/Tk disponible sur demande
(documentation en ligne sur la page du projet, ce document mis à jour)
Sommaire
6.1.1
Chargement des textes à aligner
6.1.3
Prétraitement des textes à aligner
6.1.4
Découpage des textes en parties
6.1.5
Paramètres lexicométriques des textes chargés
6.2
Mode « alignement par recherche de cognats ». Alignement automatique
de fichiers
6.3
Mode «Import d’alignement au format TMX »
7
Principales fonctionnalités de mkAlign pour l’édition de l’alignement
7.2 Exporter
sous-corpus contenant un motif
7.3 Figement
de cellule (lecture/écriture)
7.7 Remarques
sur le segmenteur
7.9 Fonctionnalité complémentaire pour le MODE SPLIT :
lecture LR/RL
8
Représentation cartographique de l'alignement
8.1 Construction
de la carte de l’alignement
8.2 Recherche
de motifs dans la carte de l’alignement
8.3 Importation/exportation
du vecteur des positions d’une sélection
8.4 Affichage
d’une partition dans la carte de l’alignement
8.5 Navigation
vers l’alignement
8.6 Le
vocabulaire spécifique d’une section de la carte
8.7 Le
vocabulaire spécifique d’une sélection de sections de la carte
8.8 Fonctionnalités
complémentaires sur la carte des sections
8.10 Retour
aux contextes à partir du vocabulaire spécifique
8.11 Filtrage
de la « zone miroir » au cours d’une recherche (« au-delà du
miroir »)
12
Cooccurrences – Poly-Cooccurrences
13
Graphiques : ventilation / accroissement de vocabulaire
13.1 Ventilation
de formes graphiques
13.2 Courbe
d’accroissement de vocabulaire
14
Exportation des traitements
14.3 Export
au format XML pour sauvegarder une session de travail
14.4 Export
complet au format HTML
14.5 Export
partiel au format HTML
14.6 Export
de bi-textes au format TXT
14.7 Export
de l’alignement au format TMX
16
Mise au jour de la variation dans les textes
16.2 Projections
lexicométriques
17 Le rapport : enregistrement des
résultats produits
17.1 Ajouter
un élément au rapport
17.2 Ajouter
un élément externe au rapport
19.1
Les expressions régulières
19.2
Fonctionnalités de l’éditeur d’alignement
Figure
1 : mkAlign Fenêtre principale.
Figure
2 : mkAlign Onglet PARAM
Figure
3 : mkAlign Onglet ALIGN, chargement des fichiers
Figure
4 : mkAlign Onglet ALIGN, fichiers chargés
Figure
5 : mkAlign Onglet PARAM, paramétrage de l’encodage
Figure
6 : mkAlign Onglet ALIGN, fichiers chargés après sélection d’encodage
Figure
7 : mkAlign choix du segmenteur
onglet ALIGN ou onglet PARAM
Figure
8 : mkAlign pré-formatage de la SOURCE et de la CIBLE
Figure
9(1) : mkAlign Onglet DICT, chargement
Figure
9(2) : mkAlign Onglet DICT, projection sur la carte d’une sélection de
formes
Figure
9(3) : mkAlign Onglet DICT, concordance d’une sélection de formes
Figure
9(4) : mkAlign Onglet DICT, recherche de formes
Figure
10 : mkAlign Onglet RAPPORT
Figure
11 (1) : mkAlign Alignement par recherche de cognats
Figure
11 (2) : mkAlign Alignement par recherche de cognats
Figure
12 (1) : mkAlign Alignement par importation d’un fichier au format TMX
(choix du fichier)
Figure
12 (2) : mkAlign Alignement par importation d’un fichier au format TMX
(choix de 2 langues)
Figure
13 : mkAlign Onglet ALIGN, recherche de chaînes
Figure
14 : mkAlign Alignement en cours
Figure
15 : mkAlign Onglet MAP
Figure
16 : mkAlign Recherche dans la carte des sections
Figure
17 : mkAlign Recherche et Navigation dans la carte des sections
Figure
18 : mkAlign Carte / Sections / Parties
Figure
19 : mkAlign Carte / Sections / Spécificités
Figure
20 : mkAlign Carte / Sections / Sélection
Figure
21 (1) : mkAlign Carte / Sections / Spécificité sections
Figure
21 (2) : mkAlign Carte / Sections / Spécificité sections
Figure
22 (1) : mkAlign Carte / Sections / Spécificités / Cooccurrents
Figure
22 (2) : mkAlign Carte / Sections / Spécificités / Cooccurrents
Figure
23 (1) : mkAlign « Au-delà du miroir »
Figure
23 (2) : mkAlign « Au-delà du miroir »
Figure
23 (3) : mkAlign « Au-delà du miroir »
Figure
23 (4) : mkAlign « Au-delà du miroir »
Figure
24 (1) : mkAlign Onglet CONCORDANCE, édition d’une concordance
Figure
24 (2) : mkAlign exportation bi-concordance
Figure
25 : mkAlign Onglet LISTES, importation de listes
Figure
26 : mkAlign Onglet LISTES, édition de listes importées
Figure
27 (1) : mkAlign Onglet SEGMENTS
Figure
27 (2) : mkAlign Onglet PARAM, paramétrage du calcul des segments
répétés
Figure
27 (3) : mkAlign Onglet SEGMENTS, sélection de segments
Figure
27 (4) : mkAlign Onglet SEGMENTS, sélection de segments
Figure
28 : mkAlign Onglet COOCS, calcul de cooccurrents et de
poly-cooccurrents
Figure
29 (1) : mkAlign Onglet DIC, ventilation de formes
Figure
29 (2) : mkAlign Onglet DIC, sélection de formes pour ventilation
Figure
29 (3) : mkAlign Onglet GRAPHE, ventilation des formes
sélectionnées
Figure
30 : mkAlign Onglet GRAPHE, courbe d’accroissement du vocabulaire
Figure
31 : mkAlign Onglet EXPORT-L3
Figure
32 : mkAlign Onglet EXPORT-XML..
Figure
33 : mkAlign Schéma Export XML..
Figure
34 : mkAlign Export HTML
Figure
35 : mkAlign Export sélectif (sélection d'une forme)
Figure
36 : mkAlign Résultat d'export sélectif - Fichier complet :
example-export.html
Figure
37 : mkAlign, Export de bi-textes
Figure
38 : mkAlign, Export de l’alignement au format TMX
Figure
39 : mkAlign, Ouverture de l’alignement au format TMX dans Word avec
feuille de styles
Figure
40 : mkAlign Onglet EXPORT
Figure
41 : mkAlign Schéma Import
Figure
42 (1) : mkAlign Onglet Variation (paramètres et outils)
Figure
42 (2) : mkAlign Repérage de la variation (alignement initial)
Figure
42 (3) : mkAlign Mise au jour de la variation
Figure
43 : mkAlign Ajouter un élément au rapport
Figure
44 : mkAlign Onglet EXPORT : Rapport en cours
Figure
45 : mkAlign Insertion d’image externe dans le rapport
Figure
46 : Index du rapport enregistré.
La notion de corpus parallèle, qui émerge actuellement dans les travaux de différents chercheurs comme corpus comportant plusieurs volets qui correspondent chacun à une version d’un même texte dans deux ou plusieurs langues différentes, renvoie à des situations connues de coexistence de textes présentant des liens forts dans leur structuration.
Le traitement de corpus parallèles suppose une phase préalable d’alignement[1], c’est-à-dire de mise en correspondance dans chacun des volets de différents types d’unités textuelles [Zimina, 2004].
Aligner des corpus de textes originaux et de leurs traductions c’est mettre en relation des unités textuelles qui se correspondent. On peut établir des correspondances entre des unités de différents niveaux : mots, syntagmes, phrases, paragraphes, sections, etc.
Le programme mkAlign permet de construire, corriger et visualiser un alignement de deux textes via un éditeur à double entrée. Il permet d’afficher simultanément les textes source et cible pour y rajouter ou corriger des segments équivalents.
Ce programme n’est pas (seulement) un aligneur automatique.
Il est conçu pour aider l’utilisateur dans la création, l’alignement, la correction et la validation de textes traduits. L’utilisateur garde la maîtrise sur l’ensemble des processus, depuis la mise en correspondance initiale des segments équivalents jusqu’à l’export final du bi-texte produit.
Il est aussi conçu pour mener des calculs lexicométriques[2] sur les contenus textuels chargés.
Il appartient à l’utilisateur de construire l’alignement et de définir son degré de précision (résolution). Cette résolution peut varier pour mettre en évidence les correspondances entre les segments textuels des différents niveaux.
La notion de sauvegarde de session de travail (création de fichiers d’export/import de bi-textes au format xml et html) permet de commencer le travail sur un corpus à deux volets textuels, l’exporter au format désiré, puis le réimporter plus tard pour y apporter des modifications.
La visualisation de l’alignement dans une représentation cartographique (bi-text map) offre plusieurs possibilités de gestion de corpus qui partagent des similitudes au plan traductionnel[3].
L’interface du programme est composée d’une fenêtre graphique disposant de différents onglets.
L’onglet HOME visible au chargement contient un mode d’emploi du programme.

Figure 1 : mkAlign Fenêtre principale
L’onglet PARAM permet de modifier le paramétrage de certaines fonctionnalités du programme (taille des polices d’affichage des textes, couleurs de cellules d’édition, encodage des fichiers source et cible etc.).

Figure 2 : mkAlign Onglet PARAM
Les autres onglets sont décrits infra.
|
Icône |
Fonction |
Localisation |
|
|
Chargement du fichier source |
Onglet
ALIGN |
|
|
Chargement du fichier cible |
Onglets
ALIGN |
|
|
Alignement du fichier cible et du fichier cible |
Onglets
ALIGN |
|
|
Sauvegarde (fichier source, cible, export, carte) |
Onglets
ALIGN,
EXPORT,
MAP |
|
|
Rafraîchissement éditeur/carte |
Onglets
ALIGN, MAP |
|
|
MODE MERGE |
Onglet
ALIGN |
|
|
MODE SPLIT |
Onglet
ALIGN |
|
|
Dessin de la carte des sections |
Onglet
MAP |
|
|
Export au format HTML |
Onglets
EXPORT,
CONCORDANCE |
|
|
Parser XML |
Onglet
ALIGN |
|
|
Import d’alignement |
Fenêtre
principale |
|
|
Export au format XML |
Fenêtre
principale |
|
|
Export de bitexte |
Fenêtre
principale |
|
|
Export au format Lexico3 |
Fenêtre
principale |
|
|
Export au format HTML |
Fenêtre
principale |
|
|
Documentation du programme |
Fenêtre
principale |
|
|
Sortie du programme |
Fenêtre
principale |
|
|
Palette |
Onglet
PARAM |
|
|
Page suivante |
Onglet
ALIGN |
|
|
Dernière page |
Onglet
ALIGN |
|
|
Première page |
Onglet
ALIGN |
|
|
Page précédente |
Onglet
ALIGN |
|
|
Editeur annexe |
Fenêtre
principale |
|
|
Export "Recherche Source" |
Onglet
MAP |
|
|
Export "Recherche Cible" |
Onglet
MAP |
|
|
Export Intersection "Recherche
Source/Cible" |
Onglet
MAP |
|
|
Export Vecteur Recherche Source |
Onglet
MAP |
|
|
Export Vecteur Recherche Cible |
Onglet
MAP |
|
|
Import Vecteur Recherche Source |
Onglet
MAP |
|
|
Import Vecteur Recherche Cible |
Onglet
MAP |
|
|
Import de liste (Source) |
Onglet MAP |
|
|
Import de liste (Cible) |
Onglet MAP |
|
|
Calcul des segments répétés dans les fichiers SOURCE et CIBLE |
Fenêtre principale |
|
|
Recherche
des cooccurrents d’une forme dans la source |
Onglet MAP |
|
|
Recherche
des cooccurrents d’une forme dans la cible |
Onglet MAP |
|
|
Calcul
des spécificités dans une sélection de sections dans la source |
Onglet MAP |
|
|
Calcul
des spécificités dans une sélection de sections dans la cible |
Onglet MAP |
|
|
Sélection
du type de recherche dans la zone
miroir |
Onglet MAP |
|
|
Ventilation Source/Cible :
présence/absence/intersection |
Onglet MAP |
|
|
Ajout au rapport / Enregistrement du rapport |
Fenêtre principale |
|
|
Calcul des cooccurrents et des poly-cooccurrents |
Onglet COOCS |
Trois modes de chargement des textes de travail sont disponibles :

Figure 3 : mkAlign Onglet ALIGN, chargement des fichiers
L’onglet ALIGN contient les fenêtres d’édition pour l’alignement et les points d’entrée pour les différentes fonctionnalités associées.
La construction d’un alignement utilise en entrée deux volets d'un même corpus (SOURCE et CIBLE) : le texte SOURCE sera chargé dans la partie gauche de mkAlign et le texte CIBLE dans la partie droite.
Le chargement peut être réalisé en tenant compte d'un caractère délimiteur (appelé le segmenteur, par défaut le caractère #) qui sera utilisé pour aligner les 2 volets du corpus. Si le segmenteur n'est pas présent dans les 2 volets initiaux, les 2 volets seront alignés globalement affichés intégralement dans les premières cellules SOURCE et CIBLE.
Par exemple, si le caractère segmenteur choisi est #, les fichiers en entrée peuvent avoir l'allure suivante :
Fichier Source :
sssssssssssssss #
sssssssssssssss #
etc.
Fichier Cible :
ccccccccccccccc #
ccccccccccccccc #
etc.
Dans cet exemple, le fichier SOURCE sera chargé dans la partie gauche de mkAlign avec au moins 2 cellules correspondant au découpage sur la base du segmenteur sélectionné. Idem pour le fichier CIBLE, dans la partie droite. Les 2 volets du corpus aligné sont présentés par page de 5 blocs alignés, on peut passer d'une page à l'autre de l'alignement via les boutons présents au bas de l'onglet ALIGN, ou en sélectionnant une page donnée (puis touche Entrée).
Après chargement de 2 fichiers, l'onglet ALIGN a l'allure suivante :

Figure 4 : mkAlign Onglet ALIGN, fichiers chargés
Dans les figures qui suivent, on présente le chargement des fichiers après sélection des paramètres d’encodage : iso-8859-1 pour le texte SOURCE et utf-8 pour le texte CIBLE.

Figure 5 : mkAlign Onglet PARAM, paramétrage de l’encodage

Figure 6 : mkAlign Onglet ALIGN, fichiers chargés après sélection d’encodage
Il est possible de paramétrer le segmenteur avant de charger le corpus : il suffit pour cela de changer la valeur dans la zone de saisie idoine (onglet ALIGN ou onglet PARAM)

![]()
Figure 7 : mkAlign choix du segmenteur onglet ALIGN ou onglet PARAM
Si la zone de saisie permettant de définir le segmenteur est vide, c’est le caractère retour chariot qui sera défini comme étant le segmenteur.
Remarque : il est aussi possible de forcer la segmentation des textes à aligner en caractères en cochant dans l’onglet PARAM la case idoine associée au fichier visé.
Par défaut, le chargement du texte SOURCE et du texte CIBLE se réalise en ne tenant compte que du segmenteur choisi et n’opère aucune modification sur les 2 volets à charger.
Il est aussi possible de prétraiter les 2 textes à charger et d’attribuer ainsi une valeur prédéfinie au segmenteur. Dans l’onglet ALIGN, l’activation de la case à cocher « Prétraitement » permet de pré-formater les 2 textes à charger en phrases ou en paragraphes.

Figure 8 : mkAlign pré-formatage de
Le découpage en paragraphes / phrases a
pour objectif la création automatique d’un premier alignement très
approximatif. Ce « brouillon » du bi-texte aligné devrait ensuite
être retravaillé par l’utilisateur à l’aide des fonctionnalités de mkAlign (voir la section §6 « Principales fonctionnalités de mkAlign ».
Le découpage automatique en phrases suit les règles typographiques élémentaires :
Si l’option « Prétraitement » est choisie, il reste à déterminer le type de pré-formatage à réaliser. Par défaut, l’activation du prétraitement active le pré-formatage en paragraphes ; pour activer le pré-formatage en phrases, il suffit de cocher la case idoine.
Le chargement des 2 fichiers alignés tient compte d'un marquage dans les textes d'une éventuelle partition, ce marquage est détecté s'il est réalisé de la manière suivante :
<nomdelapartie="valeur">
Ce marquage signifie que l'utilisateur a prédéfini un marquage de partie via une série de balises dans laquelle la partie est désignée par un type, ici par "nomdelapartie", et qu’elle est associée à chaque fois à une valeur donnée. Un fichier en entrée pourra donc avoir l'allure suivante (2 parties définies ici) :
<para="xxx">sssssssssssssss #
<part="yyy">sssssssssssssss #
<para="zzz">sssssssssssssss #
<part="uuu">sssssssssssssss #
etc.
Le chargement des fichiers SOURCE et CIBLE déclenche automatiquement un module de segmentation générant un dictionnaire des formes graphiques du fichier chargé. Ce programme de segmentation est paramétrable dans l’onglet PARAM : une liste des délimiteurs utilisés pour cette segmentation est donnée par défaut, l’utilisateur peut la modifier :
![]()
Le résultat de cette segmentation est visible dans l'onglet DICT et dans l'onglet RAPPORT :
· le dictionnaire sera visible dans le premier

Figure 9(1) : mkAlign
Onglet DICT, chargement
Après sélection d’une ou de plusieurs formes du dictionnaire, il est possible de déclencher :

Figure 9(2) : mkAlign Onglet DICT, projection sur la carte d’une sélection de formes

Figure 9(3) : mkAlign Onglet DICT, concordance d’une sélection de formes
On peut rechercher des formes dans le
dictionnaire en définissant un motif de recherche dans les zones de saisie
« Recherche Forme(s) ». Les
formes trouvées seront affichées dans les zones d’édition situées au bas de
l'onglet DICT. On peut réaliser la même opération en
sélectionnant un item dans la liste des formes puis en activant le raccourci clic-droit sur la forme visée.

Figure 9(4) : mkAlign Onglet DICT, recherche de formes
Là encore, on peut sélectionner une forme (ou plusieurs) dans la liste construite puis déclencher (1) la recherche de cette forme dans la représentation cartographique de l'alignement présentée infra (cf onglet MAP), (2) la construction d’une concordance sur cette forme et l'affichage du résultat de cette concordance dans l’onglet CONCORDANCE.
· les paramètres de la segmentation sont disponibles dans le l'onglet RAPPORT

Figure 10 : mkAlign Onglet RAPPORT
Ce mode de chargement s’inspire de
travaux réalisés dans le domaine de l’alignement automatique des phrases
utilisant la recherche de points d’ancrage lexicaux pour mettre en correspondances
des segments textuels plus longs. Cette méthode permet, pour des langues
apparentées, de construire un alignement en recherchant tout d’abord des
équivalents traductionnels sous forme de mots apparentés (ou cognats)[6],
les points d’ancrage obtenus déterminent ensuite l’alignement des zones en
correspondance. Sur ce type de méthodes, on consultera en particulier [Kraif,
1999].
Pour lancer ce mode de chargement via mkAlign, il faut utiliser le bouton disponible sous l’item « Alignement Source/Cible (Recherche de cognats) ». Celui-ci déclenche (1) l’ouverture d’une fenêtre demandant à l’utilisateur de préciser les paramètres pour construire l’alignement :

Figure 11 (1) : mkAlign Alignement par recherche de cognats
Les 4 paramètres étant définis (2), on peut lancer le processus d’alignement (3).
Après alignement des 2 fichiers, mkAlign a l'allure suivante :

Figure 11 (2) : mkAlign Alignement par recherche de cognats
Avec mkAlign,
les résultats de l’alignement par recherche de cognats peuvent toujours être
corrigés ou affinés par l’utilisateur à l’aide des fonctionnalités de création
/ gestion du bi-texte (voir la section §6 « Principales
fonctionnalités de mkAlign»).
Ce mode de chargement permet de charger
un alignement construit sur deux ou plusieurs fichiers et enregistré en
utilisant le format TMX[7].
Le format TMX (Translation
Memories eXchange) est un format d’échange entre mémoires de traduction développé par Lisa[8]. Dans ce format, un lien
implicite relie les segments équivalents dans une même unité de traduction :

Les figures suivantes
illustrent le chargement d’un fichier de ce type. Après sélection du fichier à
importer, il suffit de sélectionner les 2 langues associées aux deux volets
visés :

Figure 12 (1) : mkAlign Alignement par importation d’un fichier au format TMX (choix du fichier)

Figure 12 (2) : mkAlign Alignement par importation d’un fichier au format TMX (choix de 2 langues)
Le dossier EXPORT/TMX contient 2 exemples de ce type de fichier qu’il est possible d’importer dans mkAlign.
La figure 12 illustre une des fonctionnalités classique d'éditeurs de texte que l'on retrouve dans mkAlign : la recherche de chaîne de caractères.

Figure 13 : mkAlign Onglet ALIGN, recherche de
chaînes
On dispose dans l'onglet ALIGN de 2 zones de saisie permettant de lancer des recherches de chaînes : "Recherche Source" et "Recherche Cible". Les requêtes de recherche peuvent s'exprimer sous la forme d'expressions régulières [Fourmond, 2005].
Une expression régulière a pour fonction de définir un "modèle" de chaîne de caractères. Seules les formes lexicales contenant une chaîne de caractères conforme à ce modèle seront sélectionnées. Une des formes d'expression régulière simple est, par exemple, ique. Seules les formes qui contiennent ique seront sélectionnées.
Dans la figure précédente par exemple, les 2 requêtes exprimées sont :
Recherche Source : \bpsych
Recherche Cible : yse\b
Pour la requête SOURCE, on recherche en début de mot (\b) la présence des caractères psych : on cherche, par exemple, tous les mots qui commencent par psych. Comme le montre la figure 12, les séquences trouvées dans la figure sont colorées en rouge (psychanalyse).
Pour la requête CIBLE, on recherche la présence des caractères yse en fin de mot (\b): on cherche, par exemple, tous les mots qui se terminent par yse. Sur la figure 12, les séquences trouvées dans le texte CIBLE sont colorées en rouge (Psychoanalyse).
On présente en annexe les différents opérateurs d'expression régulière disponibles avec mkAlign (opérateurs classiques).
On trouve à côté de chaque zone de saisie de recherche un bouton permettant de sauvegarder l’ensemble des cellules contenant le motif défini dans la zone de saisie : on exporte ainsi un sous-corpus contenant toutes les sections contenant le motif sélectionné. Le fichier généré par l’exportation peut-être réimporté dans mkAlign (voir la procédure décrite supra : « Chargement des textes à aligner »).

- il est possible de figer 2 cellules alignées (case à cocher en regard de chaque couple de cellules alignées), dans ce cas les cellules sont protégées en écriture (état R), les cellules figées sont colorées en vert
- si une cellule n'est pas protégée, elle est modifiable en écriture (état W) (couleur blanche)
- l'insertion du caractère segmenteur provoque automatiquement le découpage de la cellule concernée,
- si un couple de cellules est figée à une position inférieure dans mkAlign, l'insertion du segmenteur (dans une cellule SOURCE ou CIBLE) provoque aussi l'insertion d'une nouvelle cellule vide (dans la colonne CIBLE ou SOURCE) juste avant la cellule figée, cette cellule insérée est colorée en rose.
- la suppression du caractère segmenteur dans une cellule provoque automatiquement la fusion de la cellule concernée et de la cellule juste au dessous
- si un couple de cellules est figé à une position inférieure dans mkAlign, la fusion provoque aussi l'insertion d'une nouvelle cellule vide dans la même colonne juste avant la cellule figée, cette cellule insérée est colorée en rose.
- on trouvera au bas de l'onglet ALIGN 3 cellules de couleur contenant chacune un compteur des différents états (de couleur) des cellules, par défaut
o le compteur vert indique le nombre de lignes protégées,
o le compteur rose indique le nombre de lignes contenant une cellule rose provenant d'une insertion ou d'une fusion,
o et le compteur blanc le nombre de ligne qui ne sont pas les précédentes

Figure 14 : mkAlign Alignement en cours
· si la zone de saisie permettant de définir le segmenteur est vide, le segmenteur utilisé par le programme est le retour chariot, dans ce cas le fait de taper un retour chariot dans une cellule provoque le découpage de la cellule concernée
· si la zone de saisie permettant de définir le segmenteur est vide, le segmenteur utilisé par le programme est le retour chariot, dans ce cas, pour réaliser une fusion de cellule, il faut utiliser le MODE MERGE présenté infra.
Dans les fonctionnalités précédentes, l'insertion ou la suppression du caractère segmenteur est faite au clavier en insérant/supprimant dans la zone d'édition choisie le caractère segmenteur.
Il existe aussi des modes particuliers permettant de réaliser ces opérations de fractionnement ou de fusion de cellules :
|
|
le MODE SPLIT |
|
|
le MODE MERGE. |
Ces deux modes sont disponibles après avoir chargé les fichiers de travail et après activation de l'un ou l'autre de ces modes (via les boutons SPLIT/MERGE dans l'onglet ALIGN). Ces deux modes sont désactivés par défaut.
Une fois activé (via un clic droit sur le bouton correspondant au mode choisi), ce mode permet, via le clic gauche de la souris :
- de scinder une cellule (équivalent à l'insertion du caractère segmenteur) à l'endroit où le clic a été réalisé
- de fusionner la cellule dans laquelle le clic a été réalisé avec la cellule suivante (équivalent à la suppression dans la cellule d'édition visée du caractère segmenteur)
Par défaut, l’activation du MODE SPLIT scinde la cellule visée en maintenant le contenu à gauche du clic gauche (ou du segmenteur inséré) dans cette cellule et insère le contenu à droite dans une nouvelle cellule en dessous (tout en décalant toutes les autres vers le bas). Ce mode de scission par défaut (lecture LR) peut être modifié pour permettre de réaliser l’opération inverse (lecture RL) : maintien de contexte droit en place et descente du contexte gauche. Ce paramétrage est disponible dans l’onglet PARAM.
Exemple :
Cellules initiales :
![]()
Cellules finales : SPLIT avant le « où ». SPLIT LR (source) et SPLIT RL (cible) ;

Après avoir chargé les 2 volets
d'un alignement il est possible de visualiser l'alignement en cours dans une
représentation cartographique (identique à celle produite par Lexico3[10] via
l'outil "Carte des Sections[11]").
On trouvera dans l'onglet MAP, un bouton
permettant de construire cette représentation
cartographique dans laquelle on disposera d'un carte des sections pour le volet
SOURCE et d’une autre pour le volet CIBLE, les carrés construits portent la couleur de
leur état dans l'aligneur (par défaut blanc, rose ou vert) ; au bas des 2
cartes on dispose aussi d'une zone d'édition pour éditer (via un clic gauche) le contenu d'un carré donné
: le contour du carré sélectionné devient bleu et le contour du carré aligné
devient noir.

Figure 15 : mkAlign Onglet
MAP
Paramétrage de
l’affichage de la carte des sections

Le bouton
active le chargement de la carte. Par défaut,
cet affichage insère linéairement les sections, sans alignement à gauche après
insertion d’un marqueur de partie (cf
infra). De plus, un séparateur de blocs de sections est inséré après
affichage de 5 sections : ce séparateur est utilisable ensuite pour
sélectionner les sections (cf infra).
·
Alignement à gauche ![]()
Ce bouton est inhibé par défaut, son activation (clic-droit) permet de représenter la carte en alignant les sections à gauche après chaque marquage de partie. Désactivation de cette fonction par un clic sur le bouton
·
Insertion d’un marqueur de bloc de
sections ![]()
Ce bouton est actif par défaut, son inhibition permet de ne pas afficher le marqueur de blocs de sections. Pour inhiber cette fonction : clic-droit. Pour l’activer : clic
Il est possible de rechercher des chaînes de caractères, écrites sous la forme d'expressions régulières (cf annexes), dans le volet SOURCE et/ou dans le volet CIBLE : on dispose dans l'onglet MAP de 2 zones de saisie permettant d’y définir un motif. Si la chaîne est trouvée, le carré correspondant est surligné en rouge (dans le volet SOURCE ou CIBLE) et les diagonales du carré sont dessinées. Les sections correspondantes (respectivement dans le volet SOURCE ou CIBLE) seront-elles aussi matérialisées par un surlignage rouge (trait fin) : la zone miroir.
Remarque : Le surlignage rouge sera inhibé après
sélection (par un clic gauche) d’un
carré donné et la croix sera maintenue i.e
les résultats de la précédente requête resteront ainsi accessibles. Par contre
le surlignage rouge restera actif après activation du raccourci clavier shift-clic sur le carré visé (affichage
de la section associée).

Figure 16 : mkAlign Recherche dans la carte des sections
A l'issue d'une recherche de motif dans la carte, la zone d'édition obtenue par un clic gauche (ou via shift-clic) sur un carré donné prend en compte le motif défini dans la zone de saisie associée : la sélection ou l’affichage d'une section de la carte déclenche une recherche du motif dans l'éditeur et produit le cas échéant l'affichage coloré de ce motif.
La recherche de 2 motifs respectivement dans chacun des volets de l’alignement permet de donner une représentation contrastée de la ventilation de ces 2 motifs :
