EXPLICATION DU PROJET


"La vie des mots sur le web", intitulé de notre projet encadré 2010-2011 (INALCO, Paris3 et Paris10), représente non seulement un exercice de programmation, mais aussi un essai de réflexion de morphologie lexicale, qui peut servir à l'élaboration d'outils de traduction.
On peut en effet observer qu'au sein du lexique français, il existe des mots qui peuvent entretenir entre eux des relations d'identité, d'opposition et d'implication sémantiques (par exemple les synonymes et antonymes), ou bien qui offrent plusieurs significations (polysémie). C'est ce dernier élément qui a retenu notre attention pour ce projet.

La polysémie est une propriété caractéristique du vocabulaire général et correspond à la conséquence normale de la vie de la langue du fait des pratiques et usages linguistiques.
Afin d'appréhender ce concept sémantique, nous avons décidé d'analyser un mot en particulier :
Bouton [buto~], qui peut se décliner en 4 sens différents, selon les dictionnaires de langue française contemporains, comme le Petit Robert 2009.

Nombre de sens trouvés pour « bouton » Définition du Petit Robert (2009) Exemples de phrases en contexte
SENS 1 Petite excroissance d'où naissent les branches, feuilles, fruits ou fleurs d'un végétal (fin XIIe siècle) La jeune fille cueille un bouton de fleur.
SENS 2 Petite pièce souvent circulaire, de matière dure, que l'on fixe sur les vêtements pour en assurer la fermeture ou pour servir d'ornement (par extension avec le sens 2, XIIe siècle) Je recouds mon bouton de chemise
SENS 3 Petite tumeur (pustule) faisant saillie à la surface de la peau (par analogie avec le sens 1, XVIe siècle) J'ai un visage couvert de boutons d'acné
SENS 4 Petite saillie ronde, spécialement commande d'un mécanisme, d'un appareil, que l'on tourne ou sur lequel on appuie (début XXe siècle) J'appuie sur le bouton de l'interphone

Cette polysémie facilite en particulier la désignation des objets en contexte, et par conséquent notre recherche d'URLS (Uniform Ressource Locator) sur le Web.

Outre la polysémie, ce projet permet également d'appréhender l'analyse syntaxique en linguistique. Ainsi, les exemples de phrases, citées dans le tableau ci-dessus, permettent une première approche de l'analyse syntaxique en linguistique.
Par exemple, la phrase: « la jeune fille cueille un bouton de fleur», permet d'écrire la grammaire CFG suivante:
S---> SN SV
SN ---> det adj nom
SN ---> det nom
SN---> det nom SP
SP---> prép nom
SV---> verbe SN

et de proposer les arbres syntagmatiques ci-après, selon la méthode de l'analyse syntaxique descendante avec retours en arrières:

  • le deuxième arbre pour SN S(SN(det, adj, nom)SV(vb, SN(det, nom))) est un échec
  • le troisième arbre pour SN S(SN(det, adj, nom)SV(vb, SN(det, nom, SP(prép, nom)))) est une réussite
  • le deuxième arbre pour le premier SN: S(SN(det, nom)SV(vb, SN(det,adj, nom))) est un échec
  • le troisième arbre pour le premier SN: S(SN(det,nom,SP(prép, nom)SV(vb,SN(det,nom))) est un échec
pas de SV2, ni de SP2, il n'y a qu'un arbre possible.

Mais notre projet ne concerne pas seulement le français, mais aussi des langues cibles.
Notre choix c'est porté sur l'anglais, l'arabe, l'espagnol, le malgache et le russe.
Il s'agit pour la plupart de langues internationales, concernant des champs géographiques variés et dont la pratique peut se développer de plus en plus au sein de la mondialisation.

Nombre de locuteurs en espagnol Nombre de locuteurs en anglais Nombre de locuteurs en russe Nombre de locuteurs en arabe Nombre de locuteurs en français Nombre de locuteurs en malgache
600 millions 400 millions 280 millions 240 millions 220 millions 20 millions


De plus, nous avons décidé de choisir des familles de langues diverses :
Langues indo-européennes: romanes (français, espagnol), germanique (anglais); slave (russe).
Langue sémitique (arabe littéral).
Langue austronésienne (malgache).
En outre, il nous a semblé aussi intéressant de nous interroger aussi sur l'existence ou non d'une polysémie du mot « bouton » dans notre choix de langues cibles:

SENS Espagnol Anglais Russe Arabe Français Malgache
Botanique botón, capullo bud бутон برﻋﻢ bouton vontsina
Couture botón button пуговица زر bouton bokotra"
Médical grano, pustula (acné) pimple, spot (acné) прыщ بشرة bouton mony, forofotra
Electrique botón button, switch кнопка زر bouton inexistant

Pour le russe, il n'existe pas de polysémie :
    бутон (sens botanique); пуговица (sens couture); прыщ (sens medical); кнопка (sens electrique).

    Par contre, en espagnol, en anglais, en malgache et en arabe littéral, il existe une polysémie du terme bouton :
    • En espagnol, botón exprime aussi bien le sens botanique, que les sens couture et électricité/électronique. Toutefois, le sens médical est exprimé par les vocables grano ou pustula (acné).

    • En anglais, button exprime le sens couture et le sens électricité/électronique.

    • En malgache, mony et forofotra exprime tous deux le sens médical.

    • En arabe littéral, le mot زر est utilisé aussi bien pour les sens électrique/électronique que pour le sens couture de bouton. Par contre, le sens botanique est exprimé par برﻋﻢ et le sens médical par بشرة


    EN ROUTE POUR LE PROJET INFORMATIQUE :


    Le schéma récapitulatif suivant symbolise les différentes étapes de la chaîne de traitement qui se présenteront sous la forme d’un tableau final des résultats. L’étape ultime est l’extraction des contextes dans lesquels le mot ‘bouton’ apparaît.


    Example pic




    Bonne visite !