Serge Fleury

Maître de Conférences en linguistique informatique Sorbonne nouvelle, Paris 3
Membre du SYLEDED268

ILPGA / Sorbonne nouvelle
 
Retour Plan Slides TALN 1998

Construction inductive des savoirs

o Représenter

  • Faciliter la représentation des connaissances associés aux mots via la PàP
  • Apprendre aux prototypes lexicaux leurs comportements à partir d'un corpus
  • Le avoir attaché au mot n'est pas encodé à la main; il est affecté dynamiquement et automatiquement au prototype qui le représente

o Classer

  • Classer les représentations construites suivant leurs comportements

Représentation dynamique des unités lexicales

o Utilisation des résultats d'analyses syntaxiques pour apprendre aux mots

o Création automatique des prototypes de mot

Génération à la volée (automatique) de prototypes par création explicite d'un nouvel objet

Génération à la volée (automatique) de prototypes par clonage et ajustements

Représentation dynamique des contraintes syntaxiques

o Génération automatique des prototypes d'arbres "élémentaires"

  • Création explicite d'un nouvel objet

Si la catégorie syntaxique tête d'un arbre "élémentaire" n'est pas encore représentée, on définit les objets qui vont la représenter avec les attributs adéquats

o Génération automatique des prototypes d'arbres d'analyse

  • Création explicite d'un nouvel objet

Si la catégorie syntaxique tête d'un arbre d'analyse n'est pas encore représentée, on définit les objets qui vont la représenter avec les attributs adéquats

o Mise en place des liens entre prototypes lexicaux et prototypes d'arbres "élémentaires"

o Mise en place des liens entre prototypes d'arbres

Représentation évolutive des mots

o Avant Phase de génération

Un mot : une description sous-déterminée

o Après Phase de génération

Représentation sous déterminée des mots : sémantique, morphologique...

C´est l´examen des contextes (i.e les arbres associés) qui doit permettre de construire un sens possible ou tracer une piste de sens

=> Affinements possibles de manière dynamique et à tout moment des objets construits

Classement des prototypes

o Mise à jour automatique des traits : héritage local des comportements partagés

o Un premier classement des prototypes suivant leurs comportements syntaxiques

  • stenose et lesion partagent des comportements
  • angioplastie entre dans des constructions du type "indication de angioplastie"
  • Avec les noms stenose, lesion et angioplastie on obtient le mini réseau suivant

 

Classification évolutive

o (1) Recherche sur tous les mots d'une même catégorie des comportements partagés (i.e. détermination des arbres propres à chacun d'eux)

o (2) Recherche des arbres élémentaires communs à deux prototypes (i.e. détermination des arbres propres à chacun d'eux)

· Examen des comportements partagés par les mots (deux à deux)

o (3) Recherche sur des sous-familles de mots d'une même catégorie des comportements partagés et construction automatique d'un pôle de comportements partagés

  • Examen des comportements partagés sur des sous-familles de mots d'une famille catégorielle

o (4) Recherche sur des sous-familles d'arbres élémentaires d'une même catégorie des comportements partagés (arbres d'analyse) et construction d'un pôle de comportements partagés

  • Examen des comportements partagés par les arbres élémentaires

effort et myocarde entrent dans des séquences N1 Prep N2 en position N2

Différence de comportements de ces deux mots dans des arbres d'analyse :

effort ne peut pas y être modifié, myocarde l'est toujours par un déterminant

Mise en place de réseaux de prototypes : autant de réseaux à interpréter

o Des regards multiples et croisés sur les savoirs représentés

o Ces liens multiples constituent autant de pistes de sens à interpréter

Amorçages d'interprétation

o La syntaxe pour dégrossir le classement

  • Rapprochement de certaines unités lexicales suivant certains comportements syntaxiques

o La syntaxe est incapable à elle seule de délimiter des classes de mots reflétant une notion

  • "La syntaxe comme marche-pied de l'acquisition des connaissances" : (Habert & Nazarenko 1996)

o Affinement de la représentation en contraignant les arbres élémentaires

  • Affiner les savoirs initiaux....

  • Pour affiner les contraintes à construire

Des réseaux de hiérarchies évolutives

o Avant Phases de classement

Un mot -> un micro-réseau de prototypes (mots + arbres)

o Après Phases de classement

mise en place de liens entre les micro-réseaux de prototypes associés aux mots

Une démarche interprétative contrôlée et en spirale

o Une construction inductive

  • 1. Extraction d´arbres sur corpus
  • 2. Représentation des mots et des arbres
  • 3. Un premier classement

o Créer des pôles multiples de comportements partagés, les abstraire et les organiser

Le retour du linguiste

o Interpréter les regroupements : intervention manuelle pour qualifier les résultats

o Projeter les résultats intermédiaires, réitérer la représentation en affinant les objets à construire

o L'utilisateur constitue à lui tout seul une "entité" de méta-contrôle indispensable pour évaluer les résultats construits

  • C'est à lui d'interpréter et d'évaluer toutes les mises à jour réalisées
  • Il peut lui même être à l'origine de modifications sur les savoirs représentés

 

Du méta-regard à l'automodification et processus de contrôle

o Il est impératif de disposer de processus de traçage de toutes les opérations

  • Mise en place de processus de traçage qui présentent les différents états pertinents des traitements réalisés et des résultats construits à chaque étape

o Méta-Contrôle Humain