Acquisition de savoirs en corpus
- Extraction
- Lexter
- Zellig
- Du corpus aux arbres minimaux : abstract
- Du corpus jaillit un réseau de prototypes
- Définitions
- Esquisse d'une démarche de représentation
- Que fait la PàP ?
Extraction des fonctionnements lexicaux
o
Point de départ : le corpus MENELASo
Des outils d´extractiono
A partir d'arbres d'analyseo
Travaux récents en acquisition automatique de classes de motsLEXTER (Bourigault 93)
o
Outil d'acquisition terminologiqueo
En entrée : textes techniques arbitrairement longso
Recherche de groupes terminologiques maximauxo
Structurationo
Une séquence nominale = une Tête (T) + une Expansion (E) (récursivement)[T [T stenose] [E severe]][E de le [T tronc][E commun]][E gauche]
o
Approche endogène(1)
[angine de poitrine] instable(2)
angine de [poitrine instable]angine de poitrine
existepoitrine instable
n'existe pas
ZELLIG (Habert & al. 95)
o
Buto
Simplification d'arbres d'analyse=> Normalisation en arbre binaire Tête/(Modifieur ou Argument)
- (2) Le programme Cyclade (Habert & Nazarenko 96) est ensuite chargé de déterminer les arbres élémentaires via un filtrage de quasi-arbres (Habert & Folch 96)
- La déconstruction récursive met à jour des arbres élémentaires qui ne sont pas forcément directement présents dans l'arbre de départ
- Les arbres élémentaires mis au jour sont les suivants :
"Les dépendances élémentaires ainsi définies n'ont pas forcément de réalisation effective dans le corpus mais ils correspondent à des relations de dépendance vérifiées dans les arbres d'analyse, si l'on passe par une représentation logique de ces arbres et de ces dépendances élémentaires" (Habert & al. 1996)
Du corpus aux arbres minimaux
o
Extrait du corpusPatient âgé de 70 ans, diabétique, qui a présenté il y a un an une douleur thoracique nocturne probablement en rapport avec un infarctus antéro-septal. Il est toujours symptomatique sous la forme d´un angor d´effort qu´il a lui-même négligé, avec semble-t-il plusieurs épisodes de préchordialgies de repos. La coronographie met en évidence des lésions bitronculaires. L´occlusion de l´IVA est responsable d´une hypokinésie antérieure. Une sténose serrée, diagonale et circonflexe est responsable de l´angor d´effort.
o Arbre de Lexter o Après transformation dans ZelligDu corpus jaillit un réseau de prototypes
o
On dispose en amont d'arbres associés à des motsLEXTER => FRT => Arbres standardisés
=> CYCLADE => Arbres minimaux
o
Savoirs éclatés, peu de généralisationo
Ces savoirs ne sont pas figés : ils pourront évoluerDéfinitions préliminaires
o
On appelle arbre minimal ou élémentaire un arbre associé à une entrée lexicale traduisant une relation binaire de dépendance entre mots pleinso
On appelle arbre d'analyse un arbre associé à un arbre élémentaire : cet arbre d'analyse est obtenu par des opérations effectuées à partir de l'arbre élémentaire (adjonction, substitution...)o
On appelle prototype de mot l'objet informatique défini pour représenter un moto
On appelle prototype d'arbre élémentaire l'objet informatique défini pour représenter un arbre élémentaireo
On appelle prototype d'arbre d'analyse l'objet informatique défini pour représenter un arbre d'analyseEsquisse d'une démarche de représentation
o
CYCLADE révèle des proximités (comportementales) entre formeso
Utilisation des savoirs particuliers à un mot pour représenter une catégorieo
Représentation d'unités semblables par copie et ajustementso
Représentation des comportements lexicauxo
Les prototypes d'arbres déjà construits pour stenose et partagés par lesion seront associés au prototype représentant lesiono
Partage des comportements communs- Les mots stenose et lesion partagent des arbres élémentaires
- On construit un pôle de savoir partagé
Que fait la PàP ?
o
Représentation des connaissances peu hiérarchiséeso
Représentation d'un domaine en utilisant un élément particulier du domaineo
Représentation d'autres éléments par clonage et ajustementso
Partage local d'informations via la délégation : mise en place d'héritages locaux de comportements partagés