ANALYSE SYNTAXIQUE AVEC PC-PATR
Objectif : Nous allons tenter de reconstituer quelques règles syntaxiques simples du français, l'analyseur PC patr n'étant là que pour vérifier la bonne écriture des règles par rapport aux règles du français.
Petit préambule :
La langue consiste en l'articulation entre le lexique et un certain nombre de règles grammaticales.
Soit la phrase "le chien craint le chat". Elle peut se décomposer sur le plan syntagmatique comme suit :
le : déterminant (noté det)
chien : nom (noté N)
craint : verbe (noté V)
le : dét
chat : N
Si cette phrase est bien formée, c'est aussi parce qu'elle répond à des règles morpho-syntaxiques : syntaxique notamment parce que le déterminant précède le nom, morphologique parce que le nom "chien" régit l'accord de son déterminant en nombre et en genre, ainsi que celui du verbe "craindre" dont il est sujet.
Une fois ces règles dégagées, il faut les formaliser. On peut utiliser deux fichiers distincts : un pour le lexique et un pour la grammaire.
Etape n°1 : créer ses propres ressources
Il s'agit d'alimenter en nouvelles unités lexicales le fichier consacré au lexique et de vérifier dans le fichier consacré à la grammaire (cliquez ici pour visionner) que les règles d'ordonnancement syntagmatique sont bien écrites.
Vérifier que vous reconnaissez par exemple "le chien craint le chat" et "Le chien attrape le loup":
Vérifier que le parseur reconnaît comme agrammaticales des phrases telles que "loup le attrape chien le" :
Etape n°2 : utilisation et introduction de contraintes d'accord
Les contraintes d'accord sont déja écrites dans la grammaire sous forme de règles (aperçu) mais les unités lexicales telles qu'elles sont enregistrées dans le fichier lexique ne présentent pas encore de variation morpholopgique.
Ajoutez dans votre lexique des noms et des articles au féminin et au pluriel (par exemple belette, souris...), ainsi que des verbes à la troisième personne du pluriel. Tout en dupliquant les entrées lexicales existantes dans votre fichier lexique.
Complétez votre description lexicale en introduisant, pour chacune des entrées existantes, des traits spécifiant le genre et le nombre (suivre le modèle proposé).
-> On enrichie la base lexical de nouvelles entrées pour rendre compte des variations morphologiques de certains lexèmes. Deux types de variations existent, qu'il faut spécifier dans la description de chaque entrée :
- la variation en genre pour les déterminants ainsi que pour certains noms comme "chien". Elle est exprimée par le trait ("feature" en anglais noté "f") masculin/féminin :
- la variation en nombre pour les noms, les déterminants et les verbes. Elle est exprimée par le trait singulier/pluriel :
On applique cette opération pour les mots présents dans le fichier et ceux que l'on rajoute :
Ensuite, on donne aux traits "genre" et "nombre" figurant dans les deux fichiers un attribut de niveau supérieur appelé "tete", et ce, pour unifier les phénomènes d'accord liés aux trois catégories de mots pouvant former un syntagme nominal :
RULE GN = DET (ADJ) N (GNP) <N tete gnre> = <DET tete gnre> <N tete gnre> = <ADJ tete gnre> <GN tete gnre> = <N tete gnre> <N tete nbre> = <DET tete nbre> <N tete nbre> = <ADJ tete nbre> <GN tete nbre> = <N tete nbre> <N tete gnre> = <DET tete gnre> <N tete nbre> = <DET tete nbre> <GN tete> = <N tete> |
Tout ceci nous permet de refuser comme non grammaticales des syntagmes comme :
ou encore :
Etape n°3 : structure récursive dans les groupes nominaux
Ajouter des adjectifs de couleur dans votre lexique :
Différencier deux niveaux de groupes nominaux. Le premier niveau correspond à des noms, éventuellement suivi d'un adjectif (avec une contrainte d'accord); le second niveau correspond à des GN1 nantis d'un article :
RULE GN = GN1 / GN2 <GN1 tete nbre> = <GN2 tete nbre> <GN1 tete gnre> = <GN2 tete gnre> RULE GN1 = N ADJ <ADJ tete gnre> = <N tete genre> <ADJ tete nbre> = <N tete nbre> RULE GN2 = DET GN1 <DET tete gnre> = <GN1 tete genre> <DET tete nbre> = <GN1 tete nbre> |
Vérifier que votre grammaire reconnaît correctement des syntagmes tels que "le chat noir" et "la souris verte" : lien vers les arbres
Ajouter dans votre lexique les prépositions "à" et "de". Ajouter également quelques noms de relations de parentés (fils, frère, soeur...) :
Compléter la description des GN1 en ajoutant une règle décrivant la formation d'un GN1 à partir d'un nom et d'un syntagme prépositionnel (noté GNP) :
RULE GN1 = N GNP |
Définir les syntagmes prépositionnels comme étant simplement composés d'une préposition et d'un GN2 :
RULE GNP = PREP GN |
Vérifier que vous savez maintenant reconnaître tout une gamme de syntagmes nominaux complexes tels que "les fils de la cousine de la belette noire" :