Accueil | Elizia | Problèmes | Améliorations | PC PATR |
Introduction à PC PATR
PC PATR est un parseur,
c'est-à-dire un logiciel qui est capable de découper une phrase en
fonction des différentes unités qui la composent. Ce logiciel a été devéloppé dans le cadre du Summer Institut of Linguistics
de Dallas, TX aux Etats-Unis. Nous travaillons sur PC PATR au
moyen d'un interface comme vous voyez dans l'image ci-dessous:
Une fois l'interface ouvert, il
faut charger un lexique et une grammaire prédéfinis, qui contiennent
des données à partir desquelles le programme construit ses
arbres. La grammaire contient des règles sur la formation d'une
phrase en syntagmes, ainsi que les règles qui définissent le contenu
des syntagmes. Le lexique contient une liste de mots et des
informations syntaxiques sur chaque mot, ce qui permet au programme de
discerner la structure de chaque phrase. Pour charger le lexique il
suffit de taper l_l_lexique et pour la grammaire, l_g_grammaire (ici les _ dénotent les espaces). Une fois ces documents chargés, il faut taper la commande parse et puis entrer une phrase. Par exemple, si vous entrez une phrase comme "Le chat craint le loup", vous aurez le résultat suivant:
Il est aussi possible d'augmenter
les bases de données, le lexique et la grammaire, avec un éditeur tel
que Notepad ++. Ainsi le parseur serait capable d'analyser plus
des phrases, avec une structure plus compliquée ou avec des mots qui ne
se trouvaient pas dans le lexique avant. Le parseur peut aussi
reconnaitre des phrases agrammaticales. Dans ce cas, comme si
vous entrez, par exemple, une phrase comme "chat le craint loup", vous
aurez la réponse ****cannot parse this sentence****, ce qui veut dire
qu'il est impossible d'analyser cette phrase, elle ne correspond pas
aux règles définies dans la grammaire.
Pour voir un peu ce que nous avons essayé de faire avec ce parseur, cliquez ici...