Introduction
au
Traitement Automatique du Langage
LZO15 Devoir
maison
Exercice
1
Pour
ces deux phrases, on peut afficher une liste en ordre
alphabétique de tous les
mots clés qu’Elizia teste contre les mots
clés en débutant l’échange
par
« all : ».
Voici
les deux illustrations
correspondant aux phrases a et b :
Pour
afficher les lemmes, il suffit
de faire précéder sa phrase par
« lemmas : ».
Pour
expliquer ce phénomène, deux
captures d’écran vont suivre :
Enfin pour
faire apparaître les mots
d’une phrase ou d’un énoncé,
il vous suffit de taper
« words : »
avant le début de votre demande.
Les illustrations
suivantes
expliqueront cette manipulation :
Exercice
2
Afin
de tenir la conversation plus
longtemps autour de ce thème avec le chatbot Elizia,
j’ai choisis les trois cas
suivant :
- Vendredi
11 Mars, le Japon a été victime d’un
tremblement de terre de magnitude 8 sur
l’échelle de Richter.
- Un
terrible tsunami a envahi la côte est du Japon causant
d’importants dégâts
humains et matériels. Des villes entières ont
été détruites et l’on compte
à ce
jour 6000 morts et plus de 10000 disparus. Le bilan pourrait continuer
de
s’alourdir au fil des jours.
- Suite
au violent séisme qui a ravagé le Japon il y a
une semaine, on se prépare au
pire et notamment à l’explosion d’une
centrale nucléaire.
Après
avoir créé trois cas autour de
ce thème, on pourrait imaginer trois questions
comme :
- Peut-on
craindre une explosion nucléaire au Japon ?
- De
quoi le Japon a-t-il été victime la semaine
dernière ?
- Quel
est l’état actuel du Japon ?
En
principe, Elizia devrait être
capable de répondre à ces différentes
questions.
Voici
quelques exemples :
- Aujourd’hui,
on peut s’attendre à une explosion
nucléaire en provenance de Fukushima.
- Le
Japon a été victime d’un
séisme puis d’un tsunami il y a une semaine jour
pour
jour.
- Le
Japon se trouve dans une situation critique et les secouristes
découvrent
chaque jour de plus en plus de corps.
- Le
Japon fait appel à l’aide internationale suite aux
catastrophes naturelles
qu’il a subies.
-
La
côte est du Japon a été
touchée par un séisme de grande ampleur. Un des
plus
fort de tous les temps dans l’ensemble du monde.
J’ai
donc posé trois questions à
Elizia sur ce sujet et voilà les réponses
qu’elle m’a données :
Une fois que
l’on a observé les
réponses que le logiciel informatique a données,
on se rend compte qu’il n’y a
aucune cohérence, aucun lien entre la question et la
réponse.
En effet,
dans le premier
cas les
mots clé
« séisme » et
« Japon » devaient être
à
l’origine
du déclenchement pour la réponse
d’Elizia. Or le
cas traité par le chatbot est
le « moi. »
Pour le
second exemple, les mots clé
« Japon » et
« tsunami » étaient
censés déclencher le cas.
Mais le chatbot parle d’
« héroïsme »
et de
« folie. »
Enfin, la
dernière question avait
pour mots clés
« explosion » et
« nucléaire » et
Elizia
évoque la souffrance dans sa réponse.
Bonus
Question
1
Selon
moi, la base de connaissance
spécifique que je viens d’écrire ne
répond pas au problème d’Elizia comme
nous
avons pu le constater à la fin de l’exercice 2.
En
effet, le chatbot ne peut
répondre aux questions qui lui ont été
posées autour de ce sujet.
Question
2
La
base de connaissance spécifique
ne résous pas le problème d’Elizia,
selon moi, car il n’y a pas de pertinence
dans l’échange.
En
effet, d’après Carl Rogers et sa
thèse sur la non directivité,
l’échange avec autrui doit être sans
jugement,
authentique et avoir une certaine régularité.
Or,
lorsque l’on dialogue avec Elizia,
les réponses ne sont pas exactes, précises ni
régulières.
Une
des manières de résoudre ce
problème serait de modifier,
d’améliorer la sémantique et la
taxinomie de ce
chatbot.
Comment ?
Tout
d’abord, il faudrait développer
l’éventail de signes linguistiques
d’Elizia en traitant des sujets diverses
d’actualités mais également de termes
médicaux-scientifiques … afin
d’enrichir
et de faire perdurer l’interaction.
De plus, il
serait judicieux de
classer ces mots clé par ordre alphabétique de
façon à faciliter le dialogue.
Mais attention à bien accepter les lemmes correctement
orthographiés.
Enfin, le
fait d’ajouter un certain
nombre de termes à Elizia permettra
d’éviter les répétitions.
En
conclusion, il faudrait donc
toucher au cœur de ce logiciel informatique en travaillant la
base de données
qui est à l’origine de celui-ci.