index  sommaire partie1 partie2 devoir2 

 devoir3  devoir4  partie3












  
     Partie 3: Devoirs faits au cours de l'initiation au TAL 


 
Introduction au Traitement Automatique du Langage

 

LZO15 Devoir maison


Exercice 1

Pour ces deux phrases, on peut afficher une liste en ordre alphabétique de tous les mots clés qu’Elizia teste contre les mots clés en débutant l’échange par « all : ».
Voici les deux illustrations correspondant aux phrases a et b :

 

 

Pour afficher les lemmes, il suffit de faire précéder sa phrase par « lemmas : ».
Pour expliquer ce phénomène, deux captures d’écran vont suivre :


 




 

 

 Enfin pour faire apparaître les mots d’une phrase ou d’un énoncé, il vous suffit de taper « words : » avant le début de votre demande.
Les illustrations suivantes expliqueront cette manipulation :

  


 




 

Exercice 2

Afin de tenir la conversation plus longtemps autour de ce thème avec le chatbot Elizia, j’ai choisis les trois cas suivant :
-          Vendredi 11 Mars, le Japon a été victime d’un tremblement de terre de magnitude 8 sur l’échelle de Richter.
-          Un terrible tsunami a envahi la côte est du Japon causant d’importants dégâts humains et matériels. Des villes entières ont été détruites et l’on compte à ce jour 6000 morts et plus de 10000 disparus. Le bilan pourrait continuer de s’alourdir au fil des jours.
-          
Suite au violent séisme qui a ravagé le Japon il y a une semaine, on se prépare au pire et notamment à l’explosion d’une centrale nucléaire.

Après avoir créé trois cas autour de ce thème, on pourrait imaginer trois questions comme :

-          Peut-on craindre une explosion nucléaire au Japon ?
-          De quoi le Japon a-t-il été victime la semaine dernière ?
-          Quel est l’état actuel du Japon ?
En principe, Elizia devrait être capable de répondre à ces différentes questions.

Voici quelques exemples :
-          Aujourd’hui, on peut s’attendre à une explosion nucléaire en provenance de Fukushima.
-          Le Japon a été victime d’un séisme puis d’un tsunami il y a une semaine jour pour jour.
-          Le Japon se trouve dans une situation critique et les secouristes découvrent chaque jour de plus en plus de corps.
-          Le Japon fait appel à l’aide internationale suite aux catastrophes naturelles qu’il a subies.
-          La côte est du Japon a été touchée par un séisme de grande ampleur. Un des plus fort de tous les temps dans l’ensemble du monde.
J’ai donc posé trois questions à Elizia sur ce sujet et voilà les réponses qu’elle m’a données :

 

 

Une fois que l’on a observé les réponses que le logiciel informatique a données, on se rend compte qu’il n’y a aucune cohérence, aucun lien entre la question et la réponse.
En effet, dans le premier cas les mots clé « séisme » et « Japon » devaient être à l’origine du déclenchement pour la réponse d’Elizia. Or le cas traité par le chatbot est le « moi. »
Pour le second exemple, les mots clé « Japon » et « tsunami » étaient censés déclencher le cas. Mais le chatbot parle d’  « héroïsme » et de « folie. »
Enfin, la dernière question avait pour mots clés « explosion » et « nucléaire » et Elizia évoque la souffrance dans sa réponse.

 

 Bonus

Question 1
Selon moi, la base de connaissance spécifique que je viens d’écrire ne répond pas au problème d’Elizia comme nous avons pu le constater à la fin de l’exercice 2.
En effet, le chatbot ne peut répondre aux questions qui lui ont été posées autour de ce sujet.

Question 2
La base de connaissance spécifique ne résous pas le problème d’Elizia, selon moi, car il n’y a pas de pertinence dans l’échange.
En effet, d’après Carl Rogers et sa thèse sur la non directivité, l’échange avec autrui doit être sans jugement, authentique et avoir une certaine régularité.
Or, lorsque l’on dialogue avec Elizia, les réponses ne sont pas exactes, précises ni régulières.
Une des manières de résoudre ce problème serait de modifier, d’améliorer la sémantique et la taxinomie de ce chatbot.

Comment ?
Tout d’abord, il faudrait développer l’éventail de signes linguistiques d’Elizia en traitant des sujets diverses d’actualités mais également de termes médicaux-scientifiques … afin d’enrichir et de faire perdurer l’interaction.
De plus, il serait judicieux de classer ces mots clé par ordre alphabétique de façon à faciliter le dialogue. Mais attention à bien accepter les lemmes correctement orthographiés.
Enfin, le fait d’ajouter un certain nombre de termes à Elizia permettra d’éviter les répétitions.
En conclusion, il faudrait donc toucher au cœur de ce logiciel informatique en travaillant la base de données qui est à l’origine de celui-ci.