Introduction
au
Traitement Automatique du Langage
LZO15 Devoir
n°2
Question
1
Le
chatbot est un logiciel informatique permettant de
communiquer en temps réel avec un locuteur fictif. Il
s’avère être utile et
ludique mais dans un cadre restreint car il y a des limites
à ce système. En
effet, on ne peut pas discuter sur des sujets précis
étant donné qu’Elizia
n’est pas programmé pour cela.
Question
2
Avec
la recherche, un logiciel tel que celui-ci devrait
tout d’abord pouvoir répondre à toutes
sortes de sujet vastes comme
précis. Pour cela, il faudrait mettre à sa
disposition un dictionnaire ou
ensemble de données de manière à ce
qu’il puisse s’adapter à
n’importe quel
locuteur.
Le
second problème qu’il est urgent de
résoudre est
l’orthographe. La seule solution à laquelle je
pense, serait de réévaluer
entièrement le recueil de données afin
d’éliminer les fautes d’orthographe.
Enfin,
il serait également nécessaire
d’adapter ce
logiciel pour les internautes étrangers en
intégrant notamment l’anglais,
l’allemand, l’espagnol … sans oublier le
chinois qui est en fort progression
dans le monde actuel.
Question
3
Après
avoir amélioré le système, les
qualités d’Elizia
pourraient être en adéquation avec celles qui
permettraient à un système de
passer le test de Turing.
Malheureusement,
si Elizia était confronté au test de
Turing sans avoir était modifiée,
l’homme à l’aveugle discernerait
l’ordinateur
de l’autre être humain car les faiblesses sont
encore trop visibles.
Question
4
Les
critères que j’envisagerai pour un chatbot
seraient :
-la
syntaxe :
chercher à savoir si les phrases sont correctement
construites.
-
la
sémantique : voir si l’on comprend le
sens des réponses que le logiciel
informatique produit.
- la diversité
dans
le vocabulaire : afin qu’il y est peu de
répétitions.
Question
5
Mes questions
|
Les
réponses d’Elizia
|
L’évaluation
de ses
réponses
|
bonjour
! Commet allez-vous ?
|
Je vous souhaite la bienvenue à
cette session de thérapie !
|
TB
|
j'ai besoin de votre aide !
|
Êtes-vous
sûr (/e) que vos souhaits correspondent à vos
besoins ?
|
Nul
|
j'ai peur de l'anesthésie. Et je
voudrais que vous m'expliquiez ce que c'est.
|
Êtes-vous
sûr (/e) que vos souhaits correspondent à vos
besoins ?
|
Nul
|
qu'est-ce
qu'une anesthésie générale ?
|
Avez-vous
posé la question à une autre personne?
|
Nul
|
sinon
quel temps fera-t-il demain ?
|
Qui
a dit 'Il n'est rien de plus précieux que le temps, puisque
c'est le prix de l'éternité.' ?
|
Nul
|
le
soleil est-il bon pour le moral ?
|
Vous
avez le teint pâle, vous avez besoin d'un bon bol d'air.
|
Nul
|
merci
pour votre aide même si elle n'est pas très
fructueuse. A bientôt !
|
Parlons
plutôt de vous.
|
Nul
|
Après
avoir isolé les tours de paroles, on
s’aperçoit
qu’il n’y a aucune cohérence entre les
questions et les réponses. Si dans cet
exemple, il n’y a pas de fautes d’orthographe, on
remarque tout de même des
répétitions (cf. lignes 2 et 3 du tableau) alors
que les questions sont
différentes.
De
plus, on peut remarquer que le critère syntaxique est
rempli car aucune phrase n’est agrammaticale. Cependant, la
sémantique n’est
pas respectée puisqu’on n’observe aucun
lien de sens au sein de cet échange.
Question
6
Pour
éviter les répétitions, il faut
développer davantage
l’inventaire des données et des
capacités du logiciel afin qu’il puisse
utiliser des synonymes …
Cette
multiplication de mots permettra donc de fluidifier
et d’enrichir les réponses d’Elizia. Il
y aura ainsi un lien et un fil
directeur au sein de la conversation qui répondra au
critère sémantique.
Question
7
En
effet, il existe un déclencheur pour la
répétition dans
l’onglet supervision du chatbot Elizia.
Nous
pouvons nous même le modifier en tant que personne
« étrangère »
à la création de ce logiciel informatique.
Question
8
Le
rôle de Traitement Automatique du Langage est de traiter
toutes formes de langages de façon technique et informatique.Notamment
avec
l’utilisation de logiciels informatisés mais
également de disciplines comme la
linguistique…
Le
mot clé est un terme général ou
générique regroupant
plusieurs autres mots ayant un sens commun ou une racine commune.
Lorsque deux
mots clés sont valables pour le même cas,
l’utilisation de l’un ou de l’autre
est tolérée mais à condition que le
sens soit commun à l’ensemble de cette
classification.
Question
9
La
syntaxe est une science qui étudie les constituants
permettant de former une phrase. La nature et la fonction de ces
éléments sont
essentielles à la compréhension globale
d’une phrase ou d’un énoncé.
L’analyse
morphosyntaxique mêle donc le mot et la syntaxe et elle
utilisée pour l’étude
d’un corpus. La formation d’un mot et son sens
permettent une meilleure
compréhension lorsqu’ils sont respectés.
Question
10
On
peut détecter le sens clé d’une
question lorsqu’ il y a
tout d’abord un verbe à l’infinitif
comme dans l’exemple suivant :
- Pourriez-vous
m’aider s’il vous plaît ?
Le
verbe « aider » donne tout son
sens à cette
question. Il facilite donc la compréhension du sens global.
En
revanche, il est plus difficile de le trouver dans un
exemple comme celui-ci : Tu rentres tard ce soir ?
Mais
c’est un cas plus rare.
Enfin
les adverbes interrogatifs sont porteurs de sens et
permettent aux interlocuteurs de comprendre immédiatement la
question :
-
Où
vas-tu ?
-
Comment
allez-vous ?
-
Quand
est-ce que vous vous êtes rencontrés ?
- …
Question
11
On
peut cerner une bonne discussion lorsque la syntaxe et la
morphologie sont respectées. Mais également
lorsque la ponctuation a été
correctement utilisée car elle facilita
l’accès au sens. Enfin, une sémantique
riche
permet également d’éviter les
répétitions et d’avoir un dialogue plus
fluide.
Question
12
Dans
l’interface Elizia, on peut afficher :
-
les
cas reconnus dans l’historique en utilisant
« ::: » afin d’obtenir
des étiquettes.
- Une
liste en ordre alphabétique de tous les mots
qu’Elizia teste contre les mots
clés, en utilisant
« all : ».
Voici
un exemple :
-
Les
lemmes en utilisant
« lemmas : ».
- Les
mots, en utilisant
« words : ».
Question
13
On
peut servir les fonctionnalités mentionnées dans
la
question précédente pour étudier les
capacités propre à cette interface en termes
de sémantique et taxinomie (classification de mots partant
du général au
particulier.) Elles permettent également
d’apprécier l’éventail de
mots
qu’utilise Elizia.
Question
14
Après
avoir été dans l’onglet supervision de
l’interface,
je vais modifier les cas normaux afin de voir si il y a des changements
ou non.
Le
premier cas reconnu modifier, est celui qui s’intitule
« mon identité ».
J’ai décoché la case
« ce cas peut être
repris ».
Conséquences :
Elizia ne répond plus de manière
ordonnée et répétitive ; mais
plutôt de façon aléatoire.
Ensuite,
je me suis concentrée sur la rubrique
« insultes », en modifiant la
supervision.
D’après
l’image ci-dessus, la conversation devrait donc
s’arrêter immédiatement après
qu’une insulte ait été
formulée.
Malheureusement,
nous pouvons nous apercevoir que la
conversation ne s’interrompt pas. Cet interface n’a
donc pas aboutit à une
parfaite efficacité.
Question
15
Un
des cas d’étude possible que je proposerai serait
celui
de l’orthographe. En effet, lorsque l’on
étudie la supervision d’Elizia, on
remarque que de nombreux mots on été
accepté avec des fautes d’orthographe. Ce
qui explique que nous rencontrons, dans certains échanges,
des mots mal
orthographiés.
L’autre
cas d’étude qu’il serait
intéressant de traiter
est celui de l’inventaire, des possibilités de
réponses d’Elizia, trop
restreints à mon goût. Pour cela, il faudrait
enrichir les réponses d’Elizia
afin d’obtenir des conversations plus passionnantes et plus
précises sur
certains sujets.