PARTIE ELIZIA
DEVOIR N°7CORDIAL : "Cordial est un logiciel de correction grammaticale et d'aide à la rédaction pour la langue française pour Microsoft Windows." 1°) Choix d'un texte :
- Dans ce texte, j'ai inséré quelques erreurs orthographiques, mais le logiciel ne les a pas trouvé, il n'a pas fait de remarque. - Ce logiciel (ayant déjà quelques années) ne connaît pas certains mots, ou leur nouvelle fonction ou leur sens.
Pourquoi peut-on parler "vers un schéma général" ?
"La structure d'une phrase n'est bien entendu pas un universel linguistique, et la possibilité de traduction se situe à un niveau bien plus profond que l'ordre des mots." En effet la traduction d'un texte n'est pas seulement l'ordre des mots, c'est à dire transcrire un texte en mettant les mots les uns à la suite des autres. Il faut passer par tout un processus. Le logiciel traite d'abord la syntaxe de la phrase (en étiquettant les phrases et en faisant un arbre syntaxique) puis il fait une analyse sémantique pour donner un sens à la phrase (après avoir analyser ses constituants), enfin la machine donne la traduction de la phrase demandée. Tous les logiciels de traduction ont le même "schéma général" pour traduire un texte. La machine doit avoir des connaissances sur les langues à traduire, mais aussi sur des connaissances générales, et sur les processus syntaxiques. Dans les deux exemples, Google Translate et Systran ont tous les deux donnés des traductions de mon texte en français vers l'anglais. On remarque que certains mots n'ont pas été traduit de la même façon. Mais dans les deux cas, ils ont analysé le texte de départ et on fait une analyse syntaxique, lui ont donné un sens et ils ont traduit le texte en fonction de ce sens.- Autres exemples de Thésaurus
Qu'est ce qu'un thésaurus ?
"Un thésaurus est une liste organisée de termes représentant les concepts d'un domaine de la connaissance. C'est un langage contrôlé utilisé pour l'indexation et la recherche de ressources documentaires dans des applications informatiques spécialisées. Les thésaurus sont donc une catégorie de langages documentaires parmi d'autres." (Source Wikipédia)Comment fonctionne-t-il ?
Le logiciel demande un "mot-clef" par exemple "linguistique", il va nous donner une liste "prématurée" qui permet de recher dans quel contexte on recherche le mot (en politique, sciences, en syntaxe...). Après avoir choisi le contexte, le logiciel nous donne "environnement sémantique direct" du mot-clef. Il apparait alors un schéma avec au centre le mot-clef choisi dans son contexte, en haut "le terme générique", en bas le ou les "termes spécifiques", à droite les "termes qui peuvent lui être associés" et enfin à gauche "employé pour". Donc ce logiciel permet de donner une liste de mots en rapport avec le mot clef rechercher, et en donner toutes les ressources documentaires."Une petite introduction au Traitement Automatique des Langues Naturelles"
Télécharger le compte rendu