Nous allons nous intéresser à la programmation en Python.
Tout d’abord, nous avons travaillé sous python, sous Idle plus précisement.
L’espace de travail se présente de la manière suivante :
Ce logiciel nous permet de créer des scripts.
Nous avons donc créé un script qui permet de deviner la langue d’un fichier inconnu.
Pour cela, des fichiers textes de différentes langues ont été créés au préalable afin de constituer une base de données.
* Un fichier contenant du texte français :
* Un autre contenant du texte anglais :
* enfin un dernier contenant du texte en allemand :
-> Il faut également un texte inconnu
Ceci est une représentation minime du nombre de langues qui existent. Plus on prendra un nombre de langues élevé comme modèle, plus le programme sera apte à deviner un large éventail de langues différentes en fonction du texte inconnu .
Voici le script créé pour deviner la langue d’un fichier inconnu.
Les commentaires écrits en rouge dans le script et qui ne sont pas pris en compte par python (car précédés d’un #) permettent de savoir à quoi correspondent les commandes.
Le script ci-dessus ouvre les fichiers de langue que nous avons créé précédemment, ainsi que le fichier inconnu.
Il analyse les mots du texte inconnu puis les compare avec ceux des langues qui servent de bases de données, en fonction du nombre de mots similaires, le script permettra d’identifier la langue correspondant au texte inconnu.