L6T051 - TAL pour Linguistes - Matias Calderon

Titre

Etape 1

Exercice 1

Consigne

Copiez le texte du programme suivant dans un fichier et exécutez-le :

Modifier ce programme et ajouter l'affichage du message : "Mon premier programme écrit avec PERL".

Résultat

1ère execution :

2ème exécution + modification :

Exercice 2

Consigne

Ecrire un programme qui crée trois variables $var1, $var2 et $var3 auxquelles vous affecterez les valeurs 33, 44 et 55 respectivement.

· affichez les valeurs de chaque variable en sortie.

· créez une variable $somme dans laquelle vous mettrez la somme des valeurs de chaque variable : $var1 + $ var2, $var1 + $var3... Affichez la valeur de $somme et des variables utilisées pour produire cette somme.

· créez une variable $produit dans laquelle vous mettrez le produit des valeurs de chaque variable : même remarque que ci-dessus

· Permutez les valeurs de $var1, $var2 et $var3. C'est à dire que $var1 vaudra ce que valait $var2, $var2 ce que valait $var3, et $var3 ce que valait $var1. Pour cela vous créerez une variable temporaire $tmp..

Résultat

Création de variables et Affichage

Somme de variable

Le produit de variables

Permutation de variables

Exercice 3

Consigne

A. Parcours d'une liste

Récupérer le programme suivant,

essayer de l'exécuter, si nécessaire corriger et compléter.

Résultat

B. Manipulations de listes

Récupérer le programme suivant,

Commenter les différentes instructions, et prévoir très précisément les affichages avant d'expérimenter

Résultat

Exercice 4

Consigne

1. Le texte du poème ci-dessus est contenu dans le fichier amants.txt du dossier CORPUS. Ecrire un programme qui ouvre le fichier amants.txt et qui écrit dans un deuxième fichier moteneau.txt les seules lignes qui contiennent la séquence de caractères "eau".

2. Vous réécrirez le programme pour numéroter toutes les lignes qui contiennent la même séquence

Résultat

1. Cliquez ici pour voir le résultat

2. Cliquez ici pour voir le résultat

Exercice 5

Consigne

A partir du fichier amants.txt , construire un programme qui produit en sortie le poème précédent dans lequel vous remplacerez la forme graphique "les" par "des".

Modifiez ce programme pour modifier les séquences "un", "deux"... par "1", "2"...

Résultat

Cliquez ici pour voir le fichier d'origine

1. Cliquez ici pour voir le resultat

2. Cliquez ici pour voir le resultat

Etape 2

Exercice 1

Consigne

Dans le corpus des bébés prématurés (p96.bal), vous extrairez le champ texte (balise <TXT>) pour toutes les fiches concernant le bébé 2.

Résultat

Cliquez ici pour voir le resultat

Exercice 2

Consigne

Construire un programme qui compte le nombre de mots contenus dans un fichier. Appliquez ce programme au poème de Baudelaire amants.txt et au fichier p96.bal

Résultat amants.txt

Résultats p96.bal

Exercice 3

Consigne

Ecrire un programme qui attend que l'utilisateur saisisse un rayon avant de calculer le périmètre du cercle.

Résultat

Exercice 4

Consigne

Ecrire un programme demandant la température extérieure, et affichant « trop chaud!» si elle est supérieure à 30°, «trop froid! » si elle est inférieure à 20°, «impeccable! » si elle est comprise entre 20 et 30 °.

Résultats

Etape 3

Exercice 1

Consigne

Le programme perl ci-dessous fournit sur la sortie standard l'ossature d'une page HTML : les balises de l'entête et celles du corps.

Modifiez-le de façon à ce qu'il crée, dans le corps de la page, une liste numérotée. Les éléments de cette liste seront les lignes lues sur l'entrée standard (on lira toutes les lignes jusqu'a l'arrivée de fin de fichier sur l'entrée standard, et pour chaque ligne on créera un nouvel item de la liste en sortie). Le programme utilisera la première ligne aussi comme le titre de la page HTML.

Appliquez le programme au fichier p96.fic

Résultat

Cliquez ici pour voir le resultat

Exercice 2

Consigne

En utilisant le programme perl qui fournit l'ossature d'une page HTML (voir ci-dessus), vous ferez en sorte qu'il lise deux fichiers (que vous ouvrirez à l'intérieur de votre programme). Vous créerez un tableau qui contiendra autant de lignes qu'il y a de lignes dans les fichiers lus. Chaque ligne du tableau contiendra deux cellules (colonnes) : dans la première cellule de la ligne n du tableau il y aura la ligne n du premier fichier, et dans la deuxième cellule la ligne n du deuxieme fichier. Vous modifierez le programme pour que le tableau contienne une colonne de plus qui sera le numéro de ligne. Vous appliquerez le programme aux versions en francais et en anglais ( desqueyroux.fr et desqueyroux.ang) de Therèse Desqueyroux (de Francois Mauriac) données dans le dossier CORPUS DE TRAVAIL pour obtenir le résultat présenté dans ce même dossier (desqueyrouxFR-ANG.html)

Résultats

Cliquez ici pour voir le fichier d'origine en anglais

Cliquez ici pour voir le fichier d'origine en français

Cliquez ici pour voir le résultat

Etape 4

Recherche de patrons syntaxiques dans le corpus.

· On utilisera ici la version étiquetée du corpus Prématurés 96 (p96.tag).

· On tentera de mettre au jour des structures syntaxiques récurrentes dans le corpus autour de formes pôles.

1. Vous choisirez cinq formes graphiques différentes. Vous construirez ensuite un programme perl qui prend en entrée le fichier catégorisé et un nombre donné. Ce nombre définira la longueur de la fenêtre de mots que vous souhaitez extraire autour de la forme pôle.

2. Vous appliquerez ce programme sur votre fichier catégorisé.

Tout d'abord ici le script utilisé

Résultat sur le mot "Contact"

Résultat sur le mot "Besoin"

Résultat sur le mot "Elle"

Résultat sur le mot "Mignon"

Résultat sur le mot "Beaucoup"

Etape 5

1. Vous choisirez cinq formes graphiques différentes. Vous construirez ensuite un programme perl qui prend en entrée un état du corpus et un mot donné. Le résultat produit par ce programme doit être une concordance de cette forme dans le texte lu.

2. Vous appliquerez ce programme sur les différents états du corpus

Pour voir le premier fichier utilisé, p96.bal

Pour voir le premier fichier utilisé, p96.fic

Pour voir le premier fichier utilisé, p96.tab

Pour voir le premier fichier utilisé, p96.tag

Résultats pour le mot "Contact" pour chaque état du corpus

Contact pour p96.bal

Contact pour p96.fic

Contact pour p96.tab

Contact pour p96.tag

Résultats pour le mot "Besoin" pour chaque état du corpus

Besoin pour p96.bal

Besoin pour p96.fic

Besoin pour p96.tab

Besoin pour p96.tag

Résultats pour le mot "Elle" pour chaque état du corpus

Elle pour p96.bal

Elle pour p96.fic

Elle pour p96.tab

Elle pour p96.tag

Résultats pour le mot "Mignon" pour chaque état du corpus

Mignon pour p96.bal

Mignon pour p96.fic

Mignon pour p96.tab

Mignon pour p96.tag

Résultats pour le mot "Beaucoup" pour chaque état du corpus

Beaucoup pour p96.bal

Beaucoup pour p96.fic

Beaucoup pour p96.tab

Beaucoup pour p96.tag