PERL en pratique - TD Master

par Anna ANDRYCH & Marie SADOU


Exercice n° 1 : Machine à Ecrire Perl

On dispose d'une Machine à Ecrire Perl qui fonctionne de façon suivante : chaque fois qu'on tape ENTER une ligne est acceptée et imprimée sur l’écran. La variable spéciale $_ contient chaque ligne d’entrée. La combinaison des touches suivante CTRL+C sert à arrêter notre Machine.

A télécharger : exercice n°1

Objectif : Modifier le programme de manière suivante : au lieu d’afficher la lettre ligne par ligne on veut afficher toute la lettre lorsqu’on a fini. On indique à notre machine qu’on a fini en tapant STOP (suivi par ENTER).

Résultat :

A télécharger : exercice n°1b


Voici notre script en action :

haut de la page



Exercice n° 2 : Compter des mots

Objectif : Se servir de split pour calculer et afficher le nombre de mots dans la lettre du programme précédent.

Résultat :

A télécharger : exercice n°2


Voici notre script en action :

haut de la page



Exercice n° 3 : Comptage des lignes

Objectif : Afficher la lettre entière du programme précédent avec un compteur de lignes au début de la ligne.

Résultat :

A télécharger : exercice n°3


Voici notre script en action :

haut de la page



Exercice n° 4a : Manipulation, Constitution de dictionnaires et de nouveaux corpus

Les exercices suivants ont pour but de manipuler des données afin de construire des lexiques avec des mots segméntés et extraits de notre corpus de travail p96.bal.
Objectif : Construire un programme qui lit un état quelconque du corpus p.96.bal et qui compte le nombre de lignes du fichier lu.

Résultat :

A télécharger : exercice n°4a


Voici notre script en action :

haut de la page



Exercice n° 4b : Manipulation, Constitution de dictionnaires et de nouveaux corpus

Objectif : Construire un programme qui lit un état quelconque du corpus et compte le nombre de mots du fichier lu.
Astuce : pour obtenir le nombre de mots d'une phrase, il suffit de compter le nombre d'espaces et d'ajouter 1.

Résultat :

A télécharger : exercice n°4b


Voici notre script en action :

haut de la page



Exercice n° 4c : Construction de dictionnaires

Objectif : Construire un (ou plusieurs) programme(s) qui doit lire les corpus bébés et infirmières et construire pour chacun de ces corpus un dictionnaire contenant toutes les formes graphiques de ces corpus.

Résultat :

A télécharger : exercice n°4c et le dictionnaire construit : dico.txt

haut de la page



Exercice n° 5 : Constitution des corpus

Cette partie vise à la construction de nouveaux états du corpus à partir de données textuelles diverses. Il s'agira en particulier de voir comment a été construit la version HTML du corpus : i.e. comment passer des fichiers au format TXT vers des fichiers au format HTML.
Objectif : Construire un programme qui prend en entrée le fichier p96.bal et produit une version HTML de ce fichier. Les noms des champs devront apparaître dans la version HTML produite.

Résultat :

A télécharger : exercice n°5 et le fichier HTML en sortie : sortiep96.html

haut de la page



Exercice n° 6a : Fréquences des mots

Objectif : Afficher une liste des mots d'un état quelconque du corpus Prématurés en ordre alphabétique. Combien de types de mots différents il y a dans le texte ?

Résultat :

A télécharger : exercice n°6a


Voici notre script en action :



Et la liste en ordre alphabétique:

A télécharger : liste alphabétique

haut de la page



Exercice n° 6b : Fréquences des mots

Objectif : Afficher une liste des types de mots en ordre de fréquence descendant. Quelle est la fréquence la plus haute ?

Résultat :

A télécharger : exercice n°6b


Voici notre script en action :



Et la liste des mots classés par fréquences descendantes :

A télécharger : liste par fréquences descendantes

haut de la page



Exercice n° 6c : Fréquences des mots

Objectif : Combien de mots ont une fréquence de 1? Combien de mots ont une fréquence inférieure à 10?

Résultat :

A télécharger : exercice n°6c


Voici notre script en action :

haut de la page