lexico3integre2html.pl
#!/usr/bin/perl use locale; #caracteres accentues #On lance comme cela: perl lexico3tegrei2html.pl <fichier> #On obtient: fichier.html print "Bienvenu(e) au programme qui permet \n d'afficher les fichiers TXT balisés par Lexico3 en HTML.\n"; print "Avant de commencer, changez ce programme en proposant la ou les balises Lexico3 qui caractérisent votre texte.\n"; print "Nom du fichier de travail, de preference un .txt au format UNIX: \n"; my $file="$ARGV[0]"; print $file; open(FILEIN, $file); open(FILEOUT, ">$file.html"); my $DUMPFULL=""; while(my $recup=<FILEIN>) { #1. transcodage ####Les métacaractères#### $recup=~s/\>/>/g; $recup=~s/\</</g; $recup=~s/\"/"/g; ####Les balises Lexico3#### if (($recup=~/langue=fr/g)||($recup=~/langue=br/g)) { $recup=~s/$recup/<font color="forestgreen">$recup<\/font>/g; };#Colorie toutes les balises en vert ####Les Accents#### $recup=~s/à/à/g; $recup=~s/á/á/g; $recup=~s/â/â/g; $recup=~s/ã/ã/g; $recup=~s/ä/ä/g; $recup=~s/å/å/g; $recup=~s/æ/æ/g; $recup=~s/è/è/g; $recup=~s/é/é/g; $recup=~s/ê/ê/g; $recup=~s/ë/ë/g; $recup=~s/è/è/g; $recup=~s/é/é/g; $recup=~s/ê/ê/g; $recup=~s/ë/ë/g; $recup=~s/ì/ì/g; $recup=~s/í/í/g; $recup=~s/î/î/g; $recup=~s/ï/ï/g; $recup=~s/ò/ò/g; $recup=~s/ó/ó/g; $recup=~s/ô/ô/g; $recup=~s/õ/õ/g; $recup=~s/ö/ö/g; $recup=~s/ù/ù/g; $recup=~s/ú/ú/g; $recup=~s/û/û/g; $recup=~s/ü/ü/g; $recup=~s/ç/ç/g; ####Les fichiers de type texte#### ##Les paragraphes et les line breaks## $recup=~s/(\s)*\n/\n/g; #supprime les espaces avant le retour à la ligne $recup=~s/^\n/<p>\n/g; #met des paragraphes dans tous les sauts de ligne if ($recup=~/[^<p>]\n/g) { $recup=~s/\n/<\/br>\n/g; };# met des br en fin de ligne lorsque la balise <p> n'est pas là #2. Memorisation dans DUMPFULL $DUMPFULL.=$recup; };#3. En-tete print FILEOUT "<html>\n <head>\n <title>Le choix des phrases en contexte dans des corpus comparables<\/title>\n <meta http-equiv=\"content-type\" content=\"text\/html; charset=windows-1250\">\n <\/head>\n <body bgcolor=\"#DEF7D8\" text=\"#DE6B3F\" link=\"#034B16\" alink=\"#C059E2\" vlink=\"#431C4F\">\n <blockquote>\n \n <h2><font color=\"\#390917\">",$file,"<\/font><\/h2>\n"; #4. Remplacement des entites print FILEOUT $DUMPFULL; # Pied de page print FILEOUT "<p><a href=\"\.\./\.\./TABLEAUX/lexique-portugais-francais.html\"><img src=\"\.\./\.\./IMAGES\/retour\.gif\"><\/a>\n<\/blockquote>\n<\/body>\n<\/html>\n"; print "\nLe fichier se nomme $file.html"; print "\nOn renomme les fichiers...en html"; system "#!/bin/bash cd ../LEXICO3/Portugais; rename \.txt.\html \.html *\.html; rename \.TXT.\html \.html *\.html; ls > tous-vos-fichiers\.txt; grep \.html tous-vos-fichiers\.txt > ../nom-de-fichier\.txt; cd ../../LEXICO3/Francais; rename \.txt.\html \.html *\.html; rename \.TXT.\html \.html *\.html; ls > tous-vos-fichiers\.txt; grep \.html tous-vos-fichiers\.txt >> ../nom-de-fichier\.txt;"; print "Le nouveau fichier créé se trouve dans cette liste: \n"; system "#!/bin/bash cd ../LEXICO3; cat nom-de-fichier\.txt; cd ../../PROJET-MULTILINGUE/PROGRAMMES; pwd"; close(FILEIN); close(FILEOUT);