txtaffichebalise2html-pm.pl
#!/usr/bin/perl use locale; #caracteres accentues #On lance comme cela: perl txtsimple2html.pl #On obtient: fichier.txt.html print "Bienvenu(e) au programme qui permet \n d'afficher les fichiers TXT en HTML en touchant aux balises qui sont déjà là.\n"; print "Nom du fichier de travail, de preference un .txt au format UNIX: \n"; my $file=<STDIN>; chomp($file); open(FILEIN, $file); open(FILEOUT, ">$file.html"); my $DUMPFULL=""; while(my $recup=<FILEIN>) { #1. transcodage ##Les non métacaractères## $recup=~s/&/&/g; ####Les métacaractères#### $recup=~s/\>/>/g; $recup=~s/\</</g; $recup=~s/\"/"/g; ####Les Accents#### $recup=~s/à/à/g; $recup=~s/á/á/g; $recup=~s/â/â/g; $recup=~s/ã/ã/g; $recup=~s/ä/ä/g; $recup=~s/å/å/g; $recup=~s/æ/æ/g; $recup=~s/è/è/g; $recup=~s/é/é/g; $recup=~s/ê/ê/g; $recup=~s/ë/ë/g; $recup=~s/è/è/g; $recup=~s/é/é/g; $recup=~s/ê/ê/g; $recup=~s/ë/ë/g; $recup=~s/ì/ì/g; $recup=~s/í/í/g; $recup=~s/î/î/g; $recup=~s/ï/ï/g; $recup=~s/ò/ò/g; $recup=~s/ó/ó/g; $recup=~s/ô/ô/g; $recup=~s/õ/õ/g; $recup=~s/ö/ö/g; $recup=~s/ù/ù/g; $recup=~s/ú/ú/g; $recup=~s/û/û/g; $recup=~s/ü/ü/g; $recup=~s/ç/ç/g; ####Les fichiers de type texte#### ##Les paragraphes et les line breaks## $recup=~s/(\s)*\n/\n/g; #supprime les espaces avant le retour à la ligne $recup=~s/^\n/<p>\n/g; #met des paragraphes dans tous les sauts de ligne if ($recup=~/[^<p>]\n/g) { $recup=~s/\n/<\/br>\n/g; };# met des br en fin de ligne lorsque la balise <p> n'est pas là ##Spécial si texte dans ligne alors ligne## if (($recup=~/langue=fr/g)||($recup=~/langue=br/g)) { $recup=~s/$recup/<font color="#00618B">$recup<\/font>/g; };#Colorie toutes les balises en bleu #2. Memorisation dans DUMPFULL $DUMPFULL.=$recup; }; #3. En-tete print FILEOUT "<html>\n <head>\n <title>La langue n'est pas un long fleuve tranquille 1: Comparaison morpholexicale du vocable potentiel dans le domaine de la biologie cellulaire entre le Français et le Portugais<\/title>\n <meta http-equiv=\"content-type\" content=\"text\/html; charset=windows-1250\">\n <\/head>\n <body bgcolor=\"\#DEF7D8\" text=\"\#DE6B3F\" link=\"\#034B16\" alink=\"\#C059E2\" vlink=\"\#431C4F\" background=\".\/IMAGES\/multibk.jpg\">\n <blockquote>\n \n <h2><font color=\"#390917\">",$file,"<\/font><\/h2>\n"; #4. Remplacement des entites print FILEOUT $DUMPFULL; # Pied de page print FILEOUT "<p><a href=\"\.\/index.html\"><img src=\"\.\/IMAGES\/index\.gif\"><\/a><\/blockquote>\n<\/body>\n<\/html>\n"; #print FILEOUT "<\/blockquote>\n<\/body>\n<\/html>\n"; print "\nLe fichier bien accentue se nomme $file.html"; #---------------------------------------------- close(FILEIN); close(FILEOUT);