Filtrage dans des fichiers multilingues.
En entrée : un fichier à filtrer (dit FILEINPUT) dont on connaît l'encodage ; un motif à rechercher et extraire dans FILEINPUT.
En sortie : un fichier au format UTF-8 contenant les lignes du fichier FILEINPUT contenant le motif visé.
Programme (version 2.1), un jeu de fichiers de test : minigrepmultilingue-v2.1.zip
Mise à jour par Pierre Marchal (M1/INALCO).
L'option -c permet de ne pas tenir compte du contexte (cf v.2)
Programme (version 2), un jeu de fichiers de test : minigrepmultilingue-v2.zip
Mise à jour par SF et Pierre Marchal (M1/INALCO).
Intégration du contexte (cf résultat présenté infra) autour des lignes contenant le motif (un ligne avant, une ligne après)
Le fichier de travail et le fichier motif sont disponibles dans l'archive : minigrepmultilingue-v2.1.zip (Version 2.1), minigrepmultilingue-v2.zip (Version 2)
Mode d'emploi pour installer le minigrep.
Le fichier résultat (version 2) : minigrepmultilingue-resultat-extraction-v2.html
Le fichier résultat (version 1) : minigrepmultilingue-resultat-extraction.html
http://www.tal.univ-paris3.fr/, Contact : serge.fleury@univ-paris3.fr