Boîte à outils n°3
Mise en place
Cette boîte à outils nous permet d'extraire des patrons syntaxiques.
Les fichiers d'entrée sont des fichiers créés par le biais de la boîte à outils 2.
Nous avons deux scripts dans le bao3. L'un permet d'extraire les patrons syntaxiques créés par Treetagger et l'autre par Cordial.
- extraction des patrons syntaxiques créés par
Treetagger - extraction des patrons syntaxiques créés par Cordial.
Scripts
L'utilisateur écrit dans un fichier annexe les patrons qu'il souhaite extraire. Le retour à la ligne dans ce fichier signifie que l'utilisateur aura plusieurs groupes de patrons syntaxiques. Les catégories syntaxiques sont espacées d'un espace (blanc).
Après étude du corpus, nous avons choisi d'extraire les patrons suivants pour ces deux scripts:
- - NOM-PREP-NOM
- - NOM-ADJ