Une fois le verbe multilingue trouvé, nous avons procédé à différentes étapes :
Etape 1 : Parmi la masse de données mises à disposition sur le web, nous avons sélectionné plus de 50 URLs
qui contenaient le verbe choisi dans chacune des deux langues de spécialité. Nous les avons ensuite placées dans deux fichiers .txt distincts.
Etape 2 : Via la commande
curl nous avons aspiré ces URLs dans le but de stocker localement les informations s'y trouvant.
Etape 3 : Via la commande
lynx -dump nous avons gardé uniquement le contenu textuel de nos URLs.
Etape 4 : Via la commande
egrep nous avons filtré les textes afin d'obtenir les différentes cooccurrences
du verbe
avancer (français/créole) en contexte.
Ces étapes nous ont permis d'obtenir un
tableau contenant toutes ces informations.