J'ai souhaité automatiser dans une certaine mesure le tri (par usage) des URLs, et la constitution de la liste. Concernant le tri, je souhaitais quatre pages de 100 résultats de Google, correspondant à quatre sens donnés par le TLFi : - (sp) militaire ("tir de barrage") - obstacle - ouvrage sur un cours d'eau - (sp) sport ("match de barrage") J'ai donc lancé quatre requêtes sur Google (avec à chaque fois plusieurs mots-clef dont "barrage", par exemple "barrage fleuve rivière" pour le sens "ouvrage sur un cours d'eau"), et sauvé localement dans quatre fichiers (milit, police, ouvrage, sport) les pages de résultat. Sur ces pages de résultat de Google, les liens pointant vers les pages trouvées ont un format identique et unique sur la page. On peut donc, en lançant une commande grep sur le code-source, les repérer et les extraire. Le format de ces liens se traduit au niveau du code-source par un appel à une information de style stockée au début de la page, sous la ballise