Les nuages de mots
Les résultats sont classés par langue.
Nuage de mots pour l'allemand - Sens "direction" - Contextes
Si la répartition de la fréquence des mots est généralement plutôt homogène dans les nuages des dumps, ceux des fichiers de contextes contiennent toujours un ou plusieurs mots "écrasants" (le ou les motifs récupérés par le egrep + les mots les plus souvent rencontrés autour d'eux).
Nuage de mots pour l'allemand - Sens "capacité intellectuelle" - Contextes
On remarque bien ici les motifs recherchés, qui se détachent des autres mots - contrairement au nuage des dumps juste au dessus.
Nuage de mots pour l'allemand - Tous sens confondus - Dumps
Nous avons rajouté ces nuages généraux pour pouvoir observer quels sont les 50 mots les plus employés dans notre étude du mot "sens" dans les différentes langues. Le résultat est à prendre avec des pincettes puisqu'il se peut qu'un sens particulier soit sur-représenté (URLs plus nombreuses, récupération d'occurrences plus importante dans certaines pages, etc) et empêche les mots des autres domaines d'accéder au top 50.
Nuage de mots pour l'allemand - Tous sens confondus - Contextes
Pour l'allemand, il semble que le mot "Bedeutung" (qui n'exprime pourtant qu'un seul des quatre sens étudié) a été beaucoup plus récupéré que les autres ! Les autres motifs recherchés apparaissent tout de même en assez grande taille ("Sinn", "Richtung"...).
Nuage de mots arboré des contextes de l'allemand ; moins "parasité" que celui des dumps, et on voit nettement se dessiner des groupes de ramifications pour chacun des sens étudiés.
Version .pdf
Nuage de mots arboré des dumps de l'anglais, présentant une belle ramification parasite "vocabulaire du blog" ! (et une sombre histoire de rendez-vous galant gratuit avec un chrétien ?!).
Version .pdf
Nuage de mots arboré des contextes de l'anglais : on distingue clairement le découpage des différents sens, il suffit de suivre les branches.
Version .pdf
Nuage de mots pour l'espagnol - Sens "signification" - Dumps
Difficile ici de trouver un mot qui se détache du lot !
Nuage de mots pour l'espagnol - Sens "signification" - Contextes
Le contraste avec le nuage des dumps est frappant. Le résultat est très réussi, puisque les mots qui ressortent le plus ont tous un lien avec le sens de "signification".
Nuage de mots pour l'espagnol - Sens "capacité physique" - Contextes
Le mot "oído" ("ouïe", un des cinq sens donc), qui était le mot le plus grand dans le nuage des dumps, s'est complètement fondu dans la masse dans le nuage des contextes, tandis qu'un autre sens y est maintenant en relief : le goût, "gusto". C'est plutôt marrant !
Nuage de mots pour l'espagnol - Sens "capacité intellectuelle" - Contextes
C'était quoi le mot étudié déjà ?
Nuage de mots pour l'espagnol - Tous sens confondus - Contextes
Un seul mot pour exprimer les quatre sens étudiés, d'où la taille gigantesque de "sentido" et la petitesse des autres mots ; l'effet obtenu est intéressant : tous les mots qui sont lisibles ont un lien avec les sens envisagés : la direction ("corriente", "tránsito", "único"...), les cinq sens ("sentidos"), la signification ("palabras", "doble"...) et la capacité intellectuelle ("humor", "común"...).
Nuage de mots arboré des contextes de l'espagnol ; l'anti-dicionnaire utilisé n'était pas assez complet, et malgré les améliorations que nous lui avons apporté, il reste du "bruit" ("e", "le", "mas", "www"...). Les mots les plus souvent rencontrés dans les contextes sont bien là, mais leur disposition est un peu moins rigoureuse que pour les autres arbres (les ramifications partent un peu... dans tous les sens !).
Version .pdf
Nuage de mots pour le français - Sens "signification" - Contextes
Un des problèmes de ce type de représentation est illustré ici : quand un mot est sur-dimensionné, la lisibilité des autres mots peut s'en trouver fortement réduite. Ici, des mots importants comme "interprétation" ou "contexte" ne sont plus suffisamment mis en relief, comme ils pouvaient l'être dans le nuage des dumps.
Nuage de mots arboré des dumps du français : du bruit, mais beaucoup de mots intéressants par rapport à nos sens sont présents.
Version .pdf
Nuage de mots arboré des contextes du français : on note une très nette sous-représentation des mots du domaine des cinq sens, peut-être à cause d'un anti-dictionnaire trop strict ou d'une fréquence trop peu élevée de ces mots par rapports à ceux des autres domaines.
Version .pdf
Graphe de mots du patron syntaxique .?.?sens.?.? (français)
On note l'utilisation massive de la préposition "de" conjointement au mot "sens" en français, essentiellement dans des structures de type "N de sens", mais aussi dans quelques structures "sens de N".
Polycooccurrents de la forme "sens" en français
Comme pour les nuages arborés de Treecloud, on peut "lire des histoires" en suivant les flèches et remonter aux différents sens du mot (le bon sens (et le bon savon !) et la raison, le sens commun en philosophie, les électrons et le sens du courant électrique, le sens de la rue Monta modifié par un panneau de priorité, etc !)
Nuage de mots pour le portugais - Sens "signification" - Dumps
Depuis quand parle-t-on anglais au Portugal ?!
Jolie comparaison entre la concaténation des dumps et des contextes : le "bruit" anglais n'est pas prélevé dans les fichiers de contextes !
Nuage de mots pour le portugais - Sens "capacité physique" - Dumps
Un vrai bloc de mots ! Celui qui ressort un peu plus que les autres est le mot "avaliação" ("évaluation"), a priori sans rapport avec le sens étudié.
Nuage de mots pour le portugais - Tous sens confondus - Contextes
Le mot "Gravity" est arrivé dans le top 50 des mots les plus employés dans les fichiers de contextes... Etrange ! Peut-être que ce mot était présent non loin du motif récupéré, dans une ligne de texte très souvent répétée à l'intérieur d'une même page, comme le titre d'un sujet de discussion de forum, par exemple (répété à chaque nouveau post).
Nuage de mots arboré des dumps du portugais : admirez la belle "branche anglaise", déjà mise en relief par Wordle !
Version .pdf
Nuage de mots arboré des contextes du portugais : quelques mots parasites sont présents, mais les ramifications par sens sont faciles à distinguer ; fait intéressant, trois "pôles" se détachent : le pôle "senso" (à gauche) qui regroupe autour de lui le vocabulaire de la "capacité intellectuelle", le pôle "sentidos" (en haut à droite) et son vocabulaire des cinq sens, et le pôle "sentido" qui concentre plutôt des mots ayant à voir avec la direction et la signification.
Version .pdf
Allemand
Wordle
Nuage de mots pour l'allemand - Sens "direction" - Contextes
Si la répartition de la fréquence des mots est généralement plutôt homogène dans les nuages des dumps, ceux des fichiers de contextes contiennent toujours un ou plusieurs mots "écrasants" (le ou les motifs récupérés par le egrep + les mots les plus souvent rencontrés autour d'eux).
Nuage de mots pour l'allemand - Sens "capacité intellectuelle" - Contextes
On remarque bien ici les motifs recherchés, qui se détachent des autres mots - contrairement au nuage des dumps juste au dessus.
Nuage de mots pour l'allemand - Tous sens confondus - Dumps
Nous avons rajouté ces nuages généraux pour pouvoir observer quels sont les 50 mots les plus employés dans notre étude du mot "sens" dans les différentes langues. Le résultat est à prendre avec des pincettes puisqu'il se peut qu'un sens particulier soit sur-représenté (URLs plus nombreuses, récupération d'occurrences plus importante dans certaines pages, etc) et empêche les mots des autres domaines d'accéder au top 50.
Nuage de mots pour l'allemand - Tous sens confondus - Contextes
Pour l'allemand, il semble que le mot "Bedeutung" (qui n'exprime pourtant qu'un seul des quatre sens étudié) a été beaucoup plus récupéré que les autres ! Les autres motifs recherchés apparaissent tout de même en assez grande taille ("Sinn", "Richtung"...).
_______________________
TreeCloud
Nuage de mots arboré des contextes de l'allemand ; moins "parasité" que celui des dumps, et on voit nettement se dessiner des groupes de ramifications pour chacun des sens étudiés.
Version .pdf
______________________________________________________________
Anglais
Wordle
_______________________
TreeCloud
Nuage de mots arboré des dumps de l'anglais, présentant une belle ramification parasite "vocabulaire du blog" ! (et une sombre histoire de rendez-vous galant gratuit avec un chrétien ?!).
Version .pdf
Nuage de mots arboré des contextes de l'anglais : on distingue clairement le découpage des différents sens, il suffit de suivre les branches.
Version .pdf
______________________________________________________________
Espagnol
Wordle
Nuage de mots pour l'espagnol - Sens "signification" - Dumps
Difficile ici de trouver un mot qui se détache du lot !
Nuage de mots pour l'espagnol - Sens "signification" - Contextes
Le contraste avec le nuage des dumps est frappant. Le résultat est très réussi, puisque les mots qui ressortent le plus ont tous un lien avec le sens de "signification".
Nuage de mots pour l'espagnol - Sens "capacité physique" - Contextes
Le mot "oído" ("ouïe", un des cinq sens donc), qui était le mot le plus grand dans le nuage des dumps, s'est complètement fondu dans la masse dans le nuage des contextes, tandis qu'un autre sens y est maintenant en relief : le goût, "gusto". C'est plutôt marrant !
Nuage de mots pour l'espagnol - Sens "capacité intellectuelle" - Contextes
C'était quoi le mot étudié déjà ?
Nuage de mots pour l'espagnol - Tous sens confondus - Contextes
Un seul mot pour exprimer les quatre sens étudiés, d'où la taille gigantesque de "sentido" et la petitesse des autres mots ; l'effet obtenu est intéressant : tous les mots qui sont lisibles ont un lien avec les sens envisagés : la direction ("corriente", "tránsito", "único"...), les cinq sens ("sentidos"), la signification ("palabras", "doble"...) et la capacité intellectuelle ("humor", "común"...).
_______________________
TreeCloud
Nuage de mots arboré des contextes de l'espagnol ; l'anti-dicionnaire utilisé n'était pas assez complet, et malgré les améliorations que nous lui avons apporté, il reste du "bruit" ("e", "le", "mas", "www"...). Les mots les plus souvent rencontrés dans les contextes sont bien là, mais leur disposition est un peu moins rigoureuse que pour les autres arbres (les ramifications partent un peu... dans tous les sens !).
Version .pdf
______________________________________________________________
Français
Wordle
Nuage de mots pour le français - Sens "signification" - Contextes
Un des problèmes de ce type de représentation est illustré ici : quand un mot est sur-dimensionné, la lisibilité des autres mots peut s'en trouver fortement réduite. Ici, des mots importants comme "interprétation" ou "contexte" ne sont plus suffisamment mis en relief, comme ils pouvaient l'être dans le nuage des dumps.
_______________________
TreeCloud
Nuage de mots arboré des dumps du français : du bruit, mais beaucoup de mots intéressants par rapport à nos sens sont présents.
Version .pdf
Nuage de mots arboré des contextes du français : on note une très nette sous-représentation des mots du domaine des cinq sens, peut-être à cause d'un anti-dictionnaire trop strict ou d'une fréquence trop peu élevée de ces mots par rapports à ceux des autres domaines.
Version .pdf
_______________________
Le Trameur
Graphe de mots du patron syntaxique .?.?sens.?.? (français)
On note l'utilisation massive de la préposition "de" conjointement au mot "sens" en français, essentiellement dans des structures de type "N de sens", mais aussi dans quelques structures "sens de N".
Polycooccurrents de la forme "sens" en français
Comme pour les nuages arborés de Treecloud, on peut "lire des histoires" en suivant les flèches et remonter aux différents sens du mot (le bon sens (et le bon savon !) et la raison, le sens commun en philosophie, les électrons et le sens du courant électrique, le sens de la rue Monta modifié par un panneau de priorité, etc !)
______________________________________________________________
Portugais
Wordle
Nuage de mots pour le portugais - Sens "signification" - Dumps
Depuis quand parle-t-on anglais au Portugal ?!
Jolie comparaison entre la concaténation des dumps et des contextes : le "bruit" anglais n'est pas prélevé dans les fichiers de contextes !
Nuage de mots pour le portugais - Sens "capacité physique" - Dumps
Un vrai bloc de mots ! Celui qui ressort un peu plus que les autres est le mot "avaliação" ("évaluation"), a priori sans rapport avec le sens étudié.
Nuage de mots pour le portugais - Tous sens confondus - Contextes
Le mot "Gravity" est arrivé dans le top 50 des mots les plus employés dans les fichiers de contextes... Etrange ! Peut-être que ce mot était présent non loin du motif récupéré, dans une ligne de texte très souvent répétée à l'intérieur d'une même page, comme le titre d'un sujet de discussion de forum, par exemple (répété à chaque nouveau post).
_______________________
TreeCloud
Nuage de mots arboré des dumps du portugais : admirez la belle "branche anglaise", déjà mise en relief par Wordle !
Version .pdf
Nuage de mots arboré des contextes du portugais : quelques mots parasites sont présents, mais les ramifications par sens sont faciles à distinguer ; fait intéressant, trois "pôles" se détachent : le pôle "senso" (à gauche) qui regroupe autour de lui le vocabulaire de la "capacité intellectuelle", le pôle "sentidos" (en haut à droite) et son vocabulaire des cinq sens, et le pôle "sentido" qui concentre plutôt des mots ayant à voir avec la direction et la signification.
Version .pdf
_______________________