(pluri)TAL 

Journal de lectures, de liens, d'activités pour les étudiants
du secteur TAL [Université Paris 3 Sorbonne nouvelle | ILPGA]
HyperToile : http://tal.univ-paris3.fr

22/9/2009

Liens en vrac 22/09/2009

Veille technologique : Liens Utiles.
NUMES : inventaire en ligne des corpus numérisés et des projets de numérisation des établissements et organismes de l’Enseignement supérieur et de la Recherche.
Publication : Spoken Language Processing, édité par Joseph Mariani (IMMI & LIMSI-CNRS). ISBN: 9781848210318. Janvier 2009, 504 pp. Plus d’informations sur son contenu à l’adresse: http://www.iste.co.uk/index.php?f=a&ACTION=View&id=150.
Publication : “A Wordnet from the Ground Up” by Maciej Piasecki, Stan Szpakowicz and Bartosz Broda (ISBN 978-83-7493-476-3). A language without a wordnet is at a severe disadvantage. We report on the initial stages of a long-term project to create a similar resource for Polish. We have envisaged a book for many audiences. The most immediate “clientele” are people who work with wordnets and on wordnets. We have attempted to make our experience with one language approachable to people who need not know anything about that language. Computing professionals who work with Polish texts may find the technical discussion interesting. Linguists who use computers in their study may be encouraged to acquire yet another element of their research workbench. Researchers who specialise in statistical method of semantic analysis of texts may consider our comprehensive overview of such methods useful. There was no Polish wordnet when our work began several years ago. We chose to construct the resource from the ground up rather than translate the English WordNet first and then labouriously adapt it to the significantly different realities of the Polish language. Liens : (1), (2), (3).
Fabrice Epelboin revient sur un article du New York Times consacré à l’analyse de sentiment
Ajouter du sens aux nombres : objectif de TrueNumber qui permet d’ajouter des étiquettes sémantiques à un nombre pour ne pas qu’il perde son sens…
Traduction de l’article du philosophe de l’information italien Luciano Floridi par Patrick Pecatte. Résumé : Cet article développe certaines des conclusions publiées dans Floridi (2007) concernant les futurs développements des Technologies de l’Information et de la Communication (TIC) et leur impact sur nos vies. Les deux principales thèses soutenues dans ce papier sont les suivantes : alors que la société de l’information se développe, la limite entre connecté et non connecté devient de plus en plus floue, et lorsqu’il n’existera plus de différence significative, nous allons progressivement nous re-conceptualiser nous-mêmes non pas comme des cyborgs, mais plutôt comme des inforgs, c’est-à-dire comme des organismes informationnels socialement connectés. Dans ce papier, j’examine le développement de ce qu’on appelle le Web sémantique et le Web 2.0 à partir de cette perspective et je tente de prévoir leur avenir. En ce qui concerne le Web sémantique, je soutiens qu’il s’agit d’un projet clair et bien défini, qui, en dépit de certains points de vue autorisés contraires, ne constitue pas une réalité prometteuse, et qu’il échouera probablement de la même manière que le projet de l’Intelligence Artificielle (IA) a échoué dans le passé. Concernant le Web 2.0, je soutiens que, même s’il est assez mal défini et qu’il lui manque une claire explication de sa nature et de sa portée, il a la capacité à devenir un succès (et en effet, c’est déjà un succès dans le cadre du nouveau phénomène du Cloud Computing), car il tire parti des seuls moteurs sémantiques disponibles à ce jour dans la nature, nous-mêmes. Je conclus en suggérant quelles autres modifications nous pourrions attendre dans le futur de notre environnement numérique.
Comment Internet transforme les habitudes de lecture.
Rankspeed : moteur de recherche d’avis et opinions dans le web temps réel.
Les TIC multitaches rendent-elles stupide ?
Analyse de texte. La tarte à la crème du sentiment analysis.
Data Mining Tools for Technology and Competitive Intelligence.
Padre : the Perl IDE. Padre is a Perl IDE, an Integrated Development environment, or in short a text editor that is simple to use for new Perl programmers but also supports large multi-lingual and multi-technology projects. Our primary focus is to create a peerless environment for learning Perl and creating Perl scripts, modules and distributions, with an extensible plugin system to support the addition of related functionality and languages and to support advanced developers taking the editor anywhere they want it to go.
My Text Tools : Free Online Text Tools. This website is a collection of simple yet “hard to find” browser-based text manipulation tools. NOTE: Javascript must be enabled for tools to function. This has been added to the tools section of Research Resources Subject Tracerâ„¢ Information Blog.
LexiQuo : Multimoteur de recherche qui peut traduire des requêtes en 5 langues et propose de lancer la recherche sur les dérivés d’un même mot.
Your world, your way : Multimoteur de recherche avec possibilité de conserver et partager des résultats.
Visual Understanding Environment : Logiciel open source de cartographie de l’information.
Recherche et filtrage d’informations : cours sur la recherche et le filtrage d’informations par Daniel Lemire.
Une boite à outil pour les mondes numériques.
BlastCasta : Une boîte à outils autour des flux rss (remix, combinaison, traduction, filtrage, widgets,…)
iubo : Un service qui permet de stocker de nombreux types de données (bookmarks, contacts, évènements, images, notes; flux rss, podcasts,… et de rechercher dedans en plein texte.
JournalBase : Etude comparative internationale des bases de données des revues scientifiques en sciences humaines et sociales (SHS).
Edmodo : Edmodo is a private communication platform built for teachers and students.
“L’Arbre européen des thésaurus francophones (gratuits) en ligne” : annuaire de thésaurus produit par Bruno Richardot (le site complet).
Web Design is 95% Typography.
Des cartes Google Maps sur votre site.
Jack Sandeen propose un site didactique autour du problème de l’analyse brevet .
Mémoire sur la réputation numérique.
TextRunner : permet d’interroger 500 millions de pages web en utilisant des triplets (un sujet, un prédicat, un objet).
Textise : Extension Firefox qui transforme une page web en sa version texte.
Information visualization projects so awesome they’ll turn your hair gray overnight.
Best RSS feeds for information graphics.
LOOP Apps : Merge Microsoft Office Documents, Automate Document Creation, Convert to PDF. Un couteau suisse en ligne pour manipuler des fichiers.
Astuce pour faire de la veille avec Twitter.

Comments

No comments yet.

RSS feed for comments on this post.

Leave a comment

Sorry, the comment form is closed at this time.

(pluri)TAL avec WordPress