Liens en vrac 19/09/2008
Organiser sa veille avec les logiciels libres, un ouvrage de Xavier Delengaigne.
A pragmatic approach to writing a mp3 crawler in perl : Stefan Petrea has written up a summary of his building of an MP3 website crawler using WWW::Mechanize and an RDBMS. It’s a good write-up, and good overview of the issues of crawling beyond the obvious ‘open a page, get the links, follow the links’.”
Le centre de traduction Google, ou la mémoire de traduction universelle : Jean-Marie Le Ray, traducteur, explique l’impact que devrait avoir le prochain Centre de traduction de Google, un site qui sera la plus grande mémoire de traduction du monde et une base de mise en relation entre traducteurs et prestataires.
“What shoulg blog search look like” par Marti Hearst, professeur à Berkeley et spécialiste de la navigation et des interfaces “à facette", Susan Dumais (Microsoft), inventeur de l’indexation sémantique latente et spécialiste des interactions homme-machine, et Matthew Hurst (Microsoft), blogueur et inventeur du remarquable outil BlogPulse. Et un compte rendu de cet article par Olivier Ertzcheid : “La recherche de blogs : pistes pour demain“.
L’evaluation de la recherche chez Google (Source : Official Google Blog) : “Cette série de billets a eu pour objectif de vous décrire les différentes façons dont nous tentons d’améliorer la recherche comme le classement et l’interface du moteur. Je vais à présent expliquer l’évaluation de la recherche. En résumé, l’évaluation est une procédure qui nous permet de mesurer la qualité de nos résultats de recherche et de l’expérience d’utilisation de notre service…“.
XML versus Protocol Buffers (source : XML versus Protocol Buffer) : Protocol Buffer est un mécanisme utilisé en interne Google pour sérialiser des données structurée lors d’échanges entre des systèmes ou des applicatif. Ils pourraient le faire via XML mais non ils font autrement (xml trop verbeux). Leur mécanisme est utilisé pour sérialiser les données qui s’échangent sous forme de message entre des applications de leur système d¹information. Le principal avantage est le gain de temps…
Build a simple WYSIWYG Web page editor : “Explore a simple Asynchronous JavaScript + XML (Ajax) system that lets your users assemble pages by adding and arranging pre-made widgets. Many sites provide this kind of functionality, but this easy-to-use system lets you do it on your own site and provides a simple library for creating new widgets.“
Google dispose désormais de la capacité d’écoute en termes d’indexation (source : Indexation : Google a l’écoute) : il s’agit “simplement” d’indexer, dans des vidéos ou des fichiers audio, le contenu des dites vidéos ou fichiers, “mot à mot".
ErrorKey : moteur de recherche permettant de comprendre la signification des messages d’erreur…
Le Web sémantique doit encore bâtir sa tour de Babel (sur atelier.fr) : Pour mieux répertorier les informations accessibles sur Internet, des chercheurs proposent de les analyser selon un modèle grammatical commun à toutes les langues.
Comments
No comments yet.
RSS feed for comments on this post.
Leave a comment
Sorry, the comment form is closed at this time.
