Liens en vrac 14/11/2008
Practical Text Mining with Perl, Roger Bilisoly, ISBN: 978-0-470-17643-6, September 2008. Présentation :”This book is devoted to the fundamentals of text mining using Perl, an open-source programming tool that is freely available via the Internet (www.perl.org). It covers mining ideas from several perspectives–statistics, data mining, linguistics, and information retrieval–and provides readers with the means to successfully complete text mining tasks on their own. The book begins with an introduction to regular expressions, a text pattern methodology, and quantitative text summaries, all of which are fundamental tools of analyzing text. Then, it builds upon this foundation to explore: * Probability and texts, including the bag-of-words model * Information retrieval techniques such as the TF-IDF similarity measure * Concordance lines and corpus linguistics * Multivariate techniques such as correlation, principal components analysis, and clustering * Perl modules, German, and permutation tests. Each chapter is devoted to a single key topic, and the author carefully and thoughtfully introduces mathematical concepts as they arise, allowing readers to learn as they go without having to refer to additional books. The inclusion of numerous exercises and worked-out examples further complements the book’s student-friendly format. Practical Text Mining with Perl is ideal as a textbook for undergraduate and graduate courses in text mining and as a reference for a variety of professionals who are interested in extracting information from text documents.
Research*eu, magazine de l’Espace européen de la recherche consacre un dossier au Journalisme scientifique.
Association Bernard Gregory - campagne 2009 “Un Nouveau Chapitre de la Thèse". Sont concernés les doctorants de toutes disciplines qui soutiendront leur thèse entre mai 2009 et avril 2010.
Slife est une application gratuite qui permet d’obtenir des statistiques détaillées sur l’usage que vous faites de votre ordinateur.
(Source : Google Webmaster Central Blog) Guide SEO pour débutants (SEO = Search Engine Optimisation). Notre Guide SEO pour débutants couvre une douzaine de points-clés que les webmasters peuvent optimiser. Nous pensons que ces points (comme l’amélioration du titre et des meta tags, la structure de l’URL, la navigation du site, la création de contenu, le texte d’ancrage, etc.) s’appliquent à  tous les webmasters, quelque soit leur expérience, ou la taille de leur site web. Vous trouverez également sur ce guide de nombreuses illustrations, les pièges à  éviter, et des liens vers d’autres ressources pour aller plus loin. Nous prévoyons de garder ce guide à  jour avec de nouvelles suggestions d’optimisation, et des conseils techniques d’actualité.
Perspectivia.net : “Perspectivia.net is online. This international publication platform for humanities studies sponsored by the German Federal Ministry of Education and Research (BMBF) now provides free access to selected publications of the Foundation of German Humanities Institutes Abroad (DGIA) and their international partners. perspectivia.net starts off with a retro-digitalised version of Francia, the journal of the German Historical Institute in Paris, and with electronically published conference reports and reviews. This is just a first selection of the results of the work and research carried out, organised and communicated by the German Humanities Institutes Abroad. In the months to come perspectivia.net will be gradually extending its range of publications.“
The Free Software Foundation has released the GNU Free Document License version 1.3.
Le web sémantique aujourd’hui.
Quand le Web sémantique indexe la connaissance.
(source) Préparer une présentation qui fait mouche.
(source) Yasni : moteur de recherche de personnes.
(source) Intelways : métamoteur capable de chercher dans Google, les blogs, Ask,Flickr, etc.
Trouver de l’information scientifique : Scirus, Scitation, TechXtra, Scitopia, ScienceResearch.
High-performance XML parsing in Python with lxml.
System Text for Information Extraction.
L’Université de Hong Kong a mis en ligne plus de 16.500 thèses présentées par ses étudiants. Les sujets couverts sont: les arts, sciences sociales, l’enseignement, la médecine et les sciences naturelles.
Trousse de recherche d’information dans Internet présentrée par le Cégep@distance se découpe en quatre étapes qui correspondent aux quatre moments « classiques » d’une recherche d’information.
Comment on peut taper de l’API.
Comments
No comments yet.
RSS feed for comments on this post.
Leave a comment
Sorry, the comment form is closed at this time.
