Archive for the 'Moteurs de recherche' Category

Merci Google

« La rédaction des remerciements pour mon premier livre, « Interstate 69: The Unfinished History of the Last Great American Highway,” a été une expérience grisante et un peu fatigante à la fois. Un peu comme faire un discours pour les Oscars peut-être, sans costard ni orchestre. J’ai passé beaucoup de temps sur le livre (8 ans entre les premiers entretiens et la publication), et j’ai éprouvé le besoin d’être exhaustif. J’ai donc remercié mon éditeur, mon agent, ma famille et mes amis, les gens qui m’ont guidé professionnellement, ceux qui m’ont donné un coup de main, ceux sur les canapés desquels j’ai dormi, mes professeurs, les sujets du livre… Et bien sûr j’ai remercié Google. Comment faire autrement ?
Cela m’a fait un peu bizarre d’exprimer de la gratitude envers une société toute-puissante d’internet, à côté des remerciements à mes parents et aux personnes que j’ai passé des heures à interviewer, mais il ne m’a pas fallu y réfléchir longtemps : pour dire les choses simplement, ce livre n’existerait pas sans Google. »

Matt Dellinger explique ensuite comment, en utilisant les alertes de Google News, la visualisation sur Google Street View, les flux RSS dans Google Reader, un compte Blogger privé pour archiver les infos intéressantes, il a pu compléter profitablement ses recherches sur le terrain. Il conclut : « Aucun site web ne peut remplacer les conversations personnelles et l’observation – mon travail a nécessité une voiture autant qu’un ordinateur – mais les outils disponibles en ligne sont une bénédiction même pour les journalistes les plus traditionnels, et ceux qui fournissent ces services doivent être crédités pour ça. Alors merci, Google. Tu as été le chien qui m’apportait mon journal tous les matins, mon équipe de tournage embarquée, mon classeur, mon bureau de poste, ma bibliothèque et ma cartothèque. J’ai de la chance. »

I’d like to thank my agent, my publisher and… Google, sur un blog du WSJ.

[Photo : rayparnova]

Publicité

Retour à la bibliothèque en passant par la case Google Scholar

« En conclusion, Google Scholar réussit à amener les usagers vers les ressources de la bibliothèque sans qu’il soit besoin de les former à la recherche. Le fait que les résultats de recherche dans Google Scholar apparaissent dans les résultats de Google a ouvert pour les utilisateurs un chemin vers les ressources de la bibliothèque sans même qu’ils s’en rendent compte. Ce développement [le paramétrage du résolveur de liens de la bibliothèque pour l’accès aux ressources depuis Google Scholar] donne à Google Scholar un avantage indéniable sur les bases de données de la bibliothèque. Aller là où sont les utilisateurs bénéficie à la bibliothèque comme à ses utilisateurs : pour la bibliothèque, c’est un moyen de rendre les contenus qu’elle achète plus accessibles sur le web « gratuit », et donc d’en augmenter l’usage. Pour les fournisseurs de contenus avisés, qui mettent leurs contenus à dispositions sur des moteurs de recherche comme Google Scholar, c’est aussi un moyen d’augmenter les usages de ces contenus, ce qui revêt de plus en plus d’importance, en ces temps de réductions budgétaires, où les études de coût à l’usage abondent. Et faire le lien vers les ressources de la bibliothèque depuis Google, ça rend un réel service aux utilisateurs, notamment à ceux qui font leurs recherches ailleurs que sur le site de la bibliothèque : si l’on en croit les résultats de l’enquête LibQual de 2009, environ 9 189 étudiants de premier cycle utilisent les moteurs de recherche comme Google quotidiennement […] Dans ce contexte, Google Scholar joue un rôle important pour ramener les recherches vers les bases de documents en texte intégral auxquelles les bibliothèques donnent accès. »

Google Scholar users and users behavior : and exploratory study, un article à paraître dans College & Research Libraries repéré sur la rubrique dédiée aux pre-prints de la revue.

[Photo : Dan Culleton]

Bibliothèques vs Google (et inversement)

« Similarités entre les bibliothèques et Google :

Les 2 se sont donné pour mission d’organiser et de rendre accessible l’information mondiale.
Les 2 permettent d’obtenir de l’information numérique, depuis n’importe où et à n’importe quel moment (même quand on est encore en pyjama).
Les 2 contiennent des livres, des articles, des vidéos, de la musique, des images et bien d’autres choses encore, couvrant toutes les périodes de l’histoire.
Les 2 proposent des outils pour aider à cibler et à affiner les recherches dont la plupart des utilisateurs ignore l’existence.
Les 2 ont des blogs.
Les 2 expérimentent de nouvelles technologies.
Les 2 lancent des outils super-cool dont, au bout du compte, il s’avère que personne n’a besoin.
Les 2 permettent à la fois d’économiser du temps et d’en gaspiller, souvent au cours de la même journée.
Les 2 comportent de l’information de qualité, ainsi que beaucoup d’informations obsolètes, inutiles, fausses ou biaisées
.

Différences entre les bibliothèques et Google :

Les bibliothèques protègent votre vie privée.
Les bibliothèques ne souhaitent pas « améliorer votre expérience de consommateur ».
Les bibliothèques s’opposeraient à ce qu’un éditeur entre dans la bibliothèque et supprime ou modifie les livres qu’il a publiés.
Les bibliothèques veulent retaper le fair use pour qu’il soit en bon état*, mais pas au prix d’un procès ; la plupart des bibliothèques ne peut pas se permettre d’être poursuivie en justice.
Les bibliothèques savent qu’elles ne peuvent pas diffuser toute l’information qu’elles voudraient.
Les bibliothèques doivent satisfaire des acteurs locaux, et pas des actionnaires.
Les bibliothèques pourront vous dire combien elles ont de documents dans leurs collections.
Les bibliothèques répondront aux questions par téléphone.
Les bibliothèques vous diront quels sont leur projets en cours.
 »

Barbara Fister, Some of These Things Are Not Like the Others

* Si quelqu’un trouve mieux pour traduire « Libraries want to stretch fair use so it’s in good shape », je prends 😉

[Photos : Clindstedt’s]

Reference Extract : des bibliothécaires dans le moteur

2452885473_93040b654b_m.jpg“Google est partout, facile à utiliser, et quand même efficace pour proposer des résultats utiles. Mais je ne peux pas toujours faire confiance à ces résultats. »[…] »Y a-t-il un moyen d’améliorer cela ? » C’est ce que s’est dit l’un des fondateurs de Reference Extract, un futur nouveau moteur de recherche, qui s’appuiera sur l’expertise des bibliothécaires pour valider les résultats : il s’agira de confronter les résultats avec les sites les plus souvent signalés comme références par plus de 1 400 bibliothèques à travers le monde, dont la bibliothèque du Congrès, et vraisemblablement des bibliothèques du réseau d’OCLC, partenaire de l’opération. Le projet est mené conjointement par l’école de SIB de l’Université de Syracuse, l’Université de Washington et OCLC, donc.

Recherche fédérée libre

84737f94c8dd7e4f540d55253d1ad404.jpgDans le cadre de leur contrat quadriennal, les bibliothèques universitaires de Grenoble (SICD1 et SICD2) ont en projet la mise en place d’un moteur de recherche fédérée. Après avoir exploré plusieurs pistes commerciales, et donc découragés par les coûts ;-), surtout en terme de maintenance, les bibliothécaires étudient à présent différentes solutions open source : DbWiz, Libraryfind, Summa, Xerxes, Pazpar2, voire Lucene (si tant est qu’on puisse le considérer comme métamoteur). Ils ont monté avec leurs collègues de Lyon 2 un groupe de travail au sein duquel ils comptent tester tous ces moteurs.

Si vous êtes dans la même démarche, vous êtes invités à rejoindre le groupe pour échanger et partager informations, réflexions, résultats des tests et des explorations…

Contact : lucie.albaret[AT]upmf-grenoble.fr ou mrf-libre[AT]grenet.fr
[photo : alain bachellier]

Le marché du mardi, n°6

64c3ac4a37f5233ad446893c3abce500.jpgRecherche
– Il n’y a pas que Wikipedia sur internet : un article de la rubrique Bibliothèque du site CollegeDegree.com liste 25 sources alternatives d’information de qualité
Search Pigeon est un outil de recherche en SHS créé avec Google Co-op CSE, qui cherche dans les revues en OA (blog).

2.0
– Non pas le mais les blogs de la bibliothèque publique de New-York font un bon travail de valorisation des fonds, notamment iconographiques ; par contre ils ne sont pas trop mis en valeur sur le site (il faut aller dans Digital Collections, puis descendre à NYPL Staff).
– Un outil simple et bien fait pour créer des chronologies : Circavie (exemple avec l’historique du consortium Couperin)
31bd64ec0d25abacd350d8c5e9a2f1b2.jpg– Encore plein de services associés autour de Twitter : Twitter Karma (pour avoir une vue d’ensemble sur qui vous suivez / qui vous suit), Twitterlights (pour envoyer sur Twitter ce que vous avez surligné / annoté sur le web), My Twitter map (pour voir d’où viennent les tweets), Twittermeter (pour afficher une courbe selon les mots-clés utilisés sur twitter)

E-book
Planet e-book édite des textes du domaine public au format pdf , qui ont l’air de bonne qualité. Je n’ai pas réussi à en savoir plus sur l’éditeur ni ses raisons, mais l’idée est bonne. Les nouveautés sont annoncées sur le blog.
2843d5d5aea46fbe38ca30f6aa69e6b9.jpg30 bénéfices des e-books chez epublishers weekly deviennent 30 fausses bonnes raisons sur Off the Mark.

Open Access
– Le numéro de février du magazine i4d (Information for Development) est consacré à l’Open (publishing, access, science…) – téléchargement gratuit au format pdf après enregistrement.
Open Source Business Ressource, une revue canadienne, parle de données ouvertes (‘open data’) ce mois-ci, et parlait d’interopérabilité en janvier.
[photos : @rgs, nathonline, Ghusse]

Le marché du mardi, n°4

798129ce21615b790665a464d38d67ed.jpgTECHNO

Masterkey : un moteur de recherche fédérée en open source, qui interroge dans sa version publique plusieurs ressources en Open Access (OAIster, OCA, Wikipedia et plusieurs catalogues de bibliothèques…), et propose dans la version payante l’interrogation de catalogues, de bases de données commerciales… Ce que je trouve particulièrement intéressant, c’est que pour chaque connecteur développé dans le cadre de la version payante, la société ajoutera un connecteur dans la version gratuite, augmentant ainsi la masse de ressources interrogeables par tous.

– Dans un genre un peu différent, Search Quilt est un mashup entre méta-moteur et agrégateur de news, pourquoi pas (exemple).

– Un plug-in WordPress pour insérer des citations d’articles scientifiques dans des posts de blog – ça marche avec Crossref, DOI, COINS et autres acronymes de bibliogeeks ;-))
E-BOOKS
52c03aa062b873ee31d268d732e1e041.gif– Après la VOD, la FOD, la POD… voici l’EOD : E-books On Demand est un projet soutenu par l’Union Européenne de valorisation des fonds anciens, par la numérisation à la demande d’ouvrages publiés entre 1500 et 1900. A la demande de qui ? De vous, de moi, bref de n’importe quel internaute, via le catalogue des bibliothèques participantes (une douzaine, en Allemagne, Slovénie, Estonie, Autriche, Danemark, Hongrie, Slovaquie, Portugal) ; il suffira de cliquer sur un bouton pour enclencher le processus de numérisation. Les documents numérisés seront accessibles courant 2008 depuis le site. Et qu’est-ce qui se passe si nous sommes des milliers à cliquer sur tous les boutons de toutes les vieilles notices ? 🙂
DOC ELEC

Wildy & Sons, une librairie londonienne spécialisée dans l’édition juridique, propose de suivre ses nouveautés avec de nombreux fils RSS thématiques – en la matière, de ce côté-ci du Channel, Dalloz fait figure d’exception.
[photo : najbo]

Un ver dans le moteur

medium_libworm1.gifJe crois qu’on peut tous ranger nos petits modules de recherche personnalisés de chez Google et autres pages xfruits : en effet, David Rothman nous annonce l’arrivée de
Libworm
, qui permet de rechercher dans plus d’un millier de fils rss bibliothécorientés (biblioblogs, sommaires de revues en SIB, etc). Il y a un classement par sujets et par type de fil rss, et un fil rss créé automatiquement pour chaque recherche, ce qui est bien pratique, on ne le dira jamais assez. Et en plus ça fait agrégateur !!! Encore des heures de « biblioblogaddiction » en perspective !

Qu’y a-t-il à l’intérieur d’une noix ?

Petite mise au point chez Inside Google Book Search sur ce qu’on peut trouver dans le projet GBS :
– des livres complets : tombés dans le domaine public, ou dont l’accès libre a été autorisé par l’auteur ou l’éditeur
– quelques pages de livres : en général 3 pages maxi, pour inciter le lecteur potentiel à acheter l’ouvrage complet (via des liens vers les sites des éditeurs)
– quelques extraits de livres : en général 3 paragraphes, pour vérifier que c’est bien le livre que vous cherchez ; entrent dans cette catégorie les livres encore sous copyright issus des collections numérisées des bibliothèques partenaires de Google
– des références bibliographiques : pour les ouvrages de référence, pas de texte disponible, juste des notices.
Dans tous les cas, on trouve des liens vers les sites des éditeurs ou les sites de libraires en ligne ; il me semblait aussi qu’il y aurait des liens vers les bibliothèques partenaires du projet, mais peut-être est-ce limité à la zone géographique de ces bibliothèques ?

Recherche fédérée : réfléchir avant ou après ?

La bibliothèque de l’Université d’Alberta (Canada) a organisé la semaine dernière un symposium sur la recherche fédérée. Au programme des interventions de Roy Tennant, de la California Digital Library, et de Cathy Gordon, directrice du business developpement (développement d’affaires ?) chez Google.
En résumé (via The distant librarian):
Roy Tennant (voir sa présentation ici) conseille à ceux qui veulent implémenter un outil de recherche fédérée :
– d’analyser les besoins des utilisateurs
– de déterminer quels sont les objectifs
– d’étudier les différentes options et de choisir quel niveau de contraintes ont est prêt à endurer (il est important de noter que ce sera forcément contraignant à un moment ou à un autre)
– d’être prêt à y consacrer plus de temps et d’argent que prévu, pour des résultats moindre que ceux espérés.
Donc un gros travail de préparation et d’analyse, puis un gros travail de mise en place, et un gros travail d’évaluation (accessible à tous, et ça c’est bien).

Pour Cathy Gordon, qui intervenait à propos de Google Scholar – qui fait aussi un genre de recherche fédérée, bien que personne ne sache ce qui est exactement fédéré – c’est plutôt l’inverse : installez votre solution, et raffinez après. Interrogée par des bibliothécaires, elle explique également qu’il est trop compliqué d’afficher une liste des contenus fédérés par GS, parce qu’il y en a trop, et que ça change tout le temps…

Les présentations ont été enregistrées, je pense qu’on devrait pouvoir consulter les videos ou les podcasts bientôt (je ferai une update, promis).


juin 2023
L M M J V S D
 1234
567891011
12131415161718
19202122232425
2627282930  

Archives

Licence

Licence Creative Commons
Ce(tte) œuvre est mise à disposition selon les termes de la Licence Creative Commons Attribution 3.0 France.