Archive for the 'Archives Ouvertes' Category



CR JEAO : OK

2335951990_f637573547_t.jpgJuste pour signaler que les présentations, les enregistrements sonores et les compte-rendus – rédigés par Daniel Bourrion et moi-même – des journées sur les archives ouvertes du consortium Couperin sont en ligne sur le blog de la manifestation.

[photo : ricardipus]

Couperin m’invite !

muppet-show.jpgJ’ai déjà parlé des journées d’études sur les archives ouvertes organisées par Couperin les 2 et 3 avril, il me semble. Ce que je n’ai pas dit, c’est que Jean-François Lutz, coordinateur de la manifestation, m’a gentiment conviée à venir blogguer ces journées, en bonne compagnie qui plus est…

Amis bloggueurs et twitters qui serez sur place, vous êtes invités à utiliser #jeao09 pour tagguer vos posts et autres commentaires. Amis lecteurs tout court, passez donc nous dire un petit bonjour ! 🙂

Une archive ou des archives ?

3383421100_3aab318def_m.jpgIntéressants posts (1, 2) que ceux de John Mark Ockerbloom sur Everybody’s libraries, qui défend l’intérêt d’avoir plusieurs archives ouvertes au sein d’une même institution : d’une part une (ou plusieurs) archives pour stocker les documents numériques produits par la bibliothèque (typiquement, les collections numérisées, textes ou photos) – l’archive est alors un « simple » espace de stockage, qui doit permettre des traitements techniques, des opérations de masse, la mise à disposition et l’accès étant assurés par une couche logicielle spécifique. D’autre part une archive institutionnelle, alimentée par les chercheurs – une vitrine pour valoriser leur travail, qui doit proposer un éventail de services (statistiques de consultation, interface agréable, outil de saisie simple d’accès).

Dans le second post, il liste les fonctionnalités de base nécessaires pour une AO, parmi lesquels j’ai noté :

– un workflow de dépôt efficace et convivial

– un module de conversion en pdf

– un outil de gestion du workflow de publication dans une revue (pour gérer ses propres revues)

– un module d’alimentation automatique d’une archive à une autre (je dépose dans Hal, et mon dépôt est transféré dans ArXiv par exemple)

– des URI pour garantir la pérennité des accès aux documents

– l’utilisation de standards compréhensibles par les moteurs de recherche

– et bien sûr, des fils rss 😉
[photo : shadowfall]

25ème position

bfd6e0d564df1b859b2e7c997da932fb.jpgNon, il ne s’agit pas du classement de mon blog sur wikio (qui s’est considérablement amélioré, soit dit en passant, depuis qu’il est passé de la catégorie « Divers » à la catégorie « Science », mais ça fera sans doute l’objet d’un autre post).

25ème, entre la Grèce et l’Autriche, c’est la place de la France dans la liste des pays représentés sur E-LIS, l’archive ouverte internationale en sciences de l’information et des bibliothèques. Il s’agit du classement en fonction des statistiques de consultation : si l’on se base sur le nombre de documents déposés, la France est également au 25ème rang, cette fois entre l’Iran et les Pays-Bas.

Pour tenter de remédier à cette situation intolérable ;-)), mais surtout pour aider à sensibiliser ma communauté professionnelle aux archives ouvertes et au libre accès en général, et accessoirement pour avoir une première expérience de ce type de tâches, qui devraient émerger dans les profils de postes dans les temps qui viennent, j’ai accepté le rôle d’éditeur pour la France sur E-LIS.

Concrètement ça veut dire 1) Editer les documents avant diffusion : vérifier puis valider les métadonnées, et 2) Promouvoir l’archive et sensibiliser les déposants potentiels aux enjeux du libre accès pour la diffusion des connaissances.

Bref vous risquez d’en entendre parler ici de temps en temps…

Classement des AO

4328edce58cdd3b394a7c6a1a136c92a.jpgL’autre classement des universités (Webometrics ranking of world universities) propose un classement des archives ouvertes : sans surprise Arxiv est à la première place, suivi de RepEc, E-LIS est 3ème, et il y a même une archive française dans le top 10, celle de l’INRIA (Hal-Inria). Fait curieux, nulle part dans ce classement apparaît HAL tout court – ce qui peut sembler troublant pour une archive censée assurer la visibilité de la recherche française – alors que plusieurs de ses « avatars » sont listés (ArchiveSIC, MemSIC par exemple).

Les critères de sélection sont : la visibilité (les liens vers l’archive), la taille (le nombre de pages web), les fichiers enrichis (pdf, ps, doc, ppt) et la présence dans Google Scholar.
[photo : timo]

Le marché du mardi, n°3

715bcc21c709f920531592713ac31e7e.jpgOA & AO
– J’avais trouvé intéressante l’idée d’un blog-compagnon pour une archive ouverte, voici dans le même esprit Da blog, le blog du département des archives numériques gérées par le centre informatique de l’Université de Londres, qui se présente comme un journal de bord des projets auxquelles l’équipe participe.
– On ne le sait pas assez : 91% des revues scientifiques acceptent le dépôt des pré- ou post-prints dans une archive institutionnelle, Romeo dixit.
– la liste des vidéos universitaires sur YouTube d’Open Culture, à laquelle on peut ajouter celles de l’Indian Institute of Technology.

BIBLIO
– Ca ne mange pas de pain : 10 reasons to make your library great in 2008, une série de posts whez Blogjunction. Première résolution : utilisez les technologies, deuxième résolution : formez-vous en continu, à suivre.

DOC ELEC
– les conférences de la Cour de Cass’ en vidéo, assez bluffant, recherche par mot-clés et par jurisprudence, découpage des interventions en séquences linkables (liables ? bref on peut faire un lien dans la séquence vidéo), et tout ça gratuit.
L’Europe en faits et chiffres, pour récupérer vite fait des données sans apprendre par coeur le manuel d’utilisation d’Europa 😉
[credit photo : Eden-lys]

Zotero commons

8dca70c9e0dfebda425ab1b79f39baa5.jpgZotero est, pour faire simple, une extension qui permet de gérer des références bibliographiques depuis le navigateur Firefox (pour plus d’explications, allez voir les gars de l’Urfist, ils sont fans de Zotero). Le Center for history and new media de l’Université George Mason, qui en est à l’initiative, vient d’annoncer un partenariat avec l’Internet Archive, baptisé Zotero Commons. Il s’agit de permettre aux chercheurs, via Zotero, de déposer dans l’Internet Archive, de divers documents : des documents qu’ils auront numérisés, ou bien des documents produits nativement au format numérique ; le stockage et l’OCRisation étant effectués sur les serveurs de l’IA.
Beau projet, qui pose toutefois question sur les relations entre cette archive centralisée et les éventuelles archives institutionnelles locales (tiens, ça me rappelle quelquechose) ; le projet se situant dans un environnement complètement open source, on peut cependant raisonnablement imaginer le développement ultérieur de connecteurs vers les archives locales. Autre écueil, souligné sur son blog Library 2.0 : an academic’s perspective par Laura Cohen, qui regrette que les bibliothèques ne soient pas associées au projet : Zotero Commons : who needs libraries ?. En effet, cet article d’Inside higher education qu’elle commente, affirme que « les projets de numérisation des vastes fonds des bibliothèques ne manquent pas d’ambition, mais les modes d’accès aux documents, ainsi que les questions de copyright sont 2 facteurs qui ont freiné le développement d’archives en ligne. » Cette initiative serait un moyen de « court-circuiter » (to bypass) les bibliothèques, en faisant circuler les documents directement entre chercheurs (tiens, ça me rappelle quelquechose).

C’est en tout cas l’occasion de s’interroger sur le rôle des bibliothèques dans le paysage des Archives Ouvertes, qui doivent encore gagner en légitimité dans la communication scientifique « directe », ainsi que sur leur place dans les institutions universitaires : le fait qu’elles ne soient même pas consultées (et encore moins impliquées) sur les aspects de numérisation en dit long sur la façon dont elles sont perçues par les acteurs (institutionnels, chercheurs) de ce type de projets.
[Photo : Thirteen letters photography]

Mandat de dépôt en Santé

bae6941e63aefa7cb197d7fbefc66d1b.jpgCurieux, comme les termes liés à l’Open Access ressemblent à ceux utilisés par l’institution judiciaire… 😉

Quoi qu’il en soit, ça y est, la proposition de loi américaine a finalement été votée et validée : désormais, tous les chercheurs financés sur fonds publics (par les NIH, l’équivalent de notre INSERM) doivent déposer dans un délai de 12 mois la version finale validée (peer-reviewed) de leurs publications sur PubMed Central, l’archive ouverte spécialisée en santé gérée par la bibliothèque nationale de médecine (NLM). Plus d’infos chez Peter Suber.
[photo : Ngoc Hà]

AO et statistiques

58242281704346dad3682de51453073e.jpgDans ce post sur The ubiquitous librarian, Brian Matthews s’intéresse aux statistiques de consultation des archives ouvertes : il a consulté une dizaine d’archives américaines et regardé quels étaient les taux de téléchargement des documents. Il n’a pas mené une analyse détaillée, mais juste regardé « à la louche » quels étaient les documents les plus consultés. Et constate que, pour toutes les archives, on observe d’une part un phénomène de (très) longue traîne, et d’autre part une grande disparité du nombre de consultations, qui vont de 500 pour un article de l’Université de l’Oregon à plus de 34 000 pour une thèse de l’Université du Maryland.
Il faudrait bien sûr creuser un peu le mode de recueil des stats, vérifier que ce sont bien des consultations qui sont comparées (et pas de simples hits), bref faire quelquechose d’un peu plus scientifique, mais cela donne quand même un aperçu des usages, et permet de se poser quelques questions :
– Quelle est la provenance des visiteurs : une recherche sur Google, Google Scholar, l’OPAC ? – penser à installer un outil d’analyse statistique sur le serveur qui héberge l’archive locale, et se renseigner sur ce qui existe / ce qui est prévu sur HAL ; d’où aussi l’importance de l’interopérabilité et du référencement
– Quel type de document est le plus consulté : les thèses, les articles ? – L’effet de longue traîne joue-t-il sur tous les documents ?
– Finalement, comment estime-t-on que l’archive « marche » : en fonction du nombre de dépôts, certes, mais aussi sans doute en fonction du nombre de connexions – mais à partir de combien de connexions ?
[Crédit photo : Billa]

BibApp

bb99c1cf03d4e23dc7faf35201e55308.jpgDorothea Salo faisait remarquer l’autre jour que l’acte de dépôt dans une archive ouverte est encore trop compliqué, et que l’on passe encore trop de temps à réfléchir aux moyens de remplir l’archive et à saisir des formulaires de métadonnées plutôt que de déposer effectivement des documents dedans. Si l’on y regarde bien, les métadonnées existent déjà dans les bases de données des éditeurs (pour la production scientifique publiée). Alors, ne serait-il pas pratique de pouvoir les récupérer des bases de données pour les réinjecter dans l’archive ouverte de son établissement ? Lorsque je lui en ai parlé, Dorothea m’a rappelé que rares étaient les éditeurs à autoriser le dépôt dans une AO de la version finale publiée des articles (celle qu’on trouve dans les bases de données), et m’a appris qu’Eric Larson et son équipe de la bibliothèque de l’Université de l’Illinois à Urbana-Champaign travaillent à la mise en place de BibApp, un outil qui permet de relier un chercheur aux documents qu’il a publiés dans les revues savantes, charge ensuite au bibliothécaire de valider le dépôt dans l’archive locale. Ca n’est pas très clair dit comme ça, mais la présentation du projet est plus éclairante. Suite au message de Dorothea, un autre bibliothécaire s’est manifesté pour signaler la moulinette qu’il a mise au point pour automatiser les imports de données dans DSpace.


février 2026
L M M J V S D
 1
2345678
9101112131415
16171819202122
232425262728  

Archives

Licence

Licence Creative Commons
Ce(tte) œuvre est mise à disposition selon les termes de la Licence Creative Commons Attribution 3.0 France.