Dans ce post sur The ubiquitous librarian, Brian Matthews s’intéresse aux statistiques de consultation des archives ouvertes : il a consulté une dizaine d’archives américaines et regardé quels étaient les taux de téléchargement des documents. Il n’a pas mené une analyse détaillée, mais juste regardé « à la louche » quels étaient les documents les plus consultés. Et constate que, pour toutes les archives, on observe d’une part un phénomène de (très) longue traîne, et d’autre part une grande disparité du nombre de consultations, qui vont de 500 pour un article de l’Université de l’Oregon à plus de 34 000 pour une thèse de l’Université du Maryland.
Il faudrait bien sûr creuser un peu le mode de recueil des stats, vérifier que ce sont bien des consultations qui sont comparées (et pas de simples hits), bref faire quelquechose d’un peu plus scientifique, mais cela donne quand même un aperçu des usages, et permet de se poser quelques questions :
– Quelle est la provenance des visiteurs : une recherche sur Google, Google Scholar, l’OPAC ? – penser à installer un outil d’analyse statistique sur le serveur qui héberge l’archive locale, et se renseigner sur ce qui existe / ce qui est prévu sur HAL ; d’où aussi l’importance de l’interopérabilité et du référencement
– Quel type de document est le plus consulté : les thèses, les articles ? – L’effet de longue traîne joue-t-il sur tous les documents ?
– Finalement, comment estime-t-on que l’archive « marche » : en fonction du nombre de dépôts, certes, mais aussi sans doute en fonction du nombre de connexions – mais à partir de combien de connexions ?
[Crédit photo : Billa]
Ah ! Merci Marlene de suggérer qu’on souhaite en savoir plus sur l’usage des dépôts ?