Présentation de PAC, la plateforme d’archivage pérenne du CINES / Olivier Rouchon

4 05 2009

La mission d’archivage confiée au CINES depuis 2004 a vu son importance renforcée depuis 2008 (recadrage de l’institution). C’est dans cette démarche que s’inscrit le service PAC, qui propose à la fois une architecture technique et un soutien psychologique en terme de gestion de projet aux établissements qui souhaitent mettre en place une solution de conservation à long terme (30 ans et +) de leurs données scientifiques, patrimoniales et administratives.

Rappel des risques connus liés aux fichiers informatiques : la corruption physique des données, l’obsolescence des supports et des logiciels… L’objectif du service est de limiter l’impact des ces risques, notamment par le respect de normes (OAIS), la conservation des spécifications des formats employés avec les documents archivés (pour garantir une re-conversion éventuelle)…

PAC fonctionne avec des services « versants », qui collectent les documents et les dépôsent, et se chargent le plus souvent de développer des interfaces de consultation, et ne travaille pas directement avec les producteurs de données (l’ABES est un de ces intermédiaires).

Concrètement, le service gère déjà l’archivage d’un certain nombre de réalisations (Persée), et est partenaire de projets (les thèses dans le cadre de STAR, HAL, les vidéos de Canal-U, des archives sonores dans le cadre du TGE-Adonis…). Une possibilité de dépôt direct depuis ORI-OAI est à l’étude.

Enfin, pour Olivier Rouchon, la conservation devra de plus en plus être intégrée clairement dans le cycle de vie du document : il faut prévoir la constitution d’une version archivable (répondant donc aux normes et formats utilisés par PAC) – cela demande des ressources humaines, il y a donc tout intérêt à mutualiser ce type de service.

Marlène Delhaye.





ORI-OAI pour les Archives Ouvertes / Anne-Claire Bernaudin

4 05 2009

Présentation générale d’ORI-OAI, de la manière dont le logiciel s’est construit collectivement, et des objectifs qui ont prévalu à sa création. Un point important est le fait que ORI-OAI est adapté à plusieurs types de documents numériques (i.e. qu’il permet de gérer par exemple tant les écrits issus de la recherche que les documents d’origine administrative) : ORI-OAI est en mesure de gérer ainsi l’intégralité des archives numériques d’un établissement.
La structure modulaire d’ORI-OAI permet également de l’adapter à la demande et aux besoins de chaque établissement, cette logique modulaire permettant aussi l’alimentation par les acteurs et logiciels déjà existants.

Annonce de la version 1.5.0 à venir, qui intégrera le support TEF, les prochains développements devant également permettre les interfaçages STAR et HAL

ORI-OAI ne s’oppose pas à HAL : le premier est l’outil idéal d’une vitrine institutionnelle, là où  HAL va constituer et sous-tendre une vitrine nationale.

Q/R :

  • Expression de quelques inquiétudes par rapport aux délais de mise à jour & à la disponibilité des versions annoncées

l’équipe ORI/OAI conscience des attentes, fait tout pour respecter les délais.

  • Quid d’une moulinette à venir pour utiliser dans ORI-OAI le référentiel HAL ?

Julien Rault : on retrouve ici le problème des notices autorité déjà ancien et bien connu en bibliothèque.
Intervention dans la salle : c’est un problème politique en fait => toutes les structures de recherche ne sont pas référencées => nécessité d’un pilotage politique pour assainir les choses.
Daniel Charnay = tout le monde attend un référentiel officiel qui risque de tarder donc n’attendons pas et faisons ; Ainsi, le CCSD travaille son référentiel pour qu’il soit aussi propre que possible.
Julien Rault : DAI, qui, quoi, comment = c’est le moment d’insérer la réflexion sur le référentiel.

  • Nouvelle Calédonie : témoignage d’une petite Université : je veux mon archive, qu’est-ce que je fais ?

Diverses réponses autour des avantages HAL vs Ori-OAI

  • Comment rendre son archive institutionnelle visible par les moissonneurs ?

Il faut commencer par se déclarer dans des répertoires. Pour Google, cela se fait facilement du fait de la puissance des moissonneurs Google. C’est plus compliqué dans Google Scholar, le CCSD utilise un <div> avec export des métadonnées.

Daniel Bourrion.





Présentation du logiciel Spire : Sciences Po Institutionnal REpository / Julien Rault

4 05 2009

Spire est le logiciel AO développé par Sciences Po pour faire fonctionner son archive ouverte institutionnelle en remplacement de Dspace actuellement utilisé. Spire a été construit à partir d’un ensemble de briques déjà existantes et éprouvées, et la démonstration effectuée à la toute fin de la présentation montre un outil particulièrement intéressant, dont le passage en OpenSource est prévu dès que possible par Science Po.

Deux interventions à la fin de la présentation : Geneviève Gourdet fait remarquer que les outils se diversifient ; interagissent ; et qu’en conséquence, une plateforme à pilotage partagé doit donc apparaître (ce qui représenterait de plus un geste politique permettant de donner plus d’ampleur aux mouvements des AO en France).
Par ailleurs, une personne dans la salle demande à quel point les outils SPIRE et ORI-OAI pourraient se rapprocher, du point de vue technique. En l’espèce, rien n’est en cours, mais rien ne s’y oppose.

Daniel Bourrion.

Ecouter Julien Rault





Présentation du profil d’application / Anne-Claire Bernaudin et Emilie Romand-Monnier

4 05 2009

Basé sur les travaux de GTAO groupe Métadonnées, ce travail a abouti à la construction d’un modèle d’application spécifique respectant le coeur de métadonnées de HAL, et après qu’une série de besoins particuliers aient été identifiés au préalable. Le point de départ est un profil d’application Dublin Core (ledit Dublin Core s’étant révélé trop limité en tant que tel).
Anne-Claire Bernaudin présente ensuite les grands principes sur lesquels repose le DCMI-AM, modèle abstrait qui apporte au Dublin Core de quoi gérer des entités complexes.

Daniel Bourrion

Ecouter Anne-Claire Bernaudin et Emilie Romand Monnier





Présentation des potentialités de HAL pour les établissements souhaitant se doter d’une archive ouverte / Angel Alastuey et Daniel Charnay

4 05 2009

La présentation de la nouvelle organisation du CCSD par Angel Alastuey est l’occasion de rappeler les objectifs de HAL, sa volonté pluridisciplinaire. Un comité de pilotage (CPAO) pilote HAL (le CCSD en reste l’opérateur), il est composé surtout de scientifiques, pas d’institutionnels (sauf les responsables du CCSD) ; il est mandaté pour mener des actions concrètes de sensibilisation des chercheurs, organiser la validation scientifique (modération de HAL : actuellement, seul un contrôle sommaire des documents est effectué, les scientifiques du CPAO vont garantir la validité scientifique de ce qui est déposé), faire le lien avec les autres acteurs de l’IST : mettre HAL au service des établissements et de ses partenaires en leur proposant plus d’interactivité, pour que HAL soit plus qu’un simple dépôt.

Avoir une AO sans budget, c’est possible ! C’est du moins ce que s’est attaché à montrer Daniel Charnay, qui a décrit les différentes possibilités proposées aux établissements, en fonction de leurs besoins :

  • Une collection sur HAL : permet de présenter une sélection de documents (ceux déposés par un établissement spécifique par exemple – cela peut s’appliquer à plusieurs établissements aussi, ce qui intéressera les PRES), avec une personnalisation basique du graphisme. La notion de collection est également adaptée pour regrouper des actes de colloques, de congrès, voire constituer des épi-journaux.
  • Un portail sur HAL : idem que la collection, avec des fonctions supplémentaires :
    ⁃    intégration d’un modèle de données spécifique à un établissement, identification spécifique des documents
    ⁃    intégration d’une nomenclature spécifique (pour affiner un domaine), d’une typologie particulière, d’un thésaurus
  • ⁃    plus grande personnalisation, utilisation d’un nom de domaine propre (l’identité de l’établissement est préservée)

La vue portail n’affiche que les docs ayant été entrés via le portail, pas ceux entrés sur HAL général, contrairement à la vue collection qui affiche tout ce  qui a été rentré. Un backup automatique quotidien est assuré par le CINES.

  • Mise en place d’une extension LocHAL pour stocker ce qui n’est pas éligible dans HAL, selon sa propre typologie (mais toujours pour des documents scientifiques uniquement), ce qui permet un affichage de la totalité de la prod scientifique (rapports, posters…). Cette solution peut être payante pour financer le coût de stockage.
  • Archives hébergées : il s’agit d’archives hors-HAL mais qui utilisent les mêmes technologies (HAL-SFO, DUMAS…)

De plus en plus, HAL va chercher les interconnexions avec d’autres applications : SIGB commerciaux, GRAAL, STAR (le système va utiliser les webservices de HAL pour déposer les thèses dans TEL). Dans le cas où le doctorant dépose dans TEL avant : la thèse de STAR sera identifiée comme la thèse officielle mais l’autre ne sera pas supprimée), PASTEL (dépôt de la production scientifique des grandes écoles, en cours), AIGLE (outil de gestion des publis).
Les perspectives et projets sont nombreux et variés :
⁃    Utilisation de la chaîne d’archivage pérenne du CINES
⁃    Archive multimédia (avec le TGE-Adonis) : photos scientifiques
⁃    Solution de gestion de congrès (infrastructure informatique)
⁃    Sherpa-Romeo français, le CCSD se positionne comme opérateur.

Des questions restent cependant à approfondir, notamment juridiques, mais ausi techniques :

⁃    Sur les possibilités de retrait de ce qui a été déposé : pas de retrait possible sur HAL a priori sauf dans de rares cas, mais cela serait en contradiction avec le droit de retrait de l’auteur

⁃    Sur le contexte juridique du dépôt : est-il encadré par un contrat, ou une licence ? Actuellement c’est une licence HAL qui prévaut, il faudrait sans doute étudier la question des licences Creative Commons.

⁃    Sur les possibilités d’assistance au dépôt, i.e. de versement des références par HAL dans des bases de données bibliographiques. Le système fonctionne pour Pubmed et ArXiv, il est à l’étude avec les bases du Web of Science. Un test est également en cours avec l’INRIA pour l’extraction des métadonnées depuis le texte intégral. On pourrait aussi envisager des connexions vers les outils de gestion des références bibliographiques (formats BibteX, RIS…), ou une API XML pour afficher les données n’importe où..

Marlène Delhaye.

Ecouter Angel Alastuey et Daniel Charnay





GTAO : les travaux du groupe Métadonnées / Jean-François Lutz

4 05 2009

Après un bref retour sur la constitution du groupe de travail « Métadonnées » au sein du GTAO, Jean-François Lutz a présenté les travaux et réflexions menés par le groupe :

Le travail sur la chaîne des AO à partir de la relecture du coeur de métadonnées de HAL a permis d’élargir la réflexion sur les interactions entre HAL et systèmes locaux :  quels sont les besoins des systèmes locaux, au-delà de ce cœur de métadonnées, qui pourraient y être intégrés ? L’étude de différentes solutions mises en oeuvre à l’étranger (notamment UKOLN) a nourri cette réflexion, qui a abouti au profil d’applications AI-HAL.

Le groupe s’est également intéressé à la question de l’archivage pérenne : c’est un sujet crucial et central, une problématique qui dépasse les seuls bibliothécaires ou documentalistes et intéresse aussi les enseignants-chercheurs, notamment en ce qui concerne les thèses (ou les documents n’entrant pas dans la politique éditoriale de HAL). Elle fait cependant  entrer en jeu des technologies qui dépassent le cadre d’un établissement, et doit se penser au niveau national.

Globalement, les membres du groupe ont pu constater plusieurs choses :

– une archive ouverte est d’abord un enjeu politique : la nécessité d’une politique d’établissement est essentielle pour la réussite de ce type de projet, et le travail de communication et de sensibilisation vers les communautés prime sur les aspects techniques.

– plusieurs niveaux d’archives ouvertes peuvent cohabiter en complémentarité (archive locale et archive thématique) ; les technologies permettent une certaine variété de solutions, comme par exemple le moissonnage d’archives pluridisciplinaires par des moteurs disciplinaires

– on s’oriente vers une plus grande ergonomie des systèmes, dans un souci de faciliter les choses pour le déposant : preuve en est le développement de standards de webservices, qui permettent notamment le dépôt depuis les outils de traitement de textes (SWORD).

Marlène Delhaye.

Ecouter Jean-François Lutz





Conclusion de la journée / Jean-Claude Guédon

19 04 2009

3449695676_02d8a37d35_m

En conclusion de cette première journée, Jean-Claude Guédon  :

– se demande pourquoi les actions françaises ne sont pas plus visibles au niveau international alors que les choses bougent en France sur les AO ? Il exprime son sentiment que les institutions & bibliothèques françaises ne communiquent pas assez entre elles, et vers l’extérieur ; et plaide pour des mises en réseaux dans toutes les directions

– rappelle que les chercheurs ont les clés du succès des AO. Dans cette logique, il faut essayer toujours de capter en premier des chercheurs locomotives et très visibles qui apporteront caution aux AO et y entraîneront les autres. Partant de Cream of Science, il lance l’idée d’un « concours » qui distinguerait les 200 plus grands chercheurs et déposerait leurs articles en AO, avec l’effet d’entraînement (Narcisse toujours) que cela pourrait créer.

– et termine en plaidant pour une philosophie du réseau, qui fasse jouer concurrence et collaboration dans l’excellence.

Daniel Bourrion.

Ecouter Jean-Claude Guédon





Du côté des éditeurs

19 04 2009

Les éditeurs ont évolué sur les archives ouvertes au fur et à mesure de la progression de celles-ci dans les pratiques des chercheurs. Et le besoin d’un outil de référencement des politiques éditoriales en matière d’auto-archivage s’est vite fait sentir, besoin comblé par la création du répertoire Romeo/Sherpa, qui recense à l’heure actuelle plus de 500 éditeurs internationaux. Les éditeurs non anglophones sont toutefois peu voire pas représentés, ce qui a incité certains bibliothécaires et chercheurs européens à lancer d’autre répertoires, spécifiques à leur propre langue (par exemple Dulcinea pour les titres en espagnol – 255 titres). Jérôme Kalfon a souligné qu’il est vrai que cela aurait en France  l’avantage, outre le fait d’informer les auteurs, de nous permettre d’interpeller les éditeurs français sur ces questions d’autoarchivage et de libre accès, de les obliger à se positionner, à sortir du flou artistique actuel.

Mais pourquoi diable refaire ici ce qui fonctionne déjà très bien ailleurs ? C’est la question qui n’a pas manqué de se poser dans la salle. De fait, la forme que pourrait prendre le projet n’est pas vraiment définie ;  il n’est pas forcément question de faire un autre Romeo, et plusieurs pistes peuvent être envisagées : un site miroir, une « franchise nationale » (à l’étude en Allemagne) … en tous les cas une adaptation du Romeo traditionnel aux contextes linguistiques et aux contraintes locales, qui aurait une légitimité pour les éditeurs comme pour les auteurs. L’erreur serait de bâtir un projet biblio-centré, échec assuré.

Springer s’est positionné sur la question, et propose l’option Open choice, qui permet aux auteurs de diffuser leurs articles en libre accès, moyennant le paiement d’une redevance de l’ordre de 3000 euros (généralement payés par le laboratoire). Ce modèle dit « auteur-payeur » ne rencontre pas un franc succès, si l’on en croit les chiffres annoncés par Philippe Peyle, représentant de Springer en France, puisque seuls 55 des plus de 100 000 articles publiés par Springer en bénéficient. Mais il semble néanmoins avoir essaimé parmi les autres éditeurs (Oxford Open récemment, mais aussi Cambridge, Elsevier, Wiley…) ; du coup on peut se demander si ce modèle hybride n’est pas plus une opération de marketing pour gommer la mauvaise image des éditeurs commerciaux… mais je m’égare. Le système, dès lors qu’il fait entrer en jeu un paiement plus ou moins « direct », semble moins bien accueilli par le lectorat que lorsqu’il est complètement libre, comme le montre la croissance constante du DOAJ, le répertoire des revues en open access, qui vient de passer la barre des 4000 titres. Les contenus déposables dans une archive ouverte varient également d’un éditeur à l’autre ; Springer autorise le dépôt de la copie des  articles validés, qui peuvent être diffusés sur le site de l’institution sous condition d’un lien actif et proéminent vers l’article miroir sur la plateforme de l’éditeur.

Marlène Delhaye.

Ecouter Philippe Peyle

Ecouter Jérôme Kalfon





GTAO, le « Zoom établissements » : Table-ronde / Marie-Luce Rauzy ; Silvio Carella ; Jean-Marie Le Béchec

19 04 2009

(Après un tour de table de présentation des divers intervenants,
impliqués dans trois projets sur lesquels le GTAO met le focus,
échanges de questions/réponses avec la salle)

  • Question de J. C. Guédon : demande si des liens ont été noués avec PKP ou autre ; évoque Scielo, OJS, l’outil de PKP, qui pourrait être intéressant.

S. Carella n’est pas certain que l’outil soit utilisable en tant que tel du fait des particularités dans chaque discipline. J.C. Guédon pense qu’il faut entrer dans les projets pour les faire évoluer dans la direction des besoins. M.L. Rauzy  rappelle alors les divers contacts qui ont été pris au long du projet de Nice, en particulier Erudit& Lodel.

  • Question C. Bruley : Constitution des équipes-projets, coûts ?

J.M. Le Béchec précise que le budget en tant que tel n’est pas très important (outils libres, etc. ou déporté vers autres services – DSI) mais rappelle l’importance des moyens humains. 100 thèses/an = un BAS ETP. S. Carella revient sur la question des RH : il faut des moyens humains ‘constants’ pour faire tourner ces outils et maintenir le service (technique, formation, etc.). M.L. Rauzy donne le chiffre de 120 000 euros sur BQR contrat 2002/2006 avec RH contractuels & 1,5 ETP dans le SCD. Là encore, deux questions se posent : quelle pérénnité, quelle mutualisation ? L. Klee intervient pour souligner le soutien fort de la présidence (création d’un poste IGE)

  • Question : quid de l’intégration dans les politiques d’établissement ?

J.M. Le Béchec : projet mis au contrat quadriennal, forte visibilité des projets au sein de l’établissement ; même chose pour S. Carella et M.L. Rauzy

  • Question : Quelle a été la position des chercheurs au local ?

J.M. Le Béchec souligne l’importance de la formation et de l’information, de l’approche des chercheurs, des labos, etc… et la nécessité de préparer des argumentaires et des réponses (droit d’auteur, etc.) pour montrer comment l’AO peut servir le chercheur. Il faut discuter, expliquer, faire que le dépôt en AO devienne autre chose qu’une contrainte. S. Carella met en avant l’importance d’une offre de services et de « gadgets » (module d’aide à la gestion de colloques) autour de l’outil pour le rendre intéressant et utile au quotidien pour le chercheur. Il faut travailler aussi l’ergonomie, limiter la saisie à une saisie unique.

  • SCD Limoges : quid du cas où les administratifs déposent ?

J.M. Le Béchec répond que les dépôts sont effectués parfois par des moniteurs mais que cela importe peu s’il y a validation ultérieure par un professionnel de l’information afin d’assurer la qualité. Pour S. Carella, l’impossibilité de trouver des RH au SCD induit que le dépôt se fait nécessairement par des « non-professionnels », ce qui est d’ailleurs l’un des principes des AO (auto-archivage). Par ailleurs, le système SYMPA est en train de modifier les choses puisque le chercheur publiant est impliqué par le système au niveau de l’allocation de ses moyens.

S. Maloteaux prend également la parole pour souligner la nécessité d’une communication permanente vers les labos, les chercheurs, les instances. Et pour rappeler que la formation importe, d’autant qu’elle est un investissement à long terme.

Daniel Bourrion.

Ecouter la table ronde





GTAO, le “Zoom établissements” : Résultats de l’enquête / Caroline Bruley

19 04 2009

Le zoom est destiné à obtenir des données qualitatives par « opposition » avec l’enquête quantitative (qu’il conviendrait de reconduire régulièrement pour qu’elle puisse servir d’indicateur) menée par ailleurs par le GTAO, qui a montré que le tiers des établissements ont un projet AO en cours, mais que les dépôts restent assez peu satisfaisants.

Trois projets ont été ainsi détaillés afin d’essayer de déterminer leurs particularités. Les points de convergence des trois zooms sont :

  • La présence d’un ou deux services locomotives (rôle central des SCD souvent mais aussi Service Recherche et/ou CRI)
  • Une méthodologie de projet, avec réflexion préalable ou mise en place rapide puis ajustements à mesure
  • Une évolutivité/réactivité, tant politique que technique.

Daniel Bourrion.

Ecouter Caroline Bruley