Présentation de PAC, la plateforme d’archivage pérenne du CINES / Olivier Rouchon

4 05 2009

La mission d’archivage confiée au CINES depuis 2004 a vu son importance renforcée depuis 2008 (recadrage de l’institution). C’est dans cette démarche que s’inscrit le service PAC, qui propose à la fois une architecture technique et un soutien psychologique en terme de gestion de projet aux établissements qui souhaitent mettre en place une solution de conservation à long terme (30 ans et +) de leurs données scientifiques, patrimoniales et administratives.

Rappel des risques connus liés aux fichiers informatiques : la corruption physique des données, l’obsolescence des supports et des logiciels… L’objectif du service est de limiter l’impact des ces risques, notamment par le respect de normes (OAIS), la conservation des spécifications des formats employés avec les documents archivés (pour garantir une re-conversion éventuelle)…

PAC fonctionne avec des services « versants », qui collectent les documents et les dépôsent, et se chargent le plus souvent de développer des interfaces de consultation, et ne travaille pas directement avec les producteurs de données (l’ABES est un de ces intermédiaires).

Concrètement, le service gère déjà l’archivage d’un certain nombre de réalisations (Persée), et est partenaire de projets (les thèses dans le cadre de STAR, HAL, les vidéos de Canal-U, des archives sonores dans le cadre du TGE-Adonis…). Une possibilité de dépôt direct depuis ORI-OAI est à l’étude.

Enfin, pour Olivier Rouchon, la conservation devra de plus en plus être intégrée clairement dans le cycle de vie du document : il faut prévoir la constitution d’une version archivable (répondant donc aux normes et formats utilisés par PAC) – cela demande des ressources humaines, il y a donc tout intérêt à mutualiser ce type de service.

Marlène Delhaye.





ORI-OAI pour les Archives Ouvertes / Anne-Claire Bernaudin

4 05 2009

Présentation générale d’ORI-OAI, de la manière dont le logiciel s’est construit collectivement, et des objectifs qui ont prévalu à sa création. Un point important est le fait que ORI-OAI est adapté à plusieurs types de documents numériques (i.e. qu’il permet de gérer par exemple tant les écrits issus de la recherche que les documents d’origine administrative) : ORI-OAI est en mesure de gérer ainsi l’intégralité des archives numériques d’un établissement.
La structure modulaire d’ORI-OAI permet également de l’adapter à la demande et aux besoins de chaque établissement, cette logique modulaire permettant aussi l’alimentation par les acteurs et logiciels déjà existants.

Annonce de la version 1.5.0 à venir, qui intégrera le support TEF, les prochains développements devant également permettre les interfaçages STAR et HAL

ORI-OAI ne s’oppose pas à HAL : le premier est l’outil idéal d’une vitrine institutionnelle, là où  HAL va constituer et sous-tendre une vitrine nationale.

Q/R :

  • Expression de quelques inquiétudes par rapport aux délais de mise à jour & à la disponibilité des versions annoncées

l’équipe ORI/OAI conscience des attentes, fait tout pour respecter les délais.

  • Quid d’une moulinette à venir pour utiliser dans ORI-OAI le référentiel HAL ?

Julien Rault : on retrouve ici le problème des notices autorité déjà ancien et bien connu en bibliothèque.
Intervention dans la salle : c’est un problème politique en fait => toutes les structures de recherche ne sont pas référencées => nécessité d’un pilotage politique pour assainir les choses.
Daniel Charnay = tout le monde attend un référentiel officiel qui risque de tarder donc n’attendons pas et faisons ; Ainsi, le CCSD travaille son référentiel pour qu’il soit aussi propre que possible.
Julien Rault : DAI, qui, quoi, comment = c’est le moment d’insérer la réflexion sur le référentiel.

  • Nouvelle Calédonie : témoignage d’une petite Université : je veux mon archive, qu’est-ce que je fais ?

Diverses réponses autour des avantages HAL vs Ori-OAI

  • Comment rendre son archive institutionnelle visible par les moissonneurs ?

Il faut commencer par se déclarer dans des répertoires. Pour Google, cela se fait facilement du fait de la puissance des moissonneurs Google. C’est plus compliqué dans Google Scholar, le CCSD utilise un <div> avec export des métadonnées.

Daniel Bourrion.





Présentation du logiciel Spire : Sciences Po Institutionnal REpository / Julien Rault

4 05 2009

Spire est le logiciel AO développé par Sciences Po pour faire fonctionner son archive ouverte institutionnelle en remplacement de Dspace actuellement utilisé. Spire a été construit à partir d’un ensemble de briques déjà existantes et éprouvées, et la démonstration effectuée à la toute fin de la présentation montre un outil particulièrement intéressant, dont le passage en OpenSource est prévu dès que possible par Science Po.

Deux interventions à la fin de la présentation : Geneviève Gourdet fait remarquer que les outils se diversifient ; interagissent ; et qu’en conséquence, une plateforme à pilotage partagé doit donc apparaître (ce qui représenterait de plus un geste politique permettant de donner plus d’ampleur aux mouvements des AO en France).
Par ailleurs, une personne dans la salle demande à quel point les outils SPIRE et ORI-OAI pourraient se rapprocher, du point de vue technique. En l’espèce, rien n’est en cours, mais rien ne s’y oppose.

Daniel Bourrion.

Ecouter Julien Rault





Présentation du profil d’application / Anne-Claire Bernaudin et Emilie Romand-Monnier

4 05 2009

Basé sur les travaux de GTAO groupe Métadonnées, ce travail a abouti à la construction d’un modèle d’application spécifique respectant le coeur de métadonnées de HAL, et après qu’une série de besoins particuliers aient été identifiés au préalable. Le point de départ est un profil d’application Dublin Core (ledit Dublin Core s’étant révélé trop limité en tant que tel).
Anne-Claire Bernaudin présente ensuite les grands principes sur lesquels repose le DCMI-AM, modèle abstrait qui apporte au Dublin Core de quoi gérer des entités complexes.

Daniel Bourrion

Ecouter Anne-Claire Bernaudin et Emilie Romand Monnier





Présentation des potentialités de HAL pour les établissements souhaitant se doter d’une archive ouverte / Angel Alastuey et Daniel Charnay

4 05 2009

La présentation de la nouvelle organisation du CCSD par Angel Alastuey est l’occasion de rappeler les objectifs de HAL, sa volonté pluridisciplinaire. Un comité de pilotage (CPAO) pilote HAL (le CCSD en reste l’opérateur), il est composé surtout de scientifiques, pas d’institutionnels (sauf les responsables du CCSD) ; il est mandaté pour mener des actions concrètes de sensibilisation des chercheurs, organiser la validation scientifique (modération de HAL : actuellement, seul un contrôle sommaire des documents est effectué, les scientifiques du CPAO vont garantir la validité scientifique de ce qui est déposé), faire le lien avec les autres acteurs de l’IST : mettre HAL au service des établissements et de ses partenaires en leur proposant plus d’interactivité, pour que HAL soit plus qu’un simple dépôt.

Avoir une AO sans budget, c’est possible ! C’est du moins ce que s’est attaché à montrer Daniel Charnay, qui a décrit les différentes possibilités proposées aux établissements, en fonction de leurs besoins :

  • Une collection sur HAL : permet de présenter une sélection de documents (ceux déposés par un établissement spécifique par exemple – cela peut s’appliquer à plusieurs établissements aussi, ce qui intéressera les PRES), avec une personnalisation basique du graphisme. La notion de collection est également adaptée pour regrouper des actes de colloques, de congrès, voire constituer des épi-journaux.
  • Un portail sur HAL : idem que la collection, avec des fonctions supplémentaires :
    ⁃    intégration d’un modèle de données spécifique à un établissement, identification spécifique des documents
    ⁃    intégration d’une nomenclature spécifique (pour affiner un domaine), d’une typologie particulière, d’un thésaurus
  • ⁃    plus grande personnalisation, utilisation d’un nom de domaine propre (l’identité de l’établissement est préservée)

La vue portail n’affiche que les docs ayant été entrés via le portail, pas ceux entrés sur HAL général, contrairement à la vue collection qui affiche tout ce  qui a été rentré. Un backup automatique quotidien est assuré par le CINES.

  • Mise en place d’une extension LocHAL pour stocker ce qui n’est pas éligible dans HAL, selon sa propre typologie (mais toujours pour des documents scientifiques uniquement), ce qui permet un affichage de la totalité de la prod scientifique (rapports, posters…). Cette solution peut être payante pour financer le coût de stockage.
  • Archives hébergées : il s’agit d’archives hors-HAL mais qui utilisent les mêmes technologies (HAL-SFO, DUMAS…)

De plus en plus, HAL va chercher les interconnexions avec d’autres applications : SIGB commerciaux, GRAAL, STAR (le système va utiliser les webservices de HAL pour déposer les thèses dans TEL). Dans le cas où le doctorant dépose dans TEL avant : la thèse de STAR sera identifiée comme la thèse officielle mais l’autre ne sera pas supprimée), PASTEL (dépôt de la production scientifique des grandes écoles, en cours), AIGLE (outil de gestion des publis).
Les perspectives et projets sont nombreux et variés :
⁃    Utilisation de la chaîne d’archivage pérenne du CINES
⁃    Archive multimédia (avec le TGE-Adonis) : photos scientifiques
⁃    Solution de gestion de congrès (infrastructure informatique)
⁃    Sherpa-Romeo français, le CCSD se positionne comme opérateur.

Des questions restent cependant à approfondir, notamment juridiques, mais ausi techniques :

⁃    Sur les possibilités de retrait de ce qui a été déposé : pas de retrait possible sur HAL a priori sauf dans de rares cas, mais cela serait en contradiction avec le droit de retrait de l’auteur

⁃    Sur le contexte juridique du dépôt : est-il encadré par un contrat, ou une licence ? Actuellement c’est une licence HAL qui prévaut, il faudrait sans doute étudier la question des licences Creative Commons.

⁃    Sur les possibilités d’assistance au dépôt, i.e. de versement des références par HAL dans des bases de données bibliographiques. Le système fonctionne pour Pubmed et ArXiv, il est à l’étude avec les bases du Web of Science. Un test est également en cours avec l’INRIA pour l’extraction des métadonnées depuis le texte intégral. On pourrait aussi envisager des connexions vers les outils de gestion des références bibliographiques (formats BibteX, RIS…), ou une API XML pour afficher les données n’importe où..

Marlène Delhaye.

Ecouter Angel Alastuey et Daniel Charnay





GTAO : les travaux du groupe Métadonnées / Jean-François Lutz

4 05 2009

Après un bref retour sur la constitution du groupe de travail « Métadonnées » au sein du GTAO, Jean-François Lutz a présenté les travaux et réflexions menés par le groupe :

Le travail sur la chaîne des AO à partir de la relecture du coeur de métadonnées de HAL a permis d’élargir la réflexion sur les interactions entre HAL et systèmes locaux :  quels sont les besoins des systèmes locaux, au-delà de ce cœur de métadonnées, qui pourraient y être intégrés ? L’étude de différentes solutions mises en oeuvre à l’étranger (notamment UKOLN) a nourri cette réflexion, qui a abouti au profil d’applications AI-HAL.

Le groupe s’est également intéressé à la question de l’archivage pérenne : c’est un sujet crucial et central, une problématique qui dépasse les seuls bibliothécaires ou documentalistes et intéresse aussi les enseignants-chercheurs, notamment en ce qui concerne les thèses (ou les documents n’entrant pas dans la politique éditoriale de HAL). Elle fait cependant  entrer en jeu des technologies qui dépassent le cadre d’un établissement, et doit se penser au niveau national.

Globalement, les membres du groupe ont pu constater plusieurs choses :

– une archive ouverte est d’abord un enjeu politique : la nécessité d’une politique d’établissement est essentielle pour la réussite de ce type de projet, et le travail de communication et de sensibilisation vers les communautés prime sur les aspects techniques.

– plusieurs niveaux d’archives ouvertes peuvent cohabiter en complémentarité (archive locale et archive thématique) ; les technologies permettent une certaine variété de solutions, comme par exemple le moissonnage d’archives pluridisciplinaires par des moteurs disciplinaires

– on s’oriente vers une plus grande ergonomie des systèmes, dans un souci de faciliter les choses pour le déposant : preuve en est le développement de standards de webservices, qui permettent notamment le dépôt depuis les outils de traitement de textes (SWORD).

Marlène Delhaye.

Ecouter Jean-François Lutz





Conclusion de la journée / Jean-Claude Guédon

19 04 2009

3449695676_02d8a37d35_m

En conclusion de cette première journée, Jean-Claude Guédon  :

– se demande pourquoi les actions françaises ne sont pas plus visibles au niveau international alors que les choses bougent en France sur les AO ? Il exprime son sentiment que les institutions & bibliothèques françaises ne communiquent pas assez entre elles, et vers l’extérieur ; et plaide pour des mises en réseaux dans toutes les directions

– rappelle que les chercheurs ont les clés du succès des AO. Dans cette logique, il faut essayer toujours de capter en premier des chercheurs locomotives et très visibles qui apporteront caution aux AO et y entraîneront les autres. Partant de Cream of Science, il lance l’idée d’un « concours » qui distinguerait les 200 plus grands chercheurs et déposerait leurs articles en AO, avec l’effet d’entraînement (Narcisse toujours) que cela pourrait créer.

– et termine en plaidant pour une philosophie du réseau, qui fasse jouer concurrence et collaboration dans l’excellence.

Daniel Bourrion.

Ecouter Jean-Claude Guédon








Suivre

Recevez les nouvelles publications par mail.