Stockage pour les laboratoires : quels besoins pour quelles solutions

Pourquoi ?

Le stockage de données numériques et, par extension, leur sauvegarde et leur archivage, est une préoccupation majeure de nos établissements : ces données forment, de fait, les actifs primordiaux que la sécurité des systèmes d'information se doit de préserver.

L'objectif est donc de proposer :
  • la base d'une enquête composée de questionnaires
  • des éléments d'analyse permettant de compléter l'expression des besoins
  • un ensemble de spécifications fonctionnelles et mêmes techniques
  • des éléments d'intégration permettant de satisfaire le cahier des charges

Contexte

L'explosion des volumes de données (concommitante à l'amélioration des technologies d'expérimentation et de traitement), leur impératif de diffusion (via des bases de données dédiées directement accessibles en ligne), ont développé des exigences telles qu'il devient très difficile de gérer cela sereinement au sein de l'entité productrice : le laboratoire voire l'établissement.

De plus, face à des besoins souvent très spécifiques, conditionnés par les expériences elles-même ou leur traitement, les solutions classiques apportées par les services centraux demeurent parfois inadaptées.

Les éléments suivants présentent la démarche suivie ces deux dernières années à l'Ecole Normale Supérieure de Lyon pour une rationalisation de ces problématiques de stockage.

Analyse

En cours de construction à partir des rapports.

Quelques spécifications fonctionnelles extraites

Pour le stockage

Pour le « front office » (le « salon », une affaire d'utilisateurs et leur appropriation des outils) :
  • une gestion fine de l'accès aux données :
    • droits des utilisateurs pour les accès en écriture à partir des postes de manipulation,
    • droits des utilisateurs pour les accès en lecture à partir des postes de traitement,
    • droits pour les responsables de ces utilisateurs d'accéder à leurs données après leur départ ;
  • une accessibilité des données dépassant le cadre du laboratoire :
    • espace accessible de l'extérieur de manière simple et sécurisée ;
  • une indexation indispensable des expériences et des traitements pour assurer la pérennité des données ;
  • une mise en place de plates-formes de traitements dédiées et partagées entre les utilisateurs ;
  • une abstraction des volumes de stockage, la plus transparente possible, des « boîtes noires » utilisées ;
  • une mise à disposition rapide pour faire face aux demandes urgentes et limiter le risque de perte par casse ;
Pour le « back-office » (la « cuisine », une affaire d'informaticiens et la mise à disposition des outils) :
  • une amélioration des conditions de transfert des données entre plates-formes (de l'expérience à son traitement)
  • notamment par la généralisation d'une connectivité haut débit (GE minimum) ;
  • une disponibilité accrue des dispositifs de stockage (pour les expériences durant le plus longtemps) ;
  • une souscription la plus large possible du contrat de maintenance ;
  • des procédures simplifiées pour la mise à disposition ou l'extension d'un volume de stockage ;
  • des procédures simplifiées pour la restauration d'un volume de stockage ;
  • une « scalabilité » de la solution de stockage pour l'étendre chaque année en fonction des besoins.

Pour la sauvegarde

Cette opération est purement informatique : elle vise à sauvegarder les données (et permettre leur restauration) en cas
de destruction d'un élément (ou plusieurs) du stockage.

Dans le cas idéal, elle exige :
  • une séparation physique du stockage primaire ;
  • une représentation la plus synchrone possible des données originelles.

Pour l'archivage

Cette opération, pour être la plus efficace possible, se base sur les informations mentionnées par les utilisateurs dans
l'indexation de leurs données.

Deux approches sont possibles :
  • un archivage basé sur le stockage originel ;
  • un archivage basé sur la sauvegarde.
Dans les deux cas, les archives peuvent prendre la forme :
  • d'une série d'instantanés pris suivant une politique pré-établie : elle est alors intégrée à la solution de stockage ;
  • une copie complète sur un support tierce, archivée physiquement : elle utilise généralement une technologie à base de supports à accès séquentiels, comme les bandes.