Pôle données

Le pôle données est en charge des environnements de stockage, d’accès aux données, de diffusion et de partage. Il est en appui aux équipes scientifiques sur tout le cycle de vie de la donnée (création, stockage, traitement et analyse, sauvegarde, diffusion, réutilisation), en fonction du contexte des projets scientifiques et en lien avec les personnels des laboratoires.
Pour remplir ces missions, un des objectif du pôle données est aussi de créer des synergies autour du partage de données produites/utilisées par/dans différentes disciplines et différents laboratoires de recherche. Il est en appui pour le montage de projets ou d’actions transdisciplinaires et trans laboratoire. Pour cela, il vise à la mutualisation d’hébergement de données de grand référentiel (géographiques, satellites, biologiques...) et fourni des plate-formes de diffusion de jeux de données scientifiques accompagnées de leurs métadonnées.
Sur un plan organisationnel, le pôle données est organisé autour d'un modèle fédératif qui abordent 4 axes de travail :

  1. Axe 1 : Confidentialité, innovation juridique, sécurité
    Cet axe devrait travailler sur les questions qui touchent à l’acquisition des données, la sécurisation d’accès, l’anonymisation, données ouvertes, … Un apport prospectif sur des aspects juridiques lié aux évolutions nécessaires pour ces nouveaux « modes de travail », ont du sens pour ce groupe.
  2. Axe 2 : Qualité, traçabilité, cycle de vie
    À ce niveau, il s’agit de travailler sur les aspects nettoyage de données, traçabilité à différentes fins (entre autre reproductibilité et justification pour publication) en lien avec les plans de gestion de données existants au niveau de différentes disciplines.
  3. Axe 3 : Traitements / Portail
    Sur cet axe, la question s’est posée de savoir s’il s’agissait d’un axe ou de deux. Il est nécessaire de retravailler ce point dans une première réunion et de trancher la question. En fonction de la taille des groupes, plusieurs sous-groupes peuvent émerger. C’est ce niveau qui devrait émerger des besoins en plateforme technique permettant des expérimentations de traitements. Devront être abordés les questions :
  • Pour le traitement : plates-formes expérimentales, environnement de tests, technologies BDD et SIG, outils statistiques, spécificités des enquêtes, traitement de données massives du Web.
  • Pour le portail : requêtage, présentation sélective (dont accès qui se recoupe avec l’axe 1), valorisation des données.
  1. Axe 4 : Liens entre briques d’infrastructures
    Sur cet axe technique, il s’agit de travailler sur les évolutions nécessaires des infrastructures pour prendre en compte la dimension du traitement de la donnée. Il s’agit de voir quelles sont les infrastructures en place (CIMENT, SUMMER, VM-WARE, infrastructures labos ?) et voir ce qui peut s’optimiser pour pouvoir répondre à certaines demandes et travailler sur les évolutions pour prendre en charge les besoins définis sur l’axe 3. Cet axe se rejoindra à un moment ou un autre avec le projet autour de la virtualisation avancée.