Aller au contenu principal

Gestion des données de recherche (GDR) - 2. Stocker et organiser

En deux mots : pourquoi stocker et organiser adéquatement?
  • Stocker
    • Pour sécuriser vos données et prévenir toute perte;
    • Nous avons les infrastructures disponibles.
  • Organiser
    • Bonne pratique pendant le projet;
    • Facilite le partage en fin de projet (exigence des organismes subventionnaires).

Stocker ses données

Lors d'un projet de recherche, la gestion du stockage des données est un élément crucial au bon déroulement de ce dernier. En effet, elle garantit l'intégrité des données, permet une gestion des accès appropriée et minimise le risque de perte, entre autres avantages. Dès le début du projet, il est nécessaire d'établir un plan de gestion des données définissant quelles données seront conservées, où elles seront stockées, et cela, tout au long du processus de recherche.

Idéalement, toutes les données de recherche jugées de qualité devraient être conservées et accompagnées des documents afférents, c’est-à-dire : les métadonnées, les descriptions détaillées de la méthodologie de collecte de données et de conception de la base de données, ainsi que les guides nécessaires à la compréhension et à la réutilisation des données.

Il est important de différencier le stockage des données actives en cours de projet, dont il est question ici, de la conservation à long terme dans des dépôts en ligne répondant aux exigences canadiennes et favorisant le partage et la réutilisation.

La technologie de stockage choisie (par exemple : SABRE, Symbiose ou le OneDrive de l'UQAR) devra notamment tenir compte de la quantité de données, de leur sensibilité, ainsi que des besoins de partage. L'équipe GDR pourra évaluer vos besoins et vous recommander la technologie la plus appropriée selon les caractéristiques de votre projet.

Organiser ses dossiers et ses fichiers

Il existe plusieurs bonnes pratiques afin de permettre une identification rapide et facile des fichiers et des dossiers. L’important est de choisir des règles et de les appliquer uniformément.

Pour identifier facilement le contenu des fichiers et des dossiers :

  • Utiliser des titres composés de mots-clés significatifs pour une personne utilisatrice externe (ex. embodied-energy-data);
  • Inclure une mention du type de document lorsque possible (ex. : questionnaire, données, formulaire);
  • Limiter la longueur des titres autant que possible;
  • Ne pas utiliser de caractères spéciaux (!, $, %, $ , ?, &, *, /, \, #), ni de caractères accentués (é, à, ç, ë);
  • Remplacer les espaces entre les mots par des tirets (-) ou des barres de soulignement (_);
  • Indiquer les dates en utilisant la norme ISO8601 AAAA-MM-JJ (ex. : 2023-01-10);
  • Éviter l'utilisation des majuscules (certains systèmes d'exploitation sont sensibles à la casse);
  • Assurer le suivi des versions des fichiers en utilisant une séquence numérique claire.

Pour une hiérarchie bien structurée facilitant la localisation et le partage de vos fichiers :

  • Regrouper en dossiers les fichiers de même nature;
  • Numéroter les dossiers afin de rendre leur organisation plus claire. Privilégier la numérotation [01, 02 ... 10] à [1, 2 ... 10] pour une bonne gestion du tri;
  • Limiter la hiérarchie du répertoire à un maximum de quatre niveaux de profondeur;
  • Limiter à un maximum de dix, le nombre de sous-dossiers d'un même dossier.

Afin de garantir le partage et la préservation des données, il est conseillé d'opter pour des formats de fichier favorisant l'accessibilité et l'interopérabilité. Les formats ouverts tels que txt, csv, tab, mp3, mp4, flac ou xml et l'encodage UTF-8 sont à privilégier. Ils permettent une consultation avec une grande variété de logiciels.

Au contraire, les formats propriétaires peuvent rapidement devenir désuets ou causer des problèmes d’incompatibilité, puisqu'ils ne peuvent être ouverts qu'avec un logiciel spécifique.

Les formats propriétaires largement utilisés dans certaines disciplines sont cependant acceptables.

Consultez les ressources suivantes pour obtenir une liste non exhaustive des formats de fichiers conseillés :

chat loading...