Aller au contenu principal

Gestion des données de recherche (GDR) - 2. Stocker et organiser

En deux mots : pourquoi stocker et organiser adéquatement vos données?
  • Stockage sécuritaire
    • Pour prévenir les pertes, les vols et les fuites de données
    • Des infrastructures sécuritaires sont disponibles à l'UQAR
  • Organisation efficace
    • Pour retrouver facilement vos fichiers et gagner du temps
    • Pour faciliter le partage des données à la fin du projet

Stocker vos données

Il est crucial d'adopter de bonnes pratiques de stockage de données, notamment pour...

  1. Garantir l'intégrité des données
  2. Minimiser le risque de perte, de fuite et de vol de données
  3. Contrôler l'accès aux données

Dès le début du projet, nous vous recommandons d'établir un plan de gestion des données définissant quelles données seront stockées en cours de projet et quelles infrastructures de stockage vous utiliserez.

Attention! Il est question ici du stockage des données actives en cours de projet – à ne pas confondre avec le dépôt (archivage) des données à la fin du projet de recherche.

La technologie de stockage choisie (par exemple : SABRE, Symbiose ou le OneDrive de l'UQAR) devra notamment tenir compte de la quantité de données, de leur sensibilité, ainsi que des besoins de partage.

► Le Service des technologies de l'information (STI) peut évaluer vos besoins et vous recommander la technologie la plus appropriée selon les caractéristiques de votre projet.

Gérer vos fichiers

Pour repérer facilement vos fichiers et vos dossiers en cours de projet, adoptez des règles de nommage et appliquez-les de manière uniforme. Suivez aussi certaines bonnes pratiques reconnues.


Bonnes pratiques de nommage :

  • Utiliser des mots-clés significatifs pour une personne externe (ex. : embodied-energy-data)
  • Mentionner le type de document lorsque possible (ex. : questionnaire, données, formulaire)
  • Limiter la longueur des titres autant que possible (éviter tout mot inutile)
  • Éviter les caractères spéciaux (!, $, %, $ , ?, &, *, /, \, #), et les caractères accentués (é, à, ç, ë)
  • Remplacer les espaces entre les mots par des tirets (-) ou des barres de soulignement (_)
  • Indiquer les dates en utilisant la norme ISO8601 AAAA-MM-JJ (ex. : 2023-01-10), qui permet le tri chronologique des fichiers
  • Éviter les majuscules (certains systèmes d'exploitation sont sensibles à la casse)
  • Assurer le suivi des versions des fichiers en utilisant une séquence numérique claire (ex. : v01, v02, etc.)
    Note : identifiez les versions en suivant le format v01, v02... v99, plutôt que v1, v2... v99. Vous éviterez ainsi des problèmes de tri dans certains systèmes informatiques. 

Pour en savoir plus, consultez le Guide de nommage du Centre de documentation administrative de l'UQAR. 

La structure de dossiers optimale pour organiser vos fichiers dépendra de la nature de vos recherches. 

Cependant, dans la plupart des projets de recherches, il est recommandé de...

  • Mettre les données brutes (non traitées) dans un dossier à part, en mode « lecture seule », afin de les protéger de toute altération accidentelle
  • Regrouper en dossiers les fichiers de même nature
  • Dans la mesure du possible, limiter la hiérarchie du répertoire à un maximum de quatre niveaux de profondeur
  • Dans la mesure du possible, limiter à un maximum de dix le nombre de sous-dossiers d'un même dossier
  • Si pertinent, numéroter les dossiers afin de rendre leur organisation plus claire (privilégier la numérotation [01, 02 ... 10] à [1, 2 ... 10] pour une bonne gestion du tri)

Pour en savoir plus sur les structures de dossiers, voir notamment :

Afin que vos fichiers de données demeurent utilisables dans 5, 10 ou 20 ans, optez dans la mesure du possible pour des formats de fichier ouverts comme txt, csv, tab, mp3, mp4, flac ou xml, et l'encodage UTF-8. Ces formats, dont les spécifications sont publiques, sont compatibles avec une variété de logiciels et se prêtent bien à une conservation à long terme. Ils ne risquent pas de devenir désuets après quelques années.

Au contraire, les formats propriétaires peuvent rapidement devenir désuets ou causer des problèmes d’incompatibilité, puisqu'ils ne peuvent généralement être ouverts qu'avec un logiciel spécifique. Certains formats propriétaires largement utilisés dans certaines disciplines sont cependant acceptables.

Certaines méthodes de collecte peuvent exiger l'utilisation de formats de fichiers propriétaires. Demandez-vous toutefois si, après la collecte, vous pouvez convertir les fichiers dans un format non propriétaire (ouvert). 

Formats de fichiers recommandés :

Si vous travaillez avec des données tabulaires (présentées sous forme de tableau), structurez-les selon les principes du tidy data. Vos données seront ainsi plus faciles à manipuler et à visualiser. Assurez-vous notamment que...

  1. Chaque colonne correspond à une variable
  2. Chaque rangée correspond à une observation

Exemples :

Pour connaître d'autres bonnes pratiques de gestion des données tabulaires, consultez cette courte vidéo de l’Institut de recherche de l’Hôpital d’Ottawa :

Note : au-delà de ces principes de base, certaines normes de données, comme Darwin Core en biologie, indiquent plus précisément comment structurer des observations dans un fichier de données. 

chat loading...