Aller au contenu principal

Gestion des données de recherche (GDR) - 4. Partager, diffuser et réutiliser

En deux mots : pourquoi déposer vos données?

  • Le dépôt, ou l'archivage des données, maintient l'accès aux données après le projet de recherche (notamment à des fins de révision par les pairs ou d'analyse secondaire). 
  • À l'UQAR, les données appuyant les conclusions de la recherche doivent être conservées au moins 5 ans après la fin d'un projet.
  • Le dépôt est une exigence des trois organismes subventionnaires fédéraux (CRSH, CRSNG, IRSC). Dans certains documents, ces organismes parlent d'une conservation permanente des données à la suite du projet. 


Note : le dépôt n'implique pas nécessairement le partage de données. Selon les trois organismes, « […] les chercheurs ne doivent rendre les données accessibles que si cela est conforme à l’éthique, au droit et à tout accord commercial ou autre que le chercheur a conclu ».

En deux mots : pourquoi partager vos données?

  • Pour vous :
    • Accroît la visibilité de vos recherches et le nombre de vos citations;
    • Mène à de nouvelles collaborations;
    • Témoigne de votre rigueur et de votre transparence.
  • Pour autrui :
    • Permet la réutilisation et l'analyse secondaire de vos données;
    • Favorise l'accessibilité des recherches financées par des fonds publics;
    • Évite le dédoublement inutile des recherches.

Les principes FAIR indiquent les bonnes pratiques à respecter lors du partage de données de recherche. 

Selon ces principes, il ne suffit pas de partager les données de recherche. Il faut aussi s'assurer qu'elles sont...

  • Faciles à trouver (associées à un DOI, à des métadonnées riches, etc.)
  • Accessibles (mode d'accès clairement indiqué, métadonnées accessibles à perpétuité, etc.)
  • Interopérables (formats de fichiers ouverts, normes de métadonnées reconnues, etc.)
  • Réutilisables (présence de documentation permettant d'interpréter les données, d'une licence de réutilisation, etc.)

Où déposer vos données?

Borealis est un dépôt de données de recherche généraliste soutenu par des universités partout au Canada. Il s'agit du dépôt officiel de données de recherche de l'UQAR. Si vous faites partie de la communauté de l'UQAR, vous pouvez y archiver et partager gratuitement vos données, quel que soit votre domaine de recherche. Borealis associe un identifiant unique (DOI) à chaque ensemble de données.

Le Service de la bibliothèque gère la collection de l'UQAR dans Borealis. Elle vous accompagne dans le processus de dépôt et dans le respect des principes FAIR (pour que vos données soient Faciles à repérer, Accessibles, Interopérables et Réutilisables).

Pour déposer vos données dans la collection Borealis de l'UQAR, veuillez consulter les documents suivants :

Notez que Borealis limite la taille de chaque fichier déposé à 5 Go et n'autorise pas le dépôt de données sensibles (vous pouvez toutefois y déposer des données anonymisées).

En plus de Borealis, vous avez accès à une variété d'autres dépôts généralistes. Les dépôts généralistes acceptent des ensembles de données de toutes les disciplines, contrairement aux dépôts spécialisés.

La liste suivante, non exhaustive, vous présente quelques dépôts généralistes où vous pourriez archiver et/ou partager leurs données. Il est recommandé de ne publier un ensemble de données que sur une seule plateforme.

Le Dépôt fédéré de données de recherche (DFDR) est une infrastructure de recherche canadienne développée par l'Alliance de recherche numérique et Calcul Canada. Tout chercheur affilié à une institution canadienne peut y déposer des jeux de données gratuitement. Contrairement à Borealis, le DFDR permet le dépôt d'ensembles de données et de fichiers de toute taille

Dryad est un dépôt de données de recherche multidisciplinaire sans but lucratif. Le dépôt de données est payant, mais plusieurs éditeurs scientifiques assument les frais. Dryad offre également un service de révision des métadonnées pour assurer le respect des principes FAIR. Tous les dépôts de données sont faits sous licence CC0, qui place les données dans le domaine public. Dryad n'accepte pas les données sensibles. 
Zenodo est un dépôt multidisciplinaire sans but lucratif acceptant une variété de documents issus de la recherche (articles, rapports, affiches, ensembles de données, etc.). Le dépôt de données est gratuit jusqu'à 50 Go par ensemble de données. La plateforme propose des champs de métadonnées détaillés, qui aident les utilisateurs à repérer vos données de recherche. 
Figshare est un dépôt multidisciplinaire acceptant une variété de documents issus de la recherche, y compris les ensembles de données. Le dépôt de données y est gratuit dans la version de base. Les métadonnées y sont toutefois limitées, ce qui diminue la découvrabilité des ensembles de données.  

Pourquoi utiliser un dépôt spécialisé?

Les dépôts spécialisés ont l'avantage de proposer des champs de métadonnées détaillés, propres à un certain domaine de recherche. Des métadonnées riches augmentent la qualité de la documentation, la visibilité auprès d’une communauté spécialisée, et donc le potentiel de réutilisation et de reconnaissance.

Certains dépôts spécialisés contrôlent aussi la qualité des données (vérification de valeurs aberrantes ou manquantes, normalisation, etc.) et des métadonnées. Ces dépôts peuvent toutefois être plus exigeants et plus contraignants, notamment en termes de documentation et de format.

Comment trouver des dépôts de données?

  1. Renseignez-vous auprès de votre communauté disciplinaire, de votre département, de vos co-chercheuses et co-chercheurs ou de votre direction de recherche afin de connaître les principaux dépôts utilisés dans votre discipline;

  2. Consulter un répertoire recensant des dépôts de données, comme le re3data.org. Vous pouvez utiliser les filtres pour affiner votre recherche.

re3data.org - Répertoire de dépôts de données

Il est recommandé de choisir un dépôt de données dès le début du processus de recherche, lors de l'élaboration du plan de gestion des données. Cette approche permet d'adapter le traitement des données aux exigences du dépôt sélectionné, et de se poser les bonnes questions dès le départ afin d'éviter une surcharge de travail en fin de projet. Le choix initial peut bien sûr être réévalué par la suite.

La bibliothèque peut vous aider à identifier un dépôt de données qui correspond à vos besoins. N'hésitez pas à nous écrire à gdr@uqar.ca.

Exemples de questions à se poser lors du choix du dépôt :

  • Des recommandations ou contraintes sont-elles émises...
    • Par l'organisme subventionnaire ou l'éditeur qui pourraient, par exemple, imposer un dépôt spécifique?
    • Par les institutions auxquelles les chercheuses et chercheurs sont rattachés?
  • Existe-t-il un dépôt incontournable dans votre domaine de recherche?
  • Les conditions générales d'utilisation (propriété, partage, diffusion...) du dépôt ont-elles été lues afin de s'assurer qu'il convient à la recherche menée et qu'il permet de respecter les ententes avec des partenaires?
  • Le dépôt attribue-t-il un identifiant pérenne reconnu pour l'ensemble de données (DOI)?
  • Où se trouve le serveur d'hébergement du dépôt? Est-ce important pour vous?
  • Des frais sont-ils associés au dépôt?
  • Le dépôt accepte-t-il le format et la taille de vos fichiers?
  • Est-ce que le dépôt permet une protection suffisante des données (choix de licences, confidentialité, etc.)?
  • Le dépôt offre-t-il une conservation à long terme des données?
  • Avez-vous besoin que le dépôt permette le versionnage?
  • Le dépôt offre-t-il un service de curation de données? Vous aide-t-il à respecter les principes FAIR?

Données sensibles ou confidentielles

Durant et après votre projet de recherche, et particulièrement au moment du partage de vos données dans un dépôt, il est impératif de porter une attention particulière à la gestion des données sensibles.

La gestion des données doit être effectuée en conformité avec l’Énoncé de politique des trois Conseils : Éthique de la recherche avec des êtres humains – 2e édition (EPTC2). L’énoncé fournit des conseils sur les aspects de gestion des données de recherche utilisant des êtres humains, tels que le consentement, le respect de la vie privée et de la confidentialité, les droits des Autochtones, l’utilisation des données secondaires et le couplage des données.

Toute information nominative, y compris une combinaison de renseignements, sur une personne ou pouvant permettre d’identifier une personne doit être traitée de façon confidentielle et ne peut pas être divulguée sans l’accord de la personne.

En outre, des informations à caractère sensible pour la sécurité ou pour des enjeux commerciaux ou stratégiques peuvent être déclarées confidentielles. Ces renseignements ne devraient idéalement pas être conservés via des services infonuagiques!

Source : Carrefour Gestion des données de recherche

  • Obtenir leur accord à ce que l’information confidentielle, compilée à leur sujet ou divulguée par eux-mêmes, et qui est nécessaire à la réalisation de la recherche (en précisant les éléments) puisse être collectée et conservée.
  • Permettre l’utilisation de l’information confidentielle par les chercheuses et chercheurs du projet, après qu'ils aient signé un engagement à ne pas divulguer cette information confidentielle et à prendre toutes les mesures nécessaires pour la protéger.
  • Préciser la durée de conservation de l’information confidentielle, les mesures de protection, les mesures en cas de brèche de cette protection et les limites de responsabilités.
  • Recourir à une procédure d’anonymisation et à des processus d’accès contrôlés pour protéger l’information confidentielle.
  • Protéger l’information confidentielle en restreignant l’accès aux seules personnes de confiance et en ne leur donnant accès qu’aux sections nécessaires pour leur travail.
  • Obtenir l’engagement de chaque personne ayant un accès à l’information confidentielle à ne pas la divulguer et à prendre toutes les mesures nécessaires pour la protéger, ainsi qu’à aviser sans délai les responsables du projet de toute brèche, le cas échéant.

La fiche conseil « Enjeux éthiques liés à la gestion des données sensibles » du Carrefour Gestion des données de recherche fournit des ressources quant à ces enjeux.

Toutes les personnes impliquées dans des projets de recherche, employées par l'UQAR ou étudiantes, doivent se conformer aux exigences les plus strictes énoncées soit par une loi, le cadre normatif de l'UQAR ou encore le cadre normatif de l'organisme subventionnaire impliqué.

Pour en savoir plus, consulter :

Noter que la gestion des données sensibles ne se limite pas aux données humaines, elle peut également concerner des données animales. Par exemple, la diffusion publique de localisations pourrait nuire à des espèces menacées.

Licences et réutilisation

Lors du dépôt de votre ensemble de données, vous devrez choisir une licence afin de faire connaître les conditions d'utilisation de vos données de recherche. Par exemple, Borealis propose les licences Creative Commons, mais vous pouvez également établir des conditions d'utilisation personnalisées.

Afin de favoriser la réutilisation de vos données et, par conséquent, la visibilité de vos travaux, il est recommandé d'opter pour la licence la plus ouverte possible. Veillez cependant à sa compatibilité avec les éventuels accords de partenariat et autres licences utilisées dans votre projet de recherche.

► Pour en savoir plus, consultez cette fiche récapitulative sur les licences Creative Commons.

L’attribution d’un DOI (Digital Object Identifier) simplifie la citation et le repérage des données. La plupart des dépôts attribuent un DOI à votre ensemble de données dès son dépôt. Comme il s’agit d’un identifiant unique, il faut s’assurer qu'un seul DOI est attribué à un même ensemble de données, c'est pourquoi il est recommandé de ne choisir qu'un seul dépôt.

Nous vous encourageons également à associer vos données, dans les métadonnées, à votre identifiant de chercheuse ou de chercheur (ex. : ORCiD) pour maximiser la reconnaissance reçue suite à leur diffusion.

Consultez notre page sur les identifiants ORCiD pour plus d'information.

Moteurs de recherche
  • Lunaris : service national de découverte du Canada pour les données multidisciplinaires d'établissements de recherche de partout au pays. Il regroupe les jeux de données de plus de 90 dépôts de recherche universitaires et gouvernementaux.
  • Odesi : référentiel numérique pour les données en sciences sociales, incluant les données de scrutins. C'est un outil d'exploration, d'extraction et d'analyse de données.
  • DataCite : permet de repérer des données à l'international.
  • Google Dataset Search : permet de repérer les données de plusieurs milliers de dépôts à l'international.

Pour une recherche plus précise, deux autres sources peuvent être considérées : les répertoires de données et les data journals.

Répertoire de données

Les répertoires de données consignent et conservent des milliers de données.

  • Certains, comme Figshare, Dryad ou l’ICPRS, sont multidisciplinaires.
  • D’autres sont ultraspécialisés. Par exemple, l’Environmental Information Data Centre vise à collecter des données sur les écosystèmes terrestres et d’eau douce.
  • La plateforme re3data permet d’identifier plusieurs de ces répertoires selon leurs thématiques, leur couverture régionale ou le type de données recueillies.
Data journals

On compte aujourd’hui quelques dizaines de data journals, soit des revues savantes composées d’articles généralement évalués par les pairs présentant des jeux de données. Ce type d’articles est aussi de plus en plus courant dans des revues savantes traditionnelles.

Le CIRAD présente sur son site web l'objectif et la structure d'un data paper et offre des conseils aux chercheuses et aux chercheurs souhaitant en publier.

Parmi les Data Journals, notons :

Les ensembles de données utilisés doivent obligatoirement être cités.

  • Si une licence Creative Commons a été attribuée à l'ensemble de données, ajoutez la mention à la fin de la référence, par exemple : « Sous licence CC-BY ».
  • Dans les logiciels de gestion bibliographique EndNote et Zotero, le type de document « dataset » existe, et la mise en page des références est proposée dans plusieurs styles bibliographiques.
  • L’outil Crosscite permet de générer la référence à utiliser selon la langue et le style de référence souhaités.

Minimalement, les informations suivantes devraient se retrouver dans la citation :

  1. Auteur(s), autrice(s) des données
  2. Date de publication
  3. Titre de l'ensemble de données
  4. Distributeur, soit la plateforme permettant d’accéder aux données
  5. Identifiant unique de l'ensemble de données (ex. : DOI)

Exemple (style APA) : Deslauriers, D. (2023). Sturgeon family-derived metabolic traits [dataset]. Borealis. https://doi.org/10.5683/SP3/I01IG6

S’il s’agit de données non publiées, indiquez au minimum l’auteur ou l'autrice, le titre et la date dans le format préconisé par le style utilisé, et ajoutez la mention « non publié ».

Libre accès à la recherche

Le présent guide présente les bonnes pratiques en matière de gestion des données de recherche ainsi que les exigences énoncées par la politique associée des trois principaux organismes subventionnaires canadiens (IRSC, CRSNG, CRSH).

Ces mêmes organismes ont également diffusé une autre politique, celle sur le libre accès aux publications. En résumé, « Les titulaires d’une subvention doivent s'assurer que les articles découlant de la recherche financée par les organismes qu'ils publient dans une revue avec comité de lecture sont accessibles gratuitement dans les 12 mois qui suivent leur publication ». Quant à la politique de diffusion en libre accès des Fonds de recherche du Québec (FRQ), les exigences dépendent des dates de concours : les articles doivent être disponibles en libre accès dès leur publication par une revue savante, ou après une période de 12 mois. Pour en savoir plus, consultez notre guide sur le libre accès.

Il est donc question de deux exigences distinctes mais néanmoins interconnectées. L'une concerne la gestion de vos données de recherche et l'autre la diffusion de vos publications.

Ainsi, pour vos publications, nous vous encourageons à nous contacter afin que nous procédions au dépôt sur Sémaphore, le dépôt institutionnel de l'UQAR.

  • nous vérifierons pour vous les conditions de dépôt établies par l'éditeur (format, délai d'embargo, etc.);
  • nous effectuerons le dépôt en libre accès de votre publication;
  • à partir de la notice de votre publication sur Sémaphore, nous ajouterons un lien vers la page où vos données sont hébergées.

Concernant vos données de recherche, nous vous recommandons :

  • d'ajouter un lien, dans les métadonnées de vos données, vers votre article publié chez l'éditeur;
  • ainsi qu'un lien vers Sémaphore, surtout si l'article publié chez l'éditeur n'est pas en libre accès.

Vous respecterez ainsi les exigences des deux politiques tout en maximisant la visibilité de vos résultats de recherche.

Liens entre les dépôts et l'éditeur

chat loading...