Aller au contenu principal

Gestion des données de recherche (GDR) - 4. Partager, diffuser et réutiliser

En deux mots : pourquoi partager ses données?
  • Pour vous
    • Accroît la visibilité de vos recherches et favorise la reconnaissance;
    • Contribue à la préservation de vos données à long terme;
    • Peut renforcer la robustesse de vos conclusions.
  • Pour autrui
    • Permet la réutilisation de vos données;
    • Favorise la progression de la recherche.
  • Et devinez... c'est une exigence des organismes subventionnaires!

Pourquoi déposer vos données?

Déposer ses données profitera aux chercheuses et aux chercheurs ainsi qu'à toute la communauté scientifique.

Bonne pratique
Exigence
  • Déposer ses données assure leur préservation, leur visibilité et leur accès, ce qui facilite leur partage et leur réutilisation. Cela contribue au développement de la connaissance tout en favorisant la reconnaissance des chercheuses et des chercheurs.
  • Maximiser la diffusion de vos résultats de recherche en partageant vos données de recherche dans un dépôt de données reconnu, conformément aux principes FAIR :
    • Facilement repérables
    • Accessibles
    • Interopérables
    • Réutilisables
    Le saviez-vous?
    Dans le cadre de recherches menées par, pour et avec les Premiers Peuples, il faut également s'assurer de respecter les principes CARE (pour la gouvernance des données autochtones) :
    • Avantage Collectif
    • Autorité en matière de contrôle
    • Responsabilité
    • Éthique

Le dépôt des données deviendra progressivement une exigence des organismes subventionnaires fédéraux (CRSH, CRSNG et IRSC), comme stipulé dans leur Politique sur la gestion des données de recherche.

Mais

Déposer vos données ne signifie pas libre accès :

  • « Les titulaires de subvention sont tenus de déposer dans un dépôt numérique les données de recherche [...] »
  • « Les titulaires de subvention ne sont pas tenus de partager leurs données, mais les organismes subventionnaires s’attendent à ce que les chercheurs donnent un accès convenable aux données pour autant que les exigences éthiques, culturelles, juridiques et commerciales le permettent, et conformément aux principes FAIR et aux normes propres à leurs disciplines. »
  • « Le dépôt des données permet également aux chercheurs de choisir dans quelle mesure les données peuvent être accessibles aux autres, et sous quelles modalités. »
Sources : Politique des trois organismes sur la gestion des données de recherche + FAQ

Le principe « aussi ouvert que possible, aussi fermé que nécessaire », qui est au cœur de la science ouverte, devrait toujours être appliqué.

Où déposer vos données ?

Il est recommandé de choisir le dépôt de données dès le début du processus de recherche, lors de l'élaboration du plan de gestion des données. Cette approche permet d'adapter le traitement des données aux exigences du dépôt sélectionné, et de se poser les bonnes questions dès le départ afin d'éviter une surcharge de travail en fin de projet. Le choix initial peut bien sûr être réévalué par la suite.

Exemples de questions à se poser lors du choix du dépôt :

  • Des recommandations ou contraintes sont-elles émises?
    • par l'organisme subventionnaire ou l'éditeur qui pourraient, par exemple, imposer un dépôt spécifique;
    • par l'institution à laquelle des chercheuses et chercheurs sont rattachés.
  • Existe-t-il un dépôt incontournable dans votre domaine de recherche?
  • Les conditions générales d'utilisation (propriété, partage, diffusion...) du dépôt ont-elles été lues afin de s'assurer qu'il convient à la recherche menée et qu'il permet de respecter les ententes avec des partenaires?
  • Le dépôt attribue-t-il un identifiant pérenne reconnu pour l'ensemble de données (DOI)?
  • Où se trouve le serveur d'hébergement du dépôt? Est-ce important pour vous?
  • Des frais sont-ils associés au dépôt?
  • Le dépôt accepte-t-il le format et le poids de vos fichiers?
  • Est-ce que le dépôt permet une protection suffisante des données (choix de licences, confidentialité, etc.)?
  • Le dépôt offre-t-il une conservation à long terme des données?
  • Avez-vous besoin que le dépôt permette le versionnage?

Borealis Borealis - Le dépôt Dataverse canadien

Borealis est un dépôt canadien de données de recherche fiable, bilingue, gratuit, multidisciplinaire et sécurisé, soutenu par des bibliothèques universitaires et des établissements de recherche de partout au Canada.

Il s'agit du dépôt officiel de l'UQAR quant aux données de recherche. Notez cependant que la taille maximale d'un fichier déposé ne peut excéder 5 Go.

Pour déposer vos données dans la collection Dataverse de l'UQAR de Borealis, veuillez consulter les documents suivants :


Dépôt fédéré des données de recherche (DFDR)  Dépôt fédéré de données de recherche (DFDR)

Le DFDR est une infrastructure de recherche canadienne développée par les organismes Alliance de recherche numérique et Calcul Canada. Tout chercheur affilié à une institution canadienne peut y déposer des jeux de données. Contrairement à Borealis, le DFDR permet le dépôt d'ensembles de données et de fichiers de toute taille.

Pourquoi utiliser un dépôt disciplinaire ?

Les dépôts disciplinaires ont l'avantage de proposer des métadonnées spécialisées qui augmentent la qualité de la documentation, la visibilité auprès d’une communauté spécialisée, et donc le potentiel de réutilisation et de reconnaissance.

Ils peuvent toutefois être plus exigeants et plus contraignants, en termes de documentation, de format et de qualité générale.

Comment trouver des dépôts de données ?

  1. Renseignez-vous auprès de votre communauté disciplinaire, de votre département, de vos co-chercheuses et co-chercheurs ou de votre direction de recherche afin de connaître les principaux dépôts utilisés dans votre discipline;
  2. Consulter un répertoire recensant des dépôts de données, comme le re3data.org. Vous pouvez utiliser les filtres pour affiner votre recherche.

re3data.org - Répertoire de dépôts de données

Données sensibles ou confidentielles

Durant et après votre projet de recherche, et particulièrement au moment du partage de vos données dans un dépôt, il est impératif de porter une attention particulière à la gestion des données sensibles.

La gestion des données doit être effectuée en conformité avec l’Énoncé de politique des trois Conseils : Éthique de la recherche avec des êtres humains – 2e édition (EPTC2). L’énoncé fournit des conseils sur les aspects de gestion des données de recherche utilisant des êtres humains, tels que le consentement, le respect de la vie privée et de la confidentialité, les droits des Autochtones, l’utilisation des données secondaires et le couplage des données.

Toute information nominative, y compris une combinaison de renseignements, sur une personne ou pouvant permettre d’identifier une personne doit être traitée de façon confidentielle et ne peut pas être divulguée sans l’accord de la personne.

En outre, des informations à caractère sensible pour la sécurité ou pour des enjeux commerciaux ou stratégiques peuvent être déclarées confidentielles. Ces renseignements ne devraient idéalement pas être conservés via des services infonuagiques!

Source : Carrefour Gestion des données de recherche

  • Obtenir leur accord à ce que l’information confidentielle, compilée à leur sujet ou divulguée par eux-mêmes, et qui est nécessaire à la réalisation de la recherche (en précisant les éléments) puisse être collectée et conservée.
  • Permettre l’utilisation de l’information confidentielle par les chercheuses et chercheurs du projet, après qu'ils aient signé un engagement à ne pas divulguer cette information confidentielle et à prendre toutes les mesures nécessaires pour la protéger.
  • Préciser la durée de conservation de l’information confidentielle, les mesures de protection, les mesures en cas de brèche de cette protection et les limites de responsabilités.
  • Recourir à une procédure d’anonymisation et à des processus d’accès contrôlés pour protéger l’information confidentielle.
  • Protéger l’information confidentielle en restreignant l’accès aux seules personnes de confiance et en ne leur donnant accès qu’aux sections nécessaires pour leur travail.
  • Obtenir l’engagement de chaque personne ayant un accès à l’information confidentielle à ne pas la divulguer et à prendre toutes les mesures nécessaires pour la protéger, ainsi qu’à aviser sans délai les responsables du projet de toute brèche, le cas échéant.

La fiche conseil « Enjeux éthiques liés à la gestion des données sensibles » du Carrefour Gestion des données de recherche fournit des ressources quant à ces enjeux.

Toutes les personnes impliquées dans des projets de recherche, employées par l'UQAR ou étudiantes, doivent se conformer aux exigences les plus strictes énoncées soit par une loi, le cadre normatif de l'UQAR ou encore le cadre normatif de l'organisme subventionnaire impliqué.

Pour en savoir plus, consulter :

Noter que la gestion des données sensibles ne se limite pas aux données humaines, elle peut également concerner des données animales. Par exemple, la diffusion publique de localisations pourrait nuire à des espèces menacées.

Licences et réutilisation

Lors du dépôt de votre ensemble de données, vous devrez choisir une licence afin de faire connaître les conditions d'utilisation de vos données de recherche. Par exemple, Borealis propose les licences Creative Commons, mais vous pouvez également établir des conditions d'utilisation personnalisées.

Afin de favoriser la réutilisation de vos données et, par conséquent, la visibilité de vos travaux, il est recommandé d'opter pour la licence la plus ouverte possible. Veillez cependant à sa compatibilité avec les éventuels accords de partenariat et autres licences utilisées dans votre projet de recherche.

Pour en savoir plus, vous pouvez consulter le site de Creative Commons, ou cette fiche récapitulative.

L’attribution d’un DOI (Digital Object Identifier) simplifie la citation et le repérage des données. La plupart des dépôts attribuent un DOI à votre ensemble de données dès son dépôt. Comme il s’agit d’un identifiant unique, il faut s’assurer qu'un seul DOI est attribué à un même ensemble de données, c'est pourquoi il est recommandé de ne choisir qu'un seul dépôt.

Nous vous encourageons également à associer vos données, dans les métadonnées, à votre identifiant de chercheuse ou de chercheur (ex. : ORCiD) pour maximiser la reconnaissance reçue suite à leur diffusion.

Consultez la page ORCiD : l'identité numérique des chercheurs et des chercheuses pour plus d'information.

Moteurs de recherche
  • Lunaris : service national de découverte du Canada pour les données multidisciplinaires d'établissements de recherche de partout au pays. Il regroupe les jeux de données de plus de 90 dépôts de recherche universitaires et gouvernementaux.
  • Odesi : référentiel numérique pour les données en sciences sociales, incluant les données de scrutins. C'est un outil d'exploration, d'extraction et d'analyse de données.
  • DataCite : permet de repérer des données à l'international.
  • Google Dataset Search : permet de repérer les données de plusieurs milliers de dépôts à l'international.

Pour une recherche plus précise, deux autres sources peuvent être considérées : les répertoires de données et les data journals.

Répertoire de données

Les répertoires de données consignent et conservent des milliers de données.

  • Certains, comme Figshare, Dryad ou l’ICPRS, sont multidisciplinaires.
  • D’autres sont ultraspécialisés. Par exemple, l’Environmental Information Data Centre vise à collecter des données sur les écosystèmes terrestres et d’eau douce.
  • La plateforme re3data permet d’identifier plusieurs de ces répertoires selon leurs thématiques, leur couverture régionale ou le type de données recueillies.
Data journals

On compte aujourd’hui quelques dizaines de data journals, soit des revues savantes composées d’articles généralement évalués par les pairs présentant des jeux de données. Ce type d’articles est aussi de plus en plus courant dans des revues savantes traditionnelles.

Le CIRAD présente sur son site web l'objectif et la structure d'un data paper et offre des conseils aux chercheuses et aux chercheurs souhaitant en publier.

Parmi les Data Journals, notons :

Les ensembles de données utilisés doivent obligatoirement être cités.

  • Si une licence Creative Commons a été attribuée à l'ensemble de données, ajoutez la mention à la fin de la référence, par exemple : « Sous licence CC-BY ».
  • Dans les logiciels de gestion bibliographique EndNote et Zotero, le type de document « dataset » existe, et la mise en page des références est proposée dans plusieurs styles bibliographiques.
  • L’outil Crosscite permet de générer la référence à utiliser selon la langue et le style de référence souhaités.

Minimalement, les informations suivantes devraient se retrouver dans la citation :

  1. Auteur(s), autrice(s) des données
  2. Date de publication
  3. Titre de l'ensemble de données
  4. Distributeur, soit la plateforme permettant d’accéder aux données
  5. Identifiant unique de l'ensemble de données (ex. : DOI)

Exemple (style APA) : Deslauriers, D. (2023). Sturgeon family-derived metabolic traits [dataset]. Borealis. https://doi.org/10.5683/SP3/I01IG6

S’il s’agit de données non publiées, indiquez au minimum l’auteur ou l'autrice, le titre et la date dans le format préconisé par le style utilisé, et ajoutez la mention « non publié ».

Libre accès à la recherche

Le présent guide présente les bonnes pratiques en matière de gestion des données de recherche ainsi que les exigences énoncées par la politique associée des trois principaux organismes subventionnaires canadiens (IRSC, CRSNG, CRSH).

Ces mêmes organismes ont également diffusé une autre politique, celle sur le libre accès aux publications. En résumé, « Les titulaires d’une subvention doivent s'assurer que les articles découlant de la recherche financée par les organismes qu'ils publient dans une revue avec comité de lecture sont accessibles gratuitement dans les 12 mois qui suivent leur publication ». Quant à la politique de diffusion en libre accès des Fonds de recherche du Québec (FRQ), les exigences dépendent des dates de concours : les articles doivent être disponibles en libre accès dès leur publication par une revue savante, ou après une période de 12 mois. Pour en savoir plus, consultez notre guide sur le libre accès.

Il est donc question de deux exigences distinctes mais néanmoins interconnectées. L'une concerne la gestion de vos données de recherche et l'autre la diffusion de vos publications.

Ainsi, pour vos publications, nous vous encourageons à nous contacter afin que nous procédions au dépôt sur Sémaphore, le dépôt institutionnel de l'UQAR.

  • nous vérifierons pour vous les conditions de dépôt établies par l'éditeur (format, délai d'embargo, etc.);
  • nous effectuerons le dépôt en libre accès de votre publication;
  • à partir de la notice de votre publication sur Sémaphore, nous ajouterons un lien vers la page où vos données sont hébergées.

Concernant vos données de recherche, nous vous recommandons :

  • d'ajouter un lien, dans les métadonnées de vos données, vers votre article publié chez l'éditeur;
  • ainsi qu'un lien vers Sémaphore, surtout si l'article publié chez l'éditeur n'est pas en libre accès.

Vous respecterez ainsi les exigences des deux politiques tout en maximisant la visibilité de vos résultats de recherche.

Liens entre les dépôts et l'éditeur

chat loading...