Les données de la recherche Données brutes, traitées, dérivées ? Une distinction portant, à la fois sur le cycle de vie et la nature des données, s'est imposée progressivement, tout en suscitant de nombreuses questions et des débats entre chercheurs ; il s'agit de la distinction entre données brutes, traitées et dérivées. Les données "brutes" (raw data) correspondraient aux enregistrements directs, factuels, d'une réalité (par exemple, des relevés météorologiques). Mais la notion de donnée brute pose problème, d'abord en SHS, où les données (sociales, économiques, textuelles, etc.), sont toujours le produit d'une construction, d'une problématique de recherche, d'un contexte. En sciences humaines, les données ne sont jamais "brutes", mais bien "données" (voir le billet de Sylvie Fayet). Mais en sciences exactes, les données brutes dépendent aussi d'un contexte, d'un dispositif de recueil, etc.
Gérer et diffuser les données de la recherche: quels enjeux? Les données de la recherche sont précieuses, pour toutes les raisons exposées dans un premier billet. C’est en particulier le cas lorsque leur reproduction est impossible ou difficile (car coûteuse, complexe ou longue) et que leur intérêt potentiel pour la science ou pour la société dépasse le contexte de leur constitution. Il est donc important de les gérer et souhaitable de les partager. Introduction - Les données de la recherche - FORMADOCT at Université européenne de Bretagne Selon le texte, désormais canonique, de l'OCDE de 2007, "Principes et lignes directrices de l’OCDE pour l’accès aux données de la recherche financée sur fonds publics", "les «données de la recherche » sont définies comme des enregistrements factuels (chiffres, textes, images, sons) utilisés comme source principales pour la recherche scientifique et généralement reconnus par la communauté scientifique comme nécessaires pour valider les résultats de la recherche. Un ensemble de données de recherche constitue une représentation systématique et partielle du sujet faisant l’objet de la recherche » (OCDE, 2007). Cette définition, qui est la plus répandue, met l'accent sur trois dimensions essentielles des données de la recherche : - l'enregistrement : ce sont des enregistrements factuels de la réalité, i.e. des données au sens classique du terme ;
Comment diffuser mes données de recherche ? (1/2) Dans le cadre de la semaine internationale du libre accès, la journée d’études organisée à Lyon le 25 octobre a eu pour thème Pour une science ouverte et éthique. Le programme est disponible ici et les enregistrements vidéo des conférences du matin là. L’après-midi, un des ateliers, animé par Marilou Pain (CCSD), était consacré à la diffusion des données de recherche. Ce billet propose une partie du contenu de la présentation. Quelques éléments de contexte Comment diffuser mes données de recherche ? (2/2) Dans le cadre de la semaine internationale du libre accès, la journée d’études organisée à Lyon le 25 octobre a eu pour thème Pour une science ouverte et éthique. Le programme est disponible ici et les enregistrements vidéo des conférences du matin là. L’après-midi, un des ateliers, animé par Marilou Pain (CCSD), était consacré à la diffusion des données de recherche. Voici la suite du billet précédent, qui vous propose une série d’outils de recherche et d’évaluation d’entrepôts de données de recherche. Les répertoires d’entrepôts
Aide à la decision pour diffuser les donnees OuiOui, mais les formalités CNIL sont respectées, ET les individus concernés ont donné leur accord écrit à la diffusion OU les données ont été anonymisées (non conservation des noms, des identifiants et des pseudonymes, cf CNIL et CNRS).NonVous n'avez pas encore répondu 2- Avez-vous utilisé d'autres données que celles que vous avez produites vous-mêmes ?OuiOui, mais j'ai bien vérifié la licence d'utilisation de la base de données et j'ai le droit de les extraire et de les réutiliser.NonVous n'avez pas encore répondu 3- Est-ce que certaines de ces données, produites dans le cadre de l'établissement public, contiennent des données protégées par le droit d'auteur (textes, images, schémas, ...) ?
Gestion des données de la recherche : quelques pistes pour démarrer, comprendre et se former - Episode 7 La série de billet continue, nous en sommes au septième, dans lequel je tente de rassembler au fur et à mesure de mes découvertes des pistes de travail pour découvrir, comprendre et se former sur les données de la recherche... Si vous avez d'autres sites ou des suggestions n'hésitez pas !! Revoir le premier billet : Laboratoire Geriico - Séminaire DRTD 2014-2015 Séminaire doctoral Humanités Numériques « Valoriser et diffuser les données de la recherche » Organisé par Joachim Schöpfel, Stéphane Chaudiron, Bernard Jacquemin, Eric Kergosien et Florence Thiault. Le libre accès aux résultats de la recherche est une question qui s’adresse à tous les chercheurs et notamment aux doctorants, mais aussi aux bibliothécaires et documentalistes. Alors que la diffusion des thèses et autres publications scientifiques en open access ne pose plus de problème avec le développement des entrepôts d’archives ouvertes (HAL en France), la question des données de la recherche reste posée. Les données de la recherche sont de petits ensembles de données (small data) produits dans le cadre de projets de recherche, et notamment par les doctorants : des annexes, du matériel audio-visuel, des tableaux et bases de données, des résultats bruts d’enquêtes etc.
Les tablettes mésopotamiennes, l'invention et l'industrialisation de l'imprimerie, les grandes missions archéologiques, naturalistes et spatiales : l'humanité a toujours collecté et exploité des données. Mais jamais autant que ce que l'informatique et Internet ont progressivement permis en un demi-siècle. C'est une révolution sans précédent, tant au niveau de la numérisation et du stockage que dans les méthodes de traitement : on a généré, dans la dernière décennie, plus de données que depuis la fin de la Préhistoire et on est capable de traiter en quelques secondes des millions de requêtes ou de transactions. Astrophysique, physique des particules, sciences de la terre, biologie, sciences humaines et sociales : l'activité scientifique est, et sera toujours plus, tributaire des progrès dans ce domaine.
« Information will be mine ! » : vers un droit de propriété sur les données en Europe ? – – S.I.Lex – Le Conseil National du Numérique a rendu, il y a quelques jours, un avis à propos d’une consultation lancée en janvier dernier par la Commission européenne sur la question de la « libre de circulation des données en Europe ». Cela fait un moment que la Commission veut lancer une initiative en faveur du « Free Flow of Data » – la « fluidification des données » – dans l’optique de créer de nouvelles opportunités économiques au sein du Marché unique. L’avis du CNNum est particulièrement intéressant et en voici un résumé : Pour encourager la libre circulation des données, la Commission européenne a annoncé étudier un certain nombre de pistes, législatives ou non. Parmi celles-ci figure la création d’un droit de propriété sur les données non personnelles.
Partager les données de la recherche : pour qui, pourquoi, comment ? - Sciencesconf.org Data papers et Data Management Plans (DMP) - Laurence Dedieu, éditrice scientifique au Centre de coopération internationale en recherche agronomique pour le développement (CIRAD), Montpellier (diaporama) (vidéo) Partager les logiciels de la recherche, questions juridiques et projets en cours : PRESOFT et FG-SOL - Teresa Gomez-Diaz, ingénieure de Recherche au Laboratoire d’Informatique Gaspard-Monge (LIGM), Marnes-la-Vallée (diaporama) (vidéo) Données de la recherche et contextes des pratiques des chercheurs : injonctions, risques et opportunités - Chérifa Boukacem-Zeghmouri, professeure en Sciences de l'Information et de la Communication, Université de Lyon – UCB Lyon 1, Membre du laboratoire ELICO EA 4147 (diaporama) (vidéo) Retour d'expérience sur la rédaction du DMP pour le projet CPSE Labs - Hélène Waeselynck, directrice de recherche, membre de l’équipe Tolérance aux Fautes et Sûreté de Fonctionnement Informatique (TSF) du LAAS-CNRS (diaporama) (vidéo)