http://www.donneesdelarecherche.fr/
Related: DatabrarianComment diffuser mes données de recherche ? (2/2) Dans le cadre de la semaine internationale du libre accès, la journée d’études organisée à Lyon le 25 octobre a eu pour thème Pour une science ouverte et éthique. Le programme est disponible ici et les enregistrements vidéo des conférences du matin là. L’après-midi, un des ateliers, animé par Marilou Pain (CCSD), était consacré à la diffusion des données de recherche. Voici la suite du billet précédent, qui vous propose une série d’outils de recherche et d’évaluation d’entrepôts de données de recherche. Les répertoires d’entrepôts
Quelques repères - Les données de la recherche - FORMADOCT at Université européenne de Bretagne Le mouvement de l'ouverture des données de la recherche, l'Open Research Data, a une double origine : - l’Open Access : le mouvement pour le Libre Accès des publications scientifiques (voir le guide Formadoct), lancé en 1991 avec la création de l’archive ouverte ArXiv, est directement à l’origine de l’Open Research Data, puisque dès 2003, la Déclaration de Berlin mentionnait la nécessité de rendre également accessibles les données de recherche ; - l’Open Data : l’ouverture des données publiques prend sa source dans les politiques d’accessibilité aux documents administratifs et publics ; en France, la création de la CADA (Commission d’Accès aux Documents Administratifs) en 1978 a marqué une étape essentielle dans ce long mouvement vers l’ouverture et la transparence des données publiques.
Comment diffuser mes données de recherche ? (1/2) Dans le cadre de la semaine internationale du libre accès, la journée d’études organisée à Lyon le 25 octobre a eu pour thème Pour une science ouverte et éthique. Le programme est disponible ici et les enregistrements vidéo des conférences du matin là. L’après-midi, un des ateliers, animé par Marilou Pain (CCSD), était consacré à la diffusion des données de recherche. Ce billet propose une partie du contenu de la présentation. Quelques éléments de contexte EMSO-France - EMSO France EMSO, European Multidisciplinary Seafloor and water column Observatory, est un ERIC. C'est un réseau Européen d'observatoires du fond de mer et de la colonne d'eau au point fixe qui a pour objectif scientifique d'observer en temps réel les processus environnementaux liés avec les interactions entre géosphère, biosphère et hydrosphère.EMSO vise à acquérir des séries temporelles longues (10 à 20 ans au moins) dans les mers du pourtour européen avec pour objectifs principaux : l’étude de l’impact du réchauffement climatique sur les océans entourant l’Europe,l’étude des écosystèmes marins profonds dans une optique de recherche fondamentale mais aussi de gestion durable, en s’intéressant particulièrement aux facteurs anthropogéniques et climatiques,l’étude des processus tectoniques, volcaniques, hydrothermaux et gravitaires et la surveillance des risques naturels associés (séismes, tsunamis, instabilité des pentes) pour les zones côtières à forte densité de population.
Introduction - Les données de la recherche - FORMADOCT at Université européenne de Bretagne Selon le texte, désormais canonique, de l'OCDE de 2007, "Principes et lignes directrices de l’OCDE pour l’accès aux données de la recherche financée sur fonds publics", "les «données de la recherche » sont définies comme des enregistrements factuels (chiffres, textes, images, sons) utilisés comme source principales pour la recherche scientifique et généralement reconnus par la communauté scientifique comme nécessaires pour valider les résultats de la recherche. Un ensemble de données de recherche constitue une représentation systématique et partielle du sujet faisant l’objet de la recherche » (OCDE, 2007). Cette définition, qui est la plus répandue, met l'accent sur trois dimensions essentielles des données de la recherche : - l'enregistrement : ce sont des enregistrements factuels de la réalité, i.e. des données au sens classique du terme ;
Open Science et données de la recherche Un article de Wiki URFIST. Alors que la problématique de l'accès ouvert aux publications scientifiques (Open Access) a une vingtaine d'années, on parle aujourd'hui de l'accès aux données elles-mêmes, du partage des données de la recherche. Quelles sont les raisons de ce glissement d'échelle et quels sont ses enjeux? Enjeux scientifiques mais aussi enjeux économiques et juridiques.
Gérer et diffuser les données de la recherche: quels enjeux? Les données de la recherche sont précieuses, pour toutes les raisons exposées dans un premier billet. C’est en particulier le cas lorsque leur reproduction est impossible ou difficile (car coûteuse, complexe ou longue) et que leur intérêt potentiel pour la science ou pour la société dépasse le contexte de leur constitution. Il est donc important de les gérer et souhaitable de les partager. Schémas de classification : thésaurus, taxonomie, ontologie... - Consulting et architecture interactive Au cœur de l’architecture de l’information et du Knowledge Management, les techniques de classification sont particulièrement d’actualité alors que les volumes d’information en ligne augmentent et que ce que nous cherchons est de plus en plus noyé parmi ce que nous ne cherchons pas. La plupart de ces techniques nous viennent de l’ingénierie documentaire. Avec le Web sémantique, l’ingénierie informatique nous apporte d’autres approches telles que les ontologies et les topic maps, souvent associées à des formalismes et outils définis. Tour d’horizon des schémas de classification… (non exhaustif) La méta-donnée, brique de base de la classification Les méta-données sont des données décrivant les données elles-mêmes (informations, documents, images…).
sans titre Traitement de signaux sur graphes De nombreuses données massives issues de la datamasse nécessitent d'être traitées dans des domaines d'applications très variés. Ces données sont souvent représentées par des graphes afin de représenter les interactions. Aide à la decision pour diffuser les donnees OuiOui, mais les formalités CNIL sont respectées, ET les individus concernés ont donné leur accord écrit à la diffusion OU les données ont été anonymisées (non conservation des noms, des identifiants et des pseudonymes, cf CNIL et CNRS).NonVous n'avez pas encore répondu 2- Avez-vous utilisé d'autres données que celles que vous avez produites vous-mêmes ?OuiOui, mais j'ai bien vérifié la licence d'utilisation de la base de données et j'ai le droit de les extraire et de les réutiliser.NonVous n'avez pas encore répondu 3- Est-ce que certaines de ces données, produites dans le cadre de l'établissement public, contiennent des données protégées par le droit d'auteur (textes, images, schémas, ...) ?
Datapartage - Gérer Gérer les données scientifiques revient à : nommer et organiser les fichiers qui les contiennent de sorte à les retrouver facilement pendant et après un projetidentifier les données : l'utilisation d'identifiants uniques et pérennes tels que le DOI permet d'avoir un lien d'accès pérenne aux données et de les citer.documenter les données : décrire les données, les conditions d'obtention, les protocoles utilisés, etc. Bref, il s'agit d'accompagner les données de toutes les informations utiles pour les comprendre, évaluer, utiliser.Stocker les données de manière sécurisée, c'est à dire en prévenant les risques de détérioration et de perte accidentelles ou malveillantes.Archiver de manière pérenne : en plus de les stocker de manière sécurisée, il peut s'avérer nécessaire d'assurer la lisibilité et l'intelligibilité des données sur le long terme.