background preloader

Données

Facebook Twitter

Prospectibles Droit de l'information Archives. Les plateformes occupent une place de plus en plus prépondérante dans l’activité numérique actuelle.

Prospectibles Droit de l'information Archives

Que ce soit sur des applications mobiles ou à propos de nouveaux services publics ou associatifs, on retrouve cette même notion à la définition un peu floue. Définition et réglementation Sur Wikipédia, on est un peu déçu : entre plateforme pétrolière et géologique, la plateforme en informatique est décrite comme « une base de travail à partir de laquelle on peut écrire, lire, utiliser, développer un ensemble de logiciels ».

Dans l’avant-projet de la loi Lemaire, cité dans l’article de Marc Rees dans NextInpact : la régulation proposée vise des activités « consistant à classer ou référencer des contenus, biens ou services proposés ou mis en ligne par des tiers, ou de mettre en relation, par voie électronique, plusieurs parties en vue de la vente d’un bien, de la fourniture d’un service, y compris à titre non rémunéré, ou de l’échange ou du partage d’un bien ou d’un service ». Le text-mining comme service aux chercheurs – Carnet'IST. Lorsque les doctorants débutent leur thèse, ils sont souvent confrontés à un volume important de documents qu’ils collectent au cours de leurs recherches bibliographiques ou dont ils héritent de leurs pairs qui leur confient leur « bibliothèque ».

Le text-mining comme service aux chercheurs – Carnet'IST

Cela peut représenter des centaines de documents. Manipulation et gestion de données — Bibliothèques Universitaires. Besoin de rédiger un plan de gestion de données, de publier une bibliographie interactive, de constituer un corpus documentaire, d’enrichir ou de nettoyer un jeu de données ?

Manipulation et gestion de données — Bibliothèques Universitaires

Les BU accompagnent la manipulation et la gestion des données utilisées et produites dans le cadre d’activités de recherche. Un service évolutif Voir la plaquette présentant les services à la recherche Ce service sera déployé progressivement à partir de janvier 2016. Obtenir une aide individualisée pour mes activités de recherche. Fourre-tout personnel virtuel de Got. Orsys : formation professionnelle à l'informatique et au management. Utilisateurs:psychederic:bi [Documentation Ubuntu Francophone]

Business Intelligence - ou Informatique décisionnelle désigne les moyens, les outils et les méthodes qui permettent de collecter, consolider, modéliser et restituer les données, matérielles ou immatérielles, d'une entité en vue d'offrir une aide à la décision et de permettre aux responsables de la stratégie d'entreprise d’avoir une vue d’ensemble de l’activité traitée.

utilisateurs:psychederic:bi [Documentation Ubuntu Francophone]

On peut considérer que ce sont des outils qui permettent d'analyser des systèmes complexes. Le processus d'extraction de motifs à partir de données est appelée data mining. Il est reconnu comme un outil essentiel par les entreprises modernes, car il est capable de convertir les données en intelligence d'affaires donnant ainsi un avantage informationnel. À l'heure actuelle, il est largement utilisé dans les pratiques de profilage, comme la surveillance, le marketing, la découverte scientifique, et la détection des fraudes. Il existe quatre types de tâches qui sont normalement intervenir dans les mines de données:

Topics. Reco collecte donnees. Bibliothèque universitaire de médecine. The content and the structure of this Web site is licensed under the Creative Commons License (CC BY NC ND Lebrand C.- BiUM library-2016) unless otherwise noted.

Bibliothèque universitaire de médecine

In order to build on previous findings, improve transparency and increase results reproducibility, it is important for researchers to be able to re-use research data. For all these reasons, the notion of publication has been evolving over the last ten years and today includes not only the results, but also the essential research data needed to validate the results. Service & Tool Through the process of data life cycle management, the BiUM publication management service is providing information, advice and help to researchers for publishing and sharing their data. We can provide you with guidance on how to prepare a Data Management Plan and how share your data through journal publications and selected repositories to increase the visibility of your work.

Conférences de la Bibliothèque - Division de l'information scientifique (DIS) Jean-Blaise Claivaz, Coordinateur du pôle Open access et données de la recherche, CODIS, UNIGELaure Ognois, Directrice du service Recherche, UNIGEEliane Blumer, Coordinatrice du projet CUS-P2 DLCM, UNIGEPierre-Yves Burgi, NTICE, chef de projet CUS-P2 DLCM, UNIGEMarie Fuselier, Directrice de la DIS, UNIGE Programme complet Date Mercredi 6 mai 2015, de 10h15 à 12h.

Conférences de la Bibliothèque - Division de l'information scientifique (DIS)

Data Mining, Data Science et Big Data Analytics. Cette page recense les supports utilisés pour mes enseignements de Machine Learning, Data Mining et de Data Science au sein du Département Informatique et Statistique (DIS) de l'Université Lyon 2, principalement en Master 2 Statistique et Informatique pour la Science des donnéEs (SISE), formation en data science, dans le cadre du traitement statistique des données et de la valorisation des big data.

Data Mining, Data Science et Big Data Analytics

Je suis très attentif à la synergie forte entre l'informatique et les statistiques dans ce diplôme, ce sont là les piliers essentiels du métier de data scientist. Attention, pour la majorité, il s'agit de « slides » imprimés en PDF, donc très peu formalisés, ils mettent avant tout l'accent sur le fil directeur du domaine étudié et recensent les points importants. Cette page est bien entendu ouverte à tous les statisticiens, data miner et data scientist, étudiants ou pas, de l'Université Lyon 2 ou d'ailleurs.

Index (Logilab - logiciel, conseil, formation - Informatique scientifique - Web sémantique - Agilité) Présentation du projet Eclipse BIRT. (publié le 28/02/2006) Le projet BIRT, Business Intelligence and Reporting Tools, propose un système de création de rapports pour les applications Web.

Présentation du projet Eclipse BIRT

Comme tous les projets développés dans le cadre de la fondation Eclipse, BIRT est open-source et libre d'utilisation. Initié par la société Actuate, ce projet est particulièrement actif et propose notamment de nombreux exemples. Les deux principaux composants de BIRT sont un outil de conception de rapports basé sur Eclipse et un moteur d'exécution installable dans un serveur d'applications J2EE. L'utilisation de BIRT peut se résumer de la façon suivante : OpenRefine : quelques ressources en français. 2017 02 14 AHN NettoyerDonneesOpenRefine ProjeSiprojuris SeverineGedzelman. » A Librarian’s Guide to OpenRefine ACRL TechConnect Blog. Academic librarians working in technical roles may rarely see stacks of books, but they doubtless see messy digital data on a daily basis.

» A Librarian’s Guide to OpenRefine ACRL TechConnect Blog

OpenRefine is an extremely useful tool for dealing with this data without sophisticated scripting skills and with a very low learning curve. Once you learn a few tricks with it, you may never need to force a student worker to copy and paste items onto Excel spreadsheets. As this comparison by the creator of OpenRefine shows, the best use for the tool is to explore and transform data, and it allows you to make edits to many cells and rows at once while still seeing your data. This allows you to experiment and undo mistakes easily, which is a great advantage over databases or scripting where you can’t always see what’s happening or undo the typo you made.

It’s also a lot faster than editing cell by cell like you would do with a spreadsheet. Working with Data using OpenRefine. Over the last couple of years, the British Library have been running a set of internal courses on digital skills for librarians.

Working with Data using OpenRefine

As part of this programme I’ve delivered a course called “Working with Data”, and thought it would be good to share the course structure and materials in case they were helpful to others. The course was designed to run in a 6 hour day, including two 15 minute coffee breaks and a one hour lunch break. OpenRefine : exemples. Cette page recense différents exemples d'utilisation d'OpenRefine par des bibliothèques. En combinaison avec les web services abes[modifier] Fichier après enrichissement En partant d'un fichier dont une colonne contient des isbn. Récupération des PPN associés aux isbn[modifier] À partir d'une liste de PPN, en utilisant le web service isbn2ppn offert par l'ABES. OpenRefine au service de BACON : quelle évaluation pour les fichiers KBART ? [2] – Un outil : OpenRefine. [Lire le billet qui introduit cette série « OpenRefine au service de BACON : quelle évaluation pour les fichiers KBART ?

»] OpenRefine est un outil open source conçu pour manipuler des données dont la qualité nécessite un traitement. Mais il permet bien plus que de nettoyer un fichier tabulé des scories qu’il contient. Comparable à Excel, son principal intérêt est de permettre l’appel à des services web. Il est alors possible, et facile, de comparer le contenu d’un fichier avec une base de référence disposant d’une API. OpenRefine Marseille 2017 06 09 v2. Statistiques d'utilisation - AnalogIST/ezPAARSE. Le projet ezPAARSE, porté entre 2012 et 2015 par une collaboration avec l'INIST-CNRS et l'Université de Lorraine, est désormais terminé.

Nous avons entamé le projet ezMESURE au début de l'année 2016, qui prend la suite d'ezPAARSE en mettant à contribution les instances qui sont déjà déployées dans les établissements pour proposer un entrepôt national et des interface de visualisation des données collectées. - L'instance partagée d'ezPAARSE (hébergée à l'INIST-CNRS) pour s'appropier et tester le logiciel en conditions ré - ANG : la plateforme d'analyses des plateformes éditeur pour enrichir les capacités de reconnaissance d' - Le site collaboratif d'information pour la communauté des - Le fil Twitter du projet, pour avoir toutes les dernières nouvelles rapidement et entrer en contact avec l'é - le dépôt public pour récupérer le code source du projet Tweets de @ezpaarse. AnalogIST - Analyse des Logs de l'IST avec ezPAARSE [AnalogIST]

Kibana: Explore, Visualize, Discover Data. Elastic · Revealing Insights from Data (Formerly Elasticsearch) Fouille de données – Persée UMS. Cumulés, les contenus numériques produits par Persée – qu’ils alimentent le portail Persée ou les Perséides – constituent une masse critique de données structurées. Au-delà de la simple consultation par le biais de sites web, ces données constituent un corpus à part entière pouvant faire l’objet d’exploitations transversales : visualiser des tendances, observer l’évolution de certains concepts, termes ou métaphores d’un point de vue diachronique, mesurer des occurrences, évaluer l’influence d’un auteur ou d’un texte au regard d’un contexte.

Vous pouvez accéder et utiliser ces données dans le respect du droit des tiers : ● Data Persée réunit les données décrivant l’ensemble des ressources produites par Persée, en RDF. Vous pouvez téléchargez un jeu de données, cela peut être une partie thématique ou l’intégralité du graphe, que vous pourrez étudier, manipuler, réutiliser sur votre ordinateur. . ● L’entrepôt OIA-PMH permet de moissonner les métadonnées du portail Persée. Nettoyer et préparer des données avec OpenRefine. OpenData : Apprendre à réutiliser des données : Cours et recettes en français pour tous. Publier données. Diffuser sa thèse en libre accès : les enjeux. L’archive ouverte TEL propose en accès libre plus de 61 000 thèses en texte intégral. Votre thèse est dans TEL si : Vous l’avez déposée vous-même,Elle a été importée par l’application STAR (Signalement des Thèses, Archive et Recherche), gérée par l’ABES : cette application agit pour le compte de votre établissement de soutenance s’il a choisi TEL pour la diffusion des thèses*.

En tant que document officiel validant l’obtention d’un diplôme, la thèse est un document dont le dépôt, le signalement, la conservation et la diffusion sont règlementés en France par un arrêté (voir articles 24 et 25). La mise à disposition de la thèse à l’intérieur de l’établissement de soutenance est obligatoire (sauf s’il existe des clauses de confidentialité). Données de la recherche - veille collaborative > Library. Home > Groups > Données de la recherche - veille collaborative > Library > Vers une culture de la données en SHS.

Une étude à l'université de Lille Tags More Refresh.