Note – Analyse des big data. Quels usages, quels défis ? Cette note détaille ce qu’est l’analyse des big data. Elle présente ses principales applications. Elle s’intéresse aux conditions nécessaires à leur mise en œuvre. Note d’analyse 08 – Analyse des big data. Quels usages, quels défis ? La multiplication croissante des données produites et le développement d’outils informatiques permettant de les analyser offre d’innombrables possibilités tant pour l’État que pour les entreprises. Il ne fait aucun doute que le traitement de ces masses de données, ou big data, jouera un rôle primordial dans la société de demain, car il trouve des applications dans des domaines aussi variés que les sciences, le marketing, les services client, le développement durable, les transports, la santé, ou encore l’éducation. Par ailleurs, le potentiel économique de ce secteur est indéniable et les retombées en termes d’emploi et de création de richesse seront non négligeables. Sommaire de la Note d’analyse 08– Analyse des big data.
Le Big Data, c’est comme le sexe chez les ados Le Big Data, tout le monde en parle, mais dans les faits, très peu l’ont véritablement expérimenté. Et comme nombre d’entreprises affirment s’adonner au Big Data, mieux vaut également revendiquer en faire de même. C’est pourquoi selon le patron du cabinet de recherche Canalys, Steve Brazier, le Big Data s’apparente d'une certaine façon aux discussions des adolescents au sujet du sexe. Pour ne pas paraître ridicule ou en retard, il est encore préférable de se déclarer au fait du sujet, quand bien même il n’en est rien. « Le plus gros problème de l’analyse de données, c’est de loin les humains » Attention cependant à ne pas céder aux sirènes du marketing des grands fournisseurs de technologies, forcément préoccupés par leurs carnets de commandes. Autre erreur, ces initiatives sont abordées sous un angle technologique. Cette position est également défendue par Harper Reed, le directeur technologique de la campagne 2012 de Barack Obama.
Big Data : comparatif des technos, actualités, conseils... Pour faire face à l'explosion du volume des données, un nouveau domaine technologique a vu le jour : le Big Data. Inventées par les géants du web, ces solutions sont dessinées pour offrir un accès en temps réel à des bases de données géantes. Comment définir le Big Data, et quelle est sa promesse ? Face à l'explosion du volume d'informations, le Big Data vise à proposer une alternative aux solutions traditionnelles de bases de données et d'analyse (serveur SQL, plateforme de Business Intelligence...). Confrontés très tôt à des problématiques de très gros volumes, les géants du web, au premier rang desquels Yahoo (mais aussi Google et Facebook), ont été les premiers à déployer ce type de technologies. Quelles sont les principales technologies de Big Data ? Elles sont nombreuses. Des infrastructures de serveurs pour distribuer les traitements sur des dizaines, centaines, voire milliers de nœuds.
Big data Un article de Wikipédia, l'encyclopédie libre. Une visualisation des données créée par IBM montre que les Big data que Wikipedia modifie à l'aide du bot Pearle ont plus de signification lorsqu'elles sont mises en valeur par des couleurs et des localisations[1]. Dans ces nouveaux ordres de grandeur, la capture, le stockage, la recherche, le partage, l'analyse et la visualisation des données doivent être redéfinis. Certains supposent qu'il pourrait aider les entreprises à réduire les risques et faciliter la prise de décision, ou créer la différence grâce à l'analyse prédictive et une « expérience client » plus personnalisée et contextualisée. Divers experts, grandes institutions (comme le MIT[10] aux États-Unis), administrations[11] et spécialistes sur le terrain des technologies ou des usages[12] considèrent le phénomène big data comme l'un des grands défis informatiques de la décennie 2010-2020 et en ont fait une de leurs nouvelles priorités de recherche et développement.
Fouille du web Un article de Wikipédia, l'encyclopédie libre. La fouille du Web est l'application des techniques d'exploration de données en vue de découvrir des constantes, schémas ou modèles, dans les ressources d'internet ou les données le concernant. Selon ses cibles, la fouille du web peut être divisée en trois types : la fouille de l'usage du web, la fouille du contenu du web, la fouille de la structure du web[1]. Fouille de l'usage du web[modifier | modifier le code] Le processus de fouille de l'usage du web La fouille de l'usage du web (Web usage mining ou Web log mining) est le processus d'extraction d'informations utiles stockées dans les logs des serveurs web (l'historique des transactions des utilisateurs) ou bien les informations données par les intervenant du web (FAI, Panélistes, ..). Les fichiers Logs[modifier | modifier le code] Il existe des outils d'analyse des fichiers logs comme Webtrends, Web Analytics qui permettent d'exploiter ces fichiers[7]. Le Data Cleaning n Pageviews et où les et à