Big Data : beaucoup de bruit pour rien ? S'il y a bien eu un thème à la mode cette année, c'est celui du Big Data. Un concept aussi large que peu compréhensible mais promis à un avenir majeur selon les boules de cristal des analystes. La gestion des données hétérogènes en entreprise, dont l'essor est exponentiel, a évidemment du sens. Mais il faut bien le reconnaître, les directions informatiques ont bien du mal à appréhender cette approche, notamment en termes de méthode. Une étude commandée par Iron Mountain (un spécialiste de la gestion de l’information) et menée auprès de 760 directeurs d’exploitation des services informatiques dans six pays montre ainsi que 52 % des dirigeants européens (57,32% des français) sont conscients que le Big Data pourrait profiter à leur entreprise mais ignorent comment procéder. Par où commencer ? "La bonne nouvelle est qu’ils sont réellement enthousiastes quant au potentiel du Big Data et conscients des apports pour leur entreprise. Cette étude en confirme une autre réalisée par Markess.
Big Data - Business intelligence Big Data - B&D France Le Big Data, ce n'est pas simplement utiliser de nouvelles technologies pour la gestion de grande volumétries de données, en comptant sur la créativité de certaines populations d'utilisateurs pour en trouver les bons usages. Cela commence par l'identification, avec les métiers, des questions importantes pour l'amélioration de leurs performances, auxquelles ils ne peuvent trouver de réponse avec les systèmes actuels du fait de données initiales trop volumineuses, trop dispersées ou pas suffisamment structurées pour être utilisables. Cela se poursuit par la mise en oeuvre d'une démarche évolutive "Big Data", destinée à apporter des premières réponses sur des premiers ensembles de données. Cette démarche s'enrichit progressivement en termes de services rendus, de traitements possibles et de prises en compte de nouveaux capteurs de données : nouvelles applications dans l'entreprise, objets intelligents, données dites non structurées (documents, web, intranet...), données externes...
Big data Un article de Wikipédia, l'encyclopédie libre. Une visualisation des données créée par IBM[1] montre que les big data que Wikipedia modifie à l'aide du robot Pearle ont plus de signification lorsqu'elles sont mises en valeur par des couleurs et des localisations[2]. Croissance et Numérisation de la Capacité de Stockage Mondiale de L'information[3]. Dans ces nouveaux ordres de grandeur, la capture, le stockage, la recherche, le partage, l'analyse et la visualisation des données doivent être redéfinis. Certains supposent qu'ils pourraient aider les entreprises à réduire les risques et faciliter la prise de décision, ou créer la différence grâce à l'analyse prédictive et une « expérience client » plus personnalisée et contextualisée. Dimensions des big data[modifier | modifier le code] Le Big Data s'accompagne du développement d'applications à visée analytique, qui traitent les données pour en tirer du sens[15]. Volume[modifier | modifier le code] Variété[modifier | modifier le code]
Big Data : le grand déséquilibre Pour Stéphane Grumbach (blog, @sgrumbach), directeur de recherche à l’Inria, les Big Data sont désormais un sujet important et dont les enjeux sont régulièrement médiatisés, comme le soulignait la semaine dernière le New York Times en s’intéressant à la consommation énergétique des centres de données. Souvent, le sujet est abordé sous l’angle (important) de la protection des données personnelles. Sur la scène de Lift France 2012, Stéphane Grumbach propose lui de l’aborder sous l’angle de la géographie. Est-ce que l’endroit où se trouvent les données est important ? Le sujet semble iconoclaste, car la caractéristique même de ces données numériques est d’être par essence reproductibles, liquides, disponibles partout et tout le temps… Pas si sûr estime le chercheur (voir sa présentation). La taille de l’univers numérique est estimée à 2,7 Zettabytes de données et il devrait atteindre 35 Zettabytes en 2020. Le second est de tirer du sens des données, comme le fait le profilage.
MesInfos : quand les “données personnelles” deviennent vraiment… personnelles Par Renaud Francou le 04/12/12 | 6 commentaires | 2,855 lectures | Impression Que se passerait-il si, demain, les organisations partageaient les données personnelles qu’elles détiennent avec les individus qu’elles concernent, pour qu’ils en fassent ce que bon leur semble ? Quels usages, quelles connaissances, quels services, quels risques aussi, pourraient-ils émerger si les individus disposaient, non seulement du contrôle, mais de l’usage de ces données : leurs finances, leurs achats, leurs déplacements, leurs communications et leurs relations en ligne, leur navigation web, leur consommation d’énergie, etc. ? Voilà tout juste un an, la Fing et un petit groupe d’entreprises, d’acteurs publics et de chercheurs décidaient de chercher ensemble les réponses à ces questions un peu iconoclastes : le projet MesInfos était né. Aujourd’hui, celui-ci s’apprête à passer à une nouvelle étape, celle de l’expérimentation. Rééquilibrer la relation entre les individus et les organisations Intéressé ?
Prédictions : les données seules ne sont pas suffisantes Par Rémi Sussan le 25/09/12 | 4 commentaires | 1,758 lectures | Impression Quelles relations établir entre la gigantesque masse de données fourbie par les ordinateurs – les fameux Big Data -, les modèles utilisés pour les analyser, et les humains qui les interprètent ? C’est la question que s’est posée Nate Silver, dans une brillante analyse de la science météorologique, parue dans le New York Times. Nate Silver n’est pas un inconnu, loin s’en faut. Figurant parmi les cent personnes les plus influentes de 2009 toujours selon le New York Times, ce génie des maths a commencé sa carrière… en analysant les probabilités des résultats des matchs de baseball, domaine qu’il a parait-il révolutionné. Puis il s’est fait connaître par son blog politique (@fivethirtyeight) analysant les chances des différents candidats aux élections américaines. La météo, un succès ? Image : Orage sur Enschede, aux Pays-Bas via Wikimedia Commons. Pourtant, tout ne marche pas aussi mal, nous rassure-t-il. Rémi Sussan
Big Data, grande illusion La cause serait entendue : après le cloud computing et l’internet des objets, les « big data » constitueraient la prochaine « révolution » apportée par le numérique. Alan Mitchell, cofondateur et directeur de la stratégie du cabinet britannique Ctrl-Shift, n’est pas d’accord. Pour lui, les Big Data auraient presque un côté contre-révolutionnaire : le chant du cygne d’une informatique productiviste, centralisatrice, centrée sur les grandes organisations. « Les Big Data se fondent entièrement sur la statistique : dégager des schémas et des tendances à partir de grandes collections de données. La statistique fournit une manière extraordinairement puissante et utile de remettre en questions les suppositions et les inférences que les cerveaux humains produisent naturellement – et souvent de manière erronée. Mitchell ne conteste pas l’utilité des Big Data, il en conteste la nouveauté et le degré de priorité dans les agendas de recherche et d’investissement. Et pourquoi pas ? Daniel Kaplan
L’histoire de l’innovation contemporaine c’est les Big Data La lecture de la semaine provient de la vénérable revue The Atlantic et on la doit à Erik Brynjolfsson, économiste à la Sloan School of Management et responsable du groupe Productivité numérique au Centre sur le Business numérique du Massachusetts Institute of Technology et Andrew McAfee auteurs Race Against the Machine (« La course contre les machines où comment la révolution numérique accélère l’innovation, conduit la productivité et irréversiblement transforme l’emploi et l’économie »). Elle s’intitule : « l’histoire de l’innovation contemporaine, c’est les Big Data » (c’est le nom que l’on donne à l’amoncellement des données). En 1670, commence l’article, à Delphes, en Hollande, un scientifique du nom de Anton van Leeuwenhoek (Wikipédia) fit une chose que beaucoup de scientifiques faisaient depuis 100 ans. Il construisit un microscope. Ce microscope était différent des autres, mais il n’avait rien d’extraordinaire. Cependant, malgré leurs forces, les mesures ont un défaut.
Big Data : la nécessité d’un débat Il nous a semblé intéressant de traduire, de façon collaborative (via Framapad), l’essai original que viennent de publier danah boyd et Kate Crawford présentant « Six provocations au sujet du phénomène des Big Data ».Ces chercheuses, orientées vers l’ethnographie des usages des technologies de communication, s’interrogent – en toute connaissance de cause [cf. cette étude sur les tweets des révolutions tunisiennes et égyptiennes à laquelle a participé danah boyd]- sur les limites épistémologiques, méthodologiques, mais aussi éthiques des Big Data : champ d’études qui s’ouvre aujourd’hui sur la base des énormes jeux de données que fournit internet, en particulier celles générées par l’activité des usagers des sites de réseaux sociaux, que seuls des systèmes informatiques ont la capacité de collecter et de traiter. 6 provocations à propos des Big Data Traduction : Pierre Grosdemouge (@cultord) & Fred Pailler (@Sociographie) à l’initiative de Laurence Allard. L’ère de Big Data a commencé.
La mine d'or du Big Data Le Monde | • Mis à jour le | Par Julie Battilana, professeure associée à la Harvard Business School L'explosion du volume des données informatiques, du fait du développement de l'Internet et des nouvelles technologies de l'information, a ouvert de nouveaux horizons aux entreprises. Certaines utilisent déjà une partie de ces données pour prédire le comportement des consommateurs et améliorer leur offre de produits et services. C'est le cas, par exemple, de Google, Facebook, Amazon, Microsoft, Walmart et LinkedIn, qui ont investi dans l'analyse de données informatiques ces dernières années. C'est donc un véritable marché, désigné par le vocable anglo-saxon "Big Data", qui a émergé autour de l'exploitation de la masse de données informatiques disponibles. Cette approche leur permet d'augmenter leur chiffre d'affaires en ajustant leur offre aux attentes de leurs clients potentiels, et de réduire leurs coûts.
Le "Big Data" : un cadeau empoisonné pour les Data Miners ? Techniquement, la possibilité existe : il s’agit par exemple de transformer ces contenus en texte-libre, à partir d’une reconnaissance initiale, puis d’utiliser le text-mining*. Quand on dit « Big Data » on pense plus généralement à la pléthore d’informations existant dans les réseaux sociaux, et que beaucoup de professionnels du marketing aimeraient bien pouvoir mieux exploiter pour leur campagnes, mais quid de la qualité de ces données dites « non-structurées » et de leur utilité pour l’entreprise ? Depuis la naissance de l’informatique, un principe né en 1963 à New York est en effet toujours resté particulièrement vrai de nos jours. Il stipule « Garbage in, Garbage out ». L’Analytique face au « Big Data » Comme nous l’expliquons souvent à nos clients en Data Mining, l’analyse statistique impose ainsi certaines règles de base sur les données, et ces règles ont très peu à voir avec la quantité de données. Trop d’informations tue l’information Quel rôle pour le Data Mining en 2012 ?
Peut-on être contre les big data ? L'article présente les thèses d'Alan Mitchell, le directeur de la stratégie du cabinet Ctrl+shift. Selon lui, "les Big Data auraient presque un côté contre-révolutionnaire : le chant du cygne d’une informatique productiviste, centralisatrice, centrée sur les grandes organisations." L'effort consenti - notamment en R&D - pour développer cette informatique et ses applications aurait été mieux employé à développer le pouvoir de création des individus, et à les aider à produire eux-mêmes les arbitrages qui leurs sont proposés par cette informatique massive. Je m'arrête sur cet article parce qu'on me pose de plus en plus de questions sur ce phénomène big data dont j'ai parlé très tôt. Ce que veut dénoncer Mitchell, c'est une inflexion des stratégies de R&D, des politiques de recherche, voire de certaines stratégies de résolution de problèmes, qui privilégie une approche massive, centralisée, consommatrice de capital. 3- Les big data ne se limitent pas à la statistique