Le Big Data, c’est comme le sexe chez les ados
Le Big Data, tout le monde en parle, mais dans les faits, très peu l’ont véritablement expérimenté. Et comme nombre d’entreprises affirment s’adonner au Big Data, mieux vaut également revendiquer en faire de même. C’est pourquoi selon le patron du cabinet de recherche Canalys, Steve Brazier, le Big Data s’apparente d'une certaine façon aux discussions des adolescents au sujet du sexe. Pour ne pas paraître ridicule ou en retard, il est encore préférable de se déclarer au fait du sujet, quand bien même il n’en est rien. « Le plus gros problème de l’analyse de données, c’est de loin les humains » Attention cependant à ne pas céder aux sirènes du marketing des grands fournisseurs de technologies, forcément préoccupés par leurs carnets de commandes. Autre erreur, ces initiatives sont abordées sous un angle technologique. Cette position est également défendue par Harper Reed, le directeur technologique de la campagne 2012 de Barack Obama.
Big Data : comparatif des technos, actualités, conseils...
Pour faire face à l'explosion du volume des données, un nouveau domaine technologique a vu le jour : le Big Data. Inventées par les géants du web, ces solutions sont dessinées pour offrir un accès en temps réel à des bases de données géantes. Comment définir le Big Data, et quelle est sa promesse ? Face à l'explosion du volume d'informations, le Big Data vise à proposer une alternative aux solutions traditionnelles de bases de données et d'analyse (serveur SQL, plateforme de Business Intelligence...). Confrontés très tôt à des problématiques de très gros volumes, les géants du web, au premier rang desquels Yahoo (mais aussi Google et Facebook), ont été les premiers à déployer ce type de technologies. Quelles sont les principales technologies de Big Data ? Elles sont nombreuses. Des infrastructures de serveurs pour distribuer les traitements sur des dizaines, centaines, voire milliers de nœuds.
Big data
Un article de Wikipédia, l'encyclopédie libre. Une visualisation des données créée par IBM montre que les Big data que Wikipedia modifie à l'aide du bot Pearle ont plus de signification lorsqu'elles sont mises en valeur par des couleurs et des localisations[1]. Dans ces nouveaux ordres de grandeur, la capture, le stockage, la recherche, le partage, l'analyse et la visualisation des données doivent être redéfinis. Certains supposent qu'il pourrait aider les entreprises à réduire les risques et faciliter la prise de décision, ou créer la différence grâce à l'analyse prédictive et une « expérience client » plus personnalisée et contextualisée. Divers experts, grandes institutions (comme le MIT[10] aux États-Unis), administrations[11] et spécialistes sur le terrain des technologies ou des usages[12] considèrent le phénomène big data comme l'un des grands défis informatiques de la décennie 2010-2020 et en ont fait une de leurs nouvelles priorités de recherche et développement.
Fouille du web
Un article de Wikipédia, l'encyclopédie libre. La fouille du Web est l'application des techniques d'exploration de données en vue de découvrir des constantes, schémas ou modèles, dans les ressources d'internet ou les données le concernant. Selon ses cibles, la fouille du web peut être divisée en trois types : la fouille de l'usage du web, la fouille du contenu du web, la fouille de la structure du web[1]. Fouille de l'usage du web[modifier | modifier le code] Le processus de fouille de l'usage du web La fouille de l'usage du web (Web usage mining ou Web log mining) est le processus d'extraction d'informations utiles stockées dans les logs des serveurs web (l'historique des transactions des utilisateurs) ou bien les informations données par les intervenant du web (FAI, Panélistes, ..). Les fichiers Logs[modifier | modifier le code] Il existe des outils d'analyse des fichiers logs comme Webtrends, Web Analytics qui permettent d'exploiter ces fichiers[7]. Le Data Cleaning n Pageviews et où les et à