background preloader

Devenir Data-Scientist : les formations et les MOOC Big Data l Data-Business.fr

Devenir Data-Scientist : les formations et les MOOC Big Data l Data-Business.fr
Avec la vague Big Data, l’exploitation des données en entreprise est devenu une véritable source d’avantage concurrentiel. En tant que responsable de la valorisation de ces données, le profil de data-scientist est une perle rare. D’après McKinsey, il en manquerait déjà près de 200 000 aux Etats-Unis seulement, et ce chiffre pourrait dépasser le million d’ici 2017. Si les formations Big Data « officielles » commencent à voir le jour en France, les MOOCs sont aujourd’hui le moyen privilégié par beaucoup pour s’auto-former à la Data-Science. Les compétences clés du data-scientist L’appellation data-scientist, forgée par deux ingénieurs de Facebook et LinkedIn, ne fait pas référence à un profil universel avec des compétences bien définies. Mais le data-scientist doit aussi maîtriser des sujets connexes à l’analyse quantitative: Source : ESSEC-Accenture Les Cursus scolaires et Formations (Big) Data-Scientist en France 1. 2. 2. 3. 4. > En savoir plus 5. 6. 1. 2. 3. Voir la présentation en vidéo 4.

Portail Big Data, Analytics, DataViz l Data-Business.fr Le DSI est dans les choux pour valoriser les données de son entreprise La DSI croule sous les données. Elle souhaite investir dans l'analyse, mais elle ne sait pas tirer profit de la donnée pour favoriser la croissance. Avec une infographie de Hitachi Data Systems. Hitachi Data Systems (HDS), la filiale stockage de donnée du géant industriel japonais Hitachi, a réalisé une étude « Information Innovation Index », une première, riche d'enseignements sur l'adéquation – ou l'inadéquation ! - de l'informatique avec les attentes des entreprises en matière d'exploitation des données pour favoriser la croissance. L'étude, réalisée par Vanson Bourne, est pan-européenne, et la France y tient sa place. Consensus autour de la donnée Au niveau européen, les DSI font bloc à l'unisson (98%) pour soutenir plus activement les décideurs dans leur volonté d'exploiter les données pour alimenter la croissance. 95 % des DSI avouent crouler sous les données. Les DSI français à la traine ? Des euros pour la DSI... La conformité en question L'infographie HDS

Le Data Scientist du Big Data : un scientifique parlant business, mouton à cinq pattes - Page 4 sur 4 Des experts Hadoop pourchassés Les experts Hadoop sont également une denrée extrêmement rare. Il suffit parfois d’avoir déployé une plateforme Hadoop qui marche pour se retrouver rapidement recruté à l’extérieur. La mésaventure est arrivée chez FigaroClassified qui gère des sites de petites annonces. L’ingénieur qui a débuté la mise en place d’Hadoop sur un mode de test afin d’héberger la masse de données grandissante du site été débauché et FigaroClassified ne savait plus comment faire fonctionner la plateforme qu’il avait déployé. Le Big Data remet par ailleurs des questions traditionnelles sur le devant de la scène. Des experts de la visualisation des données Ceci dit, tout cela risque de prendre du temps dans les entreprises. Ce texte a été lu 10983 fois !

Un marketeur utilise régulièrement 100 logiciels pour son métier Un responsable marketing emploie régulièrement plus de cent logiciels pour son métier. Certains programmes informatiques sont bien visibles, d’autres sont invisibles, tellement ils sont devenus des habitudes. Côté service informatique, il faut alors apprendre à laisser ce nouveau panorama se mettre en place en donnant un cadre global d’usage. Un marketeur emploie plus de cent logiciels régulièrement, de manière consciente ou inconsciente. A/B Testing Il faut également gérer l’A/B testing, le logiciel de suivi des mouvements de souris afin d’analyser les pages Web vues par les internautes, les enquêtes en ligne, le retargeting, etc. le tout pouvant être géré au travers d’un système de gestion de tags. La bureautique Bien sûr, s’y ajoutent la bureautique employée pour réaliser des documents marketing (Word, Excel, PowerPoint ou leurs équivalents chez Google), l’agenda, un outil comme Trello pour organiser les tâches de votre équipe, et votre logiciel de messagerie. Outil Dropbox Comme le BYOD

Les axes de compétence d’Excel - SalesWay conseil Bien sûr, la création d’une grille d’évaluation prend du temps et doit être créée par des utilisateurs plutôt avertis. Comment progresser ? Au risque d’en décevoir certains, il faut bien se rappeler que la progression en Excel, comme pour tout autre outil informatique, passe inévitablement par la pratique. Dans le premier cas, il s’agit pour l’utilisateur de gagner du temps et de la pertinence sur des tâches déjà accomplies de manière moins efficace. Quelque soit le type de progression, les bénéfices principaux restent les mêmes pour l’équipe : gain de temps, d’autonomie, de structure et de sérénité ! Le Data Scientist, à peine créé, déjà stressé Les Data scientists sont sous pression. Nouveaux en entreprise, ils travaillent sur des projets hautement visibles qui impactent fortement la stratégie. Ils doivent s’adapter en permanence et prendre des responsabilités qui ne font pas forcément partie du poste. Les Data Scientists sont plutôt des hommes, pouvant jouer une dizaine de rôles différents, et déjà majoritairement stressés. C’est un des enseignements de l’étude présentée lors de la conférence DataJob 2014, le 20 Novembre à Paris par Ariane Liger-belair, directeur académique chez l’éditeur américain Sas et Mouloud Dey, directeur solutions & marches émergents, également chez Sas. L’étude a été réalisée au Royaume Uni et menée en partenariat avec Tech Partnership. Adaptation permanente Une grande majorité des Data Scientists affirment que leur métier est générateur de stress. En particulier, ils doivent prendre des responsabilités et adopter des modes de travail qui ne correspondent pas toujours à leurs fonctions. Le geek en tête

[Data-Scientist] Matthieu Olivier, chargé de mission DataMining chez Pôle Emploi l Data-Business.fr Matthieu Olivier, data-scientist chargé de mission Datamining chez Pôle Emploi, nous explique ses missions de lutte contre la fraude au sein de Pôle Emploi et présente sa vision du rôle du data-scientist en entreprise et de ce qui fait le succès d’un projet Big Data. 1. Quelle formation avez-vous suivi et pourquoi avoir choisi cette voie ? Matthieu Olivier : J’ai suivi la formation des attachés statisticien de l’INSEE au sein de l’ENSAI après une prépa math sup / math spé. Je n’avais pas encore la vision concrète du métier de data-scientist mais j’éprouvais un fort intérêt pour les mathématiques et pour l’utilisation de données dans la prise de décisions. La formation de l’ENSAI comporte trois axes principaux : les statistiques, l’informatique et l’économie. Selon moi, un Data-Scientist est d’abord statisticien, ce qui lui évite de tomber dans des pièges faciles, mais il doit être capable de parler de l’informatique en amont et du métier en aval. 2. 3. 4. 5. Partagez l’article

Six categories of Data Scientists We are now at 9 categories after a few updates. Just like there are a few categories of statisticians (biostatisticians, statisticians, econometricians, operations research specialists, actuaries) or business analysts (marketing-oriented, product-oriented, finance-oriented, etc.) we have different categories of data scientists. First, many data scientists have a job title different from data scientist, mine for instance is co-founder. Check the "related articles" section below to discover 400 potential job titles for data scientists. Categories of data scientists Those strong in statistics: they sometimes develop new statistical theories for big data, that even traditional statisticians are not aware of. Most of them are familiar or expert in big data. There are other ways to categorize data scientists, see for instance our article on Taxonomy of data scientists. Implications for other IT professionals Are data scientists a threat to your job/career? Related articles

10 Modern Statistical Concepts Discovered by Data Scientists You sometimes hear from some old-fashioned statisticians that data scientists know nothing about statistics, and that they - the statisticians - know everything. Here we prove that actually it is the exact opposite: data science has its own core of statistical science research, in addition to data plumbing, statistical API's, and business / competitive intelligence research. Here we highlight 11 major data science contributions to statistical science. I am not aware of any statistical science contribution to data science, but if you know one, you are welcome to share. Here's the list: All this research is available for free. DSC Resources Additional Reading

Data Science Tools Top 50 data science / big data tools, described in less than 40 words, for decision makers. Please help us: any definition that you fill will have your name attached to it: send your definition or new term and definition to vincentg@datashaping.com. AnalyticTalentAsterdata: MPP (Massive Parallel Processing) DB, able to work work with semi-structured data by SQL commands. A part of Teradata.ClouderaEMC (submitted by Mark Burnard): Acquired Greenplum in 2010 to enable analytics on "Big Data". EMC has since integrated Greenplum with Hadoop and with "scale-out NAS" platform Isilon. Related articles:

BiostaTGV - Statistiques en ligne Paramétrique: Un test paramétrique est un test qui présuppose que les variables à étudier suivent une certaine distribution décrite par des paramètres. Ces tests font parfois des hypothèses fortes (normalité des distributions, égalité des variances) d'autant plus difficiles à vérifier que les effectifs étudiés sont plus réduits Non paramétrique: Un test non paramétrique est un test dont le modèle ne précise pas les conditions que doivent remplir les paramètres de la population dont a été extrait l'échantillon. variable sur laquelle on souhaite étudier l'influence des facteurs d'étude. On parle également de variable à expliquer. Un facteur d'étude est une des informations dont on souhaite tester le lien avec la variable réponse. variable qualitative (ou catégorielle) : variable dont les valeurs sont des classes ou des modalités. Groupes indépendants : un même sujet ne peut avoir qu'une modalité. Ex : la variable malade a deux modalités oui-non Exemple

Related: