Vers un Nouveau Monde de données
A l’occasion de la Semaine européenne des l’Open Data qui se déroulait à Nantes du 21 au 26 mai 2012, j’étais invité à faire une présentation sur le web des données, pour dépasser et élargir la problématique particulière de la réutilisation des données publiques. En voici la transcription. Nous sommes passés d’un web de l’information et de la connaissance à un web de données. « Les données sont le nouveau pétrole de l’économie », expliquait le consultant Clive Humby dès 2006. Tim O’Reilly et John Battelle ne disaient pas autre chose quand ils imaginaient le concept de Web² devenu depuis (et il serait intéressant de regarder comment) celui des Big Data. Nous n’échapperons pas à l’exploitation maximale de la puissance des données par l’analyse, la combinaison, la représentation, la recherche, le traitement… Le web est un écosystème de bases de données interconnectées. Tout est information. Le web est devenu « la base de données de nos intentions », affirmait John Battelle en 2003.
Les nouveaux réseaux sociaux sur internet - cairn.info
1Les nouveaux réseaux sociaux sur Internet créent une situation radicalement nouvelle, à la fois du point de vue des technologies mises en œuvre et des possibilités offertes aux usagers. Ils se caractérisent non seulement par l’extrême variété des messages qui peuvent y être inscrits (comme des textes, des voix, des photographies, des dessins...) mais également par la multiplicité des voies d’accès et de consultation : à titre d’exemple, Twitter peut être consulté et alimenté sur le site web qui lui est dédié, mais aussi par mail, messagerie instantanée et SMS. 2Pourtant, les désirs qui investissent ces nouveaux espaces sont-ils vraiment nouveaux ? 3L’être humain a toujours été tiraillé entre des désirs contradictoires qui ont trouvé des expressions différentes selon les possibilités technologiques offertes à chaque époque. 4L’être humain ne se perçoit comme humain que s’il a la possibilité de commenter intérieurement les situations dans lesquelles il est plongé.
Les 7 principes clés de la protection des données personnelles
1. Le principe de finalité Les données à caractère personnel ne peuvent être recueillies et traitées que pour un usage déterminé et légitime, correspondant aux missions de l’établissement, responsable du traitement. Tout détournement de finalité est passible de sanctions pénales. 2. Seules doivent être enregistrées les informations pertinentes et nécessaires pour leur finalité. 3. Les données personnelles doivent être adéquates, pertinentes et non excessives au regard des objectifs poursuivis. 4. C’est ce que l’on appelle le droit à l’oubli. Les informations ne peuvent être conservées de façon indéfinie dans les fichiers informatiques. Au-delà, les données peuvent être archivées, sur un support distinct. Se reporter à l’instruction ministérielle sur l’archivage (référence : DAF DPACI/RES/2005/003 du 22 février 2005). instruction ministérielle sur l’archivage DAF DPACI/RES/2005/003 du 22 février 2005 5 .Le principe de sécurité et de confidentialité 6. 7. 7.1 Informer les intéressés
Outils numériques
ZOTERO Standalone en version stable : nouvelles fonctionnalités « GEOsources
ZOTERO Standalone est disponible en version stable depuis fin janvier (2012). J’ai déjà relayé l’info via ma curation sur ZOTERO en signalant également l’excellent billet de Franziska Heimburger. Elle y présente les principales nouveautés valables aussi bien pour ZOTERO Standalone que pour la version fonctionnant en complément de Firefox (ZOTERO pour Firefox); je ne vais donc pas réinventer la roue (!). J’ajouterai simplement que les administrateurs de «Groupes» disposent désormais d’un filet de sécurité puisque les éléments supprimés dans les bibliothèques – de groupes – sont transférés dans une «Corbeille» (qu’il faut penser à vider de temps à autres pour libérer de la place sur l’espace auquel vous avez droit sur les serveurs de ZOTERO !). Signalons en passant que le contenu de la corbeille peut être consulté par toutes les personnes ayant accès à la bibliothèque. Marche à suivre pour installer des modules complémentaires dans la version Standalone : Redémarrez l’application.
Gephi, an open source graph visualization and manipulation software
Démarches scientifiques et réflexion éthique à l'ère computationnelle
Il nous a semblé intéressant de traduire, de façon collaborative (via Framapad), l’essai original que viennent de publier danah boyd et Kate Crawford présentant « Six provocations au sujet du phénomène des Big Data ».Ces chercheuses, orientées vers l’ethnographie des usages des technologies de communication, s’interrogent – en toute connaissance de cause [cf. cette étude sur les tweets des révolutions tunisiennes et égyptiennes à laquelle a participé danah boyd]- sur les limites épistémologiques, méthodologiques, mais aussi éthiques des Big Data : champ d’études qui s’ouvre aujourd’hui sur la base des énormes jeux de données que fournit internet, en particulier celles générées par l’activité des usagers des sites de réseaux sociaux, que seuls des systèmes informatiques ont la capacité de collecter et de traiter. 6 provocations à propos des Big Data Traduction : Pierre Grosdemouge (@cultord) & Fred Pailler (@Sociographie) à l’initiative de Laurence Allard. L’ère de Big Data a commencé.
La différence entre un #VPN et Garcimore
Suite à ma récente condamnation par la Cour d’Appel de Paris (appel formé par le parquet suite à ma relaxe en première instance), pas mal d’articles circulent sur Internet et je vois revenir des éléments techniques parfois mal interprétés (et souvent proches du raisonnement de la cour d’appel). En plus du classique débat sur l’authentification à la racine de l’extranet, le cas assez emblématique est celui du VPN. Un VPN est un réseau privé virtuel. L’une des citations largement reprise, c’est celle ci : Il y avait trouvé et téléchargé huit mille documents, par l’intermédiaire d’un réseau privé virtuel (VPN) vers une adresse IP située au Panama, ce qui explique que l’opération soit passée inaperçue. … Là, par exemple ce qui est en gras est un non-sens. Les petits dessins Un internaute sans VPN, c’est ça : Mythbusting Mais alors pourquoi c’est passé inaperçu ? Accès régulier et usage régulier = rien à signaler. Conclusion ? Je ne suis pas Garcimore Les Visiteurs Du Mercredi Garcimore par SUN42
Toute ta life sur Pastebin
Pastebin est un outil collaboratif initialement destiné aux développeurs. Il permet de copier du code ou n’importe quel type de texte afin qu’une ou plusieurs autres personnes puissent le modifier. Cet outil d’aspect très simple est pourtant très puissant et les usages que l’on peut en faire sont multiples. Les textes qu’un utilisateur copie colle sur Pastebin peuvent être privés comme publics et on peut également décider de la durée de vie de l’information en indiquant une date d’expiration. Du coup, on y trouve vraiment de tout, le meilleur comme le pire, le tout est évidemment indexable par les moteurs de recherche. C’est bien du pire que nous allons parler ici avec un logiciel malveillant, un keylogger, qui fait en ce moment des ravages. Si certaines données ne prêtent pas à de grosses conséquences comme ce faux mail d’avertissement de la HADOPI, on constate aussi des choses bien plus inquiétantes : Des comptes mails de hauts fonctionnaires compromis, Énormément de données bancaires…