Protection des données personnelles, anonymisation, sécurité des données Comme pour de nombreux Data Labs ou plateformes Big Data, les questions de donnée personnelle, des techniques de protection et d’anonymisation représentent des enjeux vitaux pour nous. Nous allons détailler notre approche de ces questions dans plusieurs articles, dont voici le premier. Ces notions sont complexes et se recouvrent largement, aussi je vais m’attacher dans ce premier article à présenter comment s’articulent les différents aspects – données personnelles, usages, solutions d’anonymisation et limites. A retenir Données personnelles – Un sujet sensible qui demande autorisations et précautions La notion de « donnée personnelle » est floue, et si l’on se réfère à divers avis du G29 (groupe de travail « Article 29 » des homologues européens de la CNIL), sa définition juridique est large :
Java Native Interface Un article de Wikipédia, l'encyclopédie libre. Voici quelques exemples d'utilisation de JNI : Certaines fonctions du matériel ou du système d'exploitation ne sont pas gérées dans les bibliothèques JavaPouvoir s'interfacer avec des applications écrites dans d'autres langagesPour les applications temps réel, utiliser un langage compilé (c'est-à-dire du code natif) sera plus rapide que de passer par le bytecode de Java. Complexité de la programmation[modifier | modifier le code] Interfacer JNI est moins complexe avec un langage qui utilise déjà des objets (comme le C++), alors qu'à l'opposé des langages comme le C n'ont pas de concept d'objet et rendent la programmation plus ardue.
SETI@home Un article de Wikipédia, l'encyclopédie libre. SETI@home (abréviation de SETI at home, pouvant se traduire par « SETI à la maison ») est un projet de calcul distribué utilisant des ordinateurs branchés sur Internet. Il est hébergé par le Space Sciences Laboratory de l'université de Californie à Berkeley et est accessible au public depuis le [1],[2],[3]. Recherche scientifique[modifier | modifier le code] Blockchain et GDPR : le malentendu - Blockchain Partner Blockchain et GDPR (RGPD en français) sont parfois présentées – à tort – comme incompatibles. Cet article soutient que : ● la blockchain peut contenir des données personnelles, mais en tant que protocole ne peut être considérée comme responsable du traitement ; le GDPR ne lui est donc pas applicable ; ● les tiers faisant l’interface entre la blockchain et les utilisateurs sont, eux, assujettis au droit des données personnelles : c’est donc sur ces derniers que pèsent les obligations de ce texte (droit à l’effacement notamment). ● la blockchain est une infrastructure unique pour préserver la confidentialité et la sécurité de nos données, à la fois privacy et security by design. Blockchain et GDPR, l’union impossible ? Vraiment ? Le 25 mai 2018, l’entrée en application du Règlement Général sur la Protection des Données dans l’ensemble de l’Union Européenne constituera une évolution majeure du droit de la protection des données personnelles. Le GDPR s’applique aux tiers à la blockchain
Scala (langage) Un article de Wikipédia, l'encyclopédie libre. Scala intègre les paradigmes de programmation orientée objet et de programmation fonctionnelle, avec un typage statique. Il concilie ainsi ces deux paradigmes habituellement opposés (à de rares exceptions près, telle que le langage OCaml) et offre au développeur la possibilité de choisir le paradigme le plus approprié à son problème. Il est prévu pour être compilé en bytecode Java (exécutable sur la JVM), ou .Net. Ces deux plateformes sont supportées officiellement par l'EPFL. Si on souhaite l'utiliser exclusivement avec la JVM, il est alors possible d'utiliser les bibliothèques écrites en Java de façon complètement transparente.
Traitement parallèle CUDA Qu’est-ce que CUDA ? CUDA est une architecture de traitement parallèle développée par NVIDIA permettant de décupler les performances de calcul du système en exploitant la puissance des processeurs graphiques (GPU). Alors que des millions de GPU compatibles avec CUDA ont été vendus, des milliers de développeurs de logiciels, de scientifiques et de chercheurs utilisent CUDA dans une grande gamme de domaines, incluant notamment le traitement des images et des vidéos, la chimie et la biologie par modélisation numérique, la mécanique des fluides numérique, la reconstruction tomodensitométrique, l’analyse sismique, le ray tracing et bien plus encore. Traitement parallèle avec CUDA Le calcul informatique a évolué en passant du traitement central exclusif des CPU vers les capacités de co-traitement offertes par l’association du CPU et du GPU. Du côté de la recherche scientifique, CUDA a été reçu avec enthousiasme.
Des données personnelles à l'anonymisation – Quelles conséquences pour l'archivage ? L’arrivée du Règlement Général sur la Protection des Données (RGPD), qui doit permettre aux citoyens de reprendre le contrôle de leurs données personnelles, modifie radicalement les politiques de conservation à long terme des données et métadonnées archivées, ce depuis leur collecte, désormais soumise aux conditions de licéité de l’article 6 du RGPD (essentiellement accord de la personne concernée, ou obligations réglementaires), jusqu’au traitement du sort final des informations conservées. Dans le cadre de l’archivage de documents électronique à valeur probatoire, la modification des documents n’est pas envisageable (pour des raisons d’intégrité documentaire). En l’état, c’est le consentement ou le caractère réglementaire qui permettra la conservation du document (une copie de pièce d’identité, par exemple). Nous allons donc examiner comment, et quand, dans le cycle de vie de l’archive, il faut envisager l’anonymisation des métadonnées. Pseudonymisation des données personnelles
Hadoop Un article de Wikipédia, l'encyclopédie libre. Hadoop a été créé par Doug Cutting et fait partie des projets de la fondation logicielle Apache depuis 2009. Historique[modifier | modifier le code] En 2004, Google publie un article présentant son algorithme basé sur des opérations analytiques à grande échelle sur un grand cluster de serveurs, le MapReduce, ainsi que son système de fichier en cluster, le GoogleFS.