Quand l'archivage rencontre le Big Data : faire du décisionnel à bas coût dans le Cloud privé. Les géants de l’informatique stockent la mémoire du monde. Le développement de l’informatique a fait naître des « fermes de données », où sont conservées les milliards d’informations numériques que nous échangeons tous les jours sur Internet.
MONTPELLIER (Hérault), de notre envoyé spécial Les internautes du monde entier ne se doutent pas, quand ils se connectent via leur ordinateur, qu’ils peuvent aboutir ici : dans la zone industrielle de Montpellier, un bâtiment climatisé niché au pied de collines où chantent les grillons. Nous sommes sur un des plus anciens sites français du géant IBM.
Ici, la firme américaine possède un « data center ». En français, on parlerait plutôt d’une « ferme de données ». Le développement de l’informatique, en effet, a conduit quelques géants du secteur à développer ainsi de gros centres serveurs. La quantité d’informations ainsi stockées sous forme numérique ne cesse d’augmenter. Chacun a la taille de 10 terrains de football. À Montpellier, IBM dispose d’un centre plus réduit. Le concept d’archivage numérique pérenne. Que recouvre exactement le terme d’archivage numérique pérenne ?
En quoi est-ce vraiment différent de la sauvegarde sécurisée ? Dans le contexte informatique, le terme « archivage » recouvre aujourd’hui plusieurs sens. Disons donc rapidement ce que n’est pas l’archivage numérique pérenne : L’archivage numérique pérenne n’est pas une sauvegarde. Il ne s’agit pas seulement de préserver le train de bits d’un fichier.L’archivage numérique pérenne n’est pas un service HSM – hierarchical storage manager – qui migrent les fichiers sur bande pour faire de la place sur disque.L’archivage numérique pérenne n’est pas non plus l’ultime étape du stockage des données avant l’oubli ou la perte définitive.
L’archivage pérenne du document numérique a 3 objectifs principaux : Stockage d'information. Le stockage d'information est aujourd'hui assuré par un support d'information électronique, ou électromagnétique, qui, vu de l'utilisateur, peut être physique (disque dur, clé USB, etc.) ou virtuel (Internet dénommé le « nuage » (en anglais cloud voire en franglais « le cloud »), mais qui en l'état de la technologie est enregistré sur un support physique (SSD, disque dur, CD/DVD, bande magnétique, etc.).
Ainsi, le terme de « dématérialisation » employé pour désigner le passage d'un support d'information papier à un support électronique est peu approprié, puisque ce dernier est lui aussi lié à du matériel. Le choix de la méthode de stockage se fait selon plusieurs critères : la fréquence d'utilisation ;les besoins capacitaires de l'information (taille) ;la criticité de l'information (coût, sécurité) ;La capacité de stockage et la vitesse d’accès à l'information. L’archivage numérique, qu’est-ce que c’est ? L’archivage numérique pérenne des documents électroniques consiste à conserver le document et l’information qu’il contient : Dans son aspect physique comme dans son aspect intellectuelSur le très long termeDe manière à ce qu’il soit en permanence accessible et compréhensible INTEGRITEComment se protéger de la détérioration des supports ?
Comment s’assurer que l’information contenue sur le média n’est pas altérée ? En 2006, la NASA lançait une enquête pour retrouver plus de 13 000 bandes magnétiques produites lors de diverses missions spatiales,Lire la suite. ADN stockage données numériques / DNA DIGITAL DATA STORAGE. Support de stockage.
Quel fournisseur propose les disques durs les plus fiables ? Quels sont ceux qu'il faut éviter ? Une question que l'on me pose souvent est : « quel est le meilleur disque dur à acheter ?
» C'est une question difficile car, à moins d'avoir des dizaines de milliers de disques qui tournent, on finit par se fier à ce que disent les fabricants, ou à quelques anecdotes personnelles. Mais il existe une entreprise qui fait tourner des dizaines de milliers de disques durs et qui surveille de près les taux d'échec. Cette entreprise, spécialisée dans le stockage dans le Cloud, se nomme Backblaze. Et elle a publié ses statistiques sur la fiabilité des disques durs au premier trimestre 2020. Red Hat : Ceph Storage 4 est dispo, le point sur les nouveautés. Avez-vous vraiment besoin d'un software-defined storage pour traiter des pétaoctets de données ?
Alors, Red Hat, avec la dernière édition de Red Hat Ceph Storage (RHCS), a la technologie qu'il vous faut. RHCS est basé sur la version Nautilus du projet de stockage open-source Ceph. Il est conçu pour fonctionner sur du matériel de série (COTS - commercial off-the-shelf), bref des serveurs de série. Mais, grâce à sa capacité à traiter des pétaoctets de données, vous êtes plus susceptible de l'utiliser dans des fermes de données, des centres de données et dans le cloud.
Par exemple, vous pouvez l'utiliser pour déployer un système de stockage objet à l'échelle du pétaoctet, compatible avec Amazon Simplified Storage Service (S3). Les SSD en entreprise, une option plus fiable que les disques durs mécaniques ? Alors que les disques durs mécaniques stockent toujours la majeure partie des données en entreprise et sont devenus étonnamment fiables et rentables, les SSD effectuent néanmoins une percée auprès des entreprises.
Le tout grâce à des performances proposées désormais proposées dans des boîtiers compacts et économes en énergie. HPE : ce disque SSD s’autodétruira dans 32 768 heures. 32 768 heures d’utilisation et pas une de plus : HPE a publié un avertissement concernant un bug découvert dans le firmware utilisé pour plusieurs de ses disques SSD.
Ce bug pouvait provoquer le plantage du disque SSD en question après 32 768 heures de fonctionnement, soit 3 ans, 270 jours et 8 heures précises. Un dysfonctionnement problématique : comme le précise HPE dans son alerte, il est impossible ou très complexe de récupérer les données présentes sur le disque. Les disques étant garantis 5 ans, HPE risque de se retrouver avec un certain nombre de ses modèles sur les bras si le correctif n’est pas appliqué. De plus, HPE précise que les disques durs installés et mis en opération en même temps, comme c’est le cas dans les configurations RAID, pourraient cesser de fonctionner en même temps, ce qui pourrait occasionner une perte de données.
Sur reddit, plusieurs internautes ont d’ailleurs évoqué des cas de ce type, avec 6 disques SSD HPE qui plantent tous en l’espace de 15 minutes. Flash et cloud, les innovations d'une décennie de stockage. Il y a 40 ans, lorsque j’ai eu mon premier Apple, acheté en 1978, il fallait débourser 800 $ pour une disquette de 140 kb, ou 50 $ pour un lecteur de cassette Panasonic (ceux qui ont eu ce genre de lecteur connaisse la signification d’un stockage à l’accès aléatoire).
Depuis, d’énormes changements ont eu lieu à chaque décennie dans le domaine du stockage, et les années 2010 ne font pas exception. Voici mon top 3 des technologies clés de la décennie : Coronavirus : les centres de données veulent être reconnus « infrastructures critiques » Data4 construit 23 datacenters - Numerique.