Archives « Archives masala Non, non, ce blog n’est pas (complètement) mort. Il est juste en hibernation profonde (on le comprend et on l’envie), avec quelques rares soubresauts de conscience. Donc, avant de retourner dormir roulée en boule au fond de ma grotte, voici en guide de soubresaut le compte-rendu de la journée d’étude "La recherche aux archives, nouveaux outils, nouveaux publics" organisée par les Archives de la Vendée le 29 novembre dernier, que j’ai rédigé pour la lettre Archivistes ! de l’AAF (oui, je me suis réveillée assez longtemps pour publier sur ce blog, pas pour écrire un billet spécifiquement dédié, on en reparlera à la fonte des neiges…). Bon, ben c'est pas tout, ça, mais après tous ces efforts je vais peut-être retourner me coucher, moi... Comme le rappelle en préambule M. Les Archives de Vendée ont en effet initié depuis quelques années les travaux qui aboutissent aujourd’hui à la mise en ligne d’un ensemble remarquable d’outils de diffusion innovants et collaboratifs :
Dublin Core Le Dublin Core est un format descriptif simple et générique, comprenant 15 éléments. Le Dublin Core est un format descriptif à la fois simple et générique, comprenant 15 éléments différents, qui a été créé en 1995 à Dublin (Ohio) par OCLC et le NCSA (National Center for Supercomputing Applications). La version actuelle, dite 1.1, correspond à la recommandation RFC 5013 de l' IETF (Internet Engineering Task Force) validée en 2007 (cette version remplace la RFC 2413 de 1997), à la norme ANSI/NISO Standard Z39.85-2007 et ISO 15836 (version de 2003, révisée en 2009). L'agence de maintenance est la DCMI (Dublin Core Metadata Inititative), organisation non gouvernementale et non lucrative, enregistrée à Singapour et œuvrant au développement de formats de métadonnées interopérables. Objectif du Dublin Core Le Dublin Core prévoit 15 éléments tous facultatifs et tous répétables, qui portent sur la description : Dublin Core et bonnes pratiques Title (trad. fr. : Titre). Le Dublin Core à la BnF
Web des données Un article de Wikipédia, l'encyclopédie libre. Le Web des données (Linked Data, en anglais) est une initiative du W3C (Consortium World Wide Web) visant à favoriser la publication de données structurées sur le Web, non pas sous la forme de silos de données isolés les uns des autres, mais en les reliant entre elles pour constituer un réseau global d'informations. Il s'appuie sur les standards du Web, tels que HTTP et URI - mais plutôt qu'utiliser ces standards uniquement pour faciliter la navigation par les êtres humains, le Web des données les étend pour partager l'information également entre machines. Cela permet d'interroger automatiquement les données, quels que soient leurs lieux de stockage, et sans avoir à les dupliquer[1]. Tim Berners-Lee, directeur du W3C, a inventé et défini le terme Linked Data et son synonyme Web of Data au sein d'un ouvrage portant sur l'avenir du Web sémantique[2]. Principes[modifier | modifier le code] Notes et références[modifier | modifier le code]
Qu’est-ce que l’identité numérique ? - Semji Définition de l’identité numérique L’identité numérique est l’ensemble des traces numériques qu’une personne ou une collectivité laisse sur Internet. Toutes ces informations, laissées au fil des navigations, sont collectées par les moteurs de recherche, comme Google, et sont rendues public. Une identité numérique, ou IDN, peut être constituée par : un pseudo, un nom, des images, des vidéos, des adresses IP, des favoris, des commentaires etc. Cette identité virtuelle se crée par le biais des réseaux sociaux, comme Facebook ou Twitter, ou des publications sur un blog. Même si Google a mis en place un formulaire pour adresser des demandes de droit à l’oubli, celui-ci reste très compliqué à remplir. Même si elle se bat pour protéger nos identités numériques, cette notion n’est toujours pas définie clairement par le droit. Les différents types d’identité numérique L’identité déclarative L’identité calculée L’identité agissante Pourquoi protéger son identité numérique ? Changer de mot de passe
Tag Tag Un tag est un mot-clef, ou étiquette, utilisé par les usagers d’un service pour indexer une ressource. Les « tags » permettent d’indexer tout type de document (livres, photos, courriels, cartes géographiques, notices de catalogues …) et s’apposent de manière simple, rapide, souple, gratuite, instantanée. Ils proposent une indexation fine de l’ensemble des thèmes d’une même page et complètent ainsi une classification par catégorie. Généralités DURIEUX, Valérie. PETERS, Isabella. CREPEL, Maxime. FRANCIS, Elie et QUESNEL, Odile. Utilisation et mise en œuvre en bibliothèque FREMAUX, Pierre. LEBRETON, Claire. LE DEUFF, Olivier. Voir aussi Recherche d’information (recherche documentaire) /
Web sémantique, Web de données : présentation On désigne généralement par le terme de Web sémantique un ensemble de technologies développé par le W3C (l'un des principaux organismes de normalisation du Web) visant à faciliter l'exploitation des données structurées, notamment en permettant leur interprétation par des machines. Le Web de données (Linked Data en anglais) combine les technologies du Web sémantique avec les principes fondamentaux du Web (protocole HTTP, identifiants URI), avec pour objectif la construction d'un réseau d'informations structurées, disponibles en ligne et facilement réutilisables dans de nombreux contextes. Le Web sémantique Le terme de Web sémantique a été proposé par Tim Berners Lee en 2001 (« The Semantic Web », Scientific American Magazine , May 17, 2001) pour désigner une évolution du Web qui permettrait aux données disponibles (contenus, liens) d’être plus facilement utilisables et interprétables automatiquement, par des agents logiciels . Le Web de données Autres ressources majeures :
De la description des documents à l’exploitation des données : le projet data.bnf.fr La BnF a développé le projet data.bnf.fr afin de rendre ses ressources à la fois plus utiles aux internautes et plus faciles à trouver sur le Web. Lancé en juillet 2011, data.bnf.fr regroupe et expose des données bibliographiques provenant de différents catalogues (livres, archives, manuscrits) et de la bibliothèque numérique Gallica. Ces données permettent de créer des pages sur les auteurs, les œuvres et les thèmes, en rassemblant les liens vers toutes les ressources disponibles à la BnF. Par exemple, la page de Jean-Jacques Rousseau permet à l’internaute de retrouver les liens vers ses principales œuvres ainsi que vers les différentes éditions de chaque œuvre. En outre, data.bnf.fr rend disponible ses données structurées en RDF (Resource Description Framework), pour être réutilisées par des tiers. Page auteur de Jean-Jacques Rousseau dans data.bnf.fr Les données de la BnF ont une valeur sur le Web Les outils du Web sémantique au service de la bibliothèque
Web sémantique Logo du W3C pour le Web sémantique Le Web sémantique, ou toile sémantique[1], est une extension du Web standardisée par le World Wide Web Consortium (W3C)[2]. Ces standards encouragent l'utilisation de formats de données et de protocoles d'échange normés sur le Web, en s'appuyant sur le modèle Resource Description Framework (RDF). Le web sémantique est par certains qualifié de web 3.0 . Alors que ses détracteurs ont mis en doute sa faisabilité, ses promoteurs font valoir que les applications réalisées par les chercheurs dans l'industrie, la biologie et les sciences humaines ont déjà prouvé la validité de ce nouveau concept[5]. Histoire[modifier | modifier le code] Tim Berners-Lee à l'origine exprimait la vision du Web sémantique comme suit : I have a dream for the Web [in which computers] become capable of analyzing all the data on the Web — the content, links, and transactions between people and computers. — Tim Berners-Lee, Weaving the Web[13] — Weaving the Web[13]
Libre accès à l’information scientifique et technique Recherche d’information (recherche documentaire) Recherche d’information (recherche documentaire) La recherche d’information a évolué parallèlement aux technologies de stockage des données. Autrefois, elle s’effectuait à travers la consultation des catalogues papier des bibliothèques et de bibliographies spécialisées imprimées. Fastidieuse quand il fallait consulter les index bibliographiques annuels ou mensuels, elle s’est automatisée avec l’apparition de bases bibliographiques en ligne. Mais la complexité du langage d’interrogation et les coûts de communication et de consultation de ces bases nécessitaient le recours à un professionnel expert. L’apparition des cédéroms bibliographiques a déporté sur l’utilisateur final le temps d’interrogation. Ressources BOUCHARD, Aline. Apprendre à trouver. FOENIX-RIOU, Béatrice. NOËL, Élisabeth (dir.). MULLER, Joëlle. ERTZSCHEID, Olivier. DUJOL, Anne. BERGIA, Catriona. GLEYZE, Alain. Voir aussi
Gallica, la Bibliothèque numérique de la BnF Gallica est l’une des plus importantes bibliothèques numériques accessibles gratuitement sur l’internet. Elle offre l'accès à tous types de documents : imprimés (livres, presse et revues) en mode image et en mode texte, manuscrits, documents sonores, documents iconographiques, cartes et plans. Gallica s’adresse à tout lecteur, du curieux au bibliophile, du lycéen à l'universitaire. Une bibliothèque patrimoniale et encyclopédique Témoignages du patrimoine écrit français et de son rayonnement en Europe et dans le monde, les documents retenus par la BnF ont été choisis de façon à constituer une bibliothèque encyclopédique et raisonnée, représentative des grands auteurs français et des courants de recherche et de réflexion par delà les siècles. Les équipes chargées de l’enrichissement de Gallica travaillent en outre en concertation avec les chercheurs pour accompagner les grands courants actuels de recherche. Le fonds Gallica Le fonds Gallica donne accès aux collections suivantes.
18 sites ressources et outils en ligne consacrés à la recherche d’information sur Internet La recherche d’information sur Internet, un sujet inépuisable et un aspect essentiel de la navigation sur le Web. Pour éviter la perte de temps, pour apprendre à identifier et à utiliser des outils, services adaptés à sa recherche et pour découvrir des méthodes de recherche, voici une sélection 18 sites ressources et outils en ligne consacrés à la recherche d’information sur Internet : Indicateur.com En une de son site, Indicateur (dont le sous-titre est « Trouvez avant de chercher ») affiche l’actualité des moteurs de recherche avec un focus sur Google, agrège des titres d’articles de sites d’infos sur l’actualité de la recherche sur Internet. Abondance.com Créé par Olivier Andrieu, ce site pionnier consacré à la recherche d’infos sur Internet constitue un excellent point de départ pour connaître et apprendre à maîtriser les outils liés à ce sujet. Webrank.info Créé par Olivier Duffez, Webrank.info s’est spécialisé sur le référencement de sites Web. Goopilation MoteurZine Zorgloob inFlux
Wikipédia Wikipédia Écouter est une encyclopédie universelle et multilingue créée par Jimmy Wales et Larry Sanger le 15 janvier 2001. Il s'agit d'une œuvre libre, c'est-à-dire que chacun est libre de la rediffuser. Gérée en wiki dans le site web wikipedia.org grâce au logiciel MediaWiki, elle permet à tous les internautes d'écrire et de modifier des articles. Elle est devenue en quelques années l'encyclopédie la plus fournie et la plus consultée au monde. L'organisation à but non lucratif américaine Wikimedia Foundation est dépositaire de la marque Wikipedia. L'anglais a été la première langue utilisée, et Wikipédia en anglais compte plus de six millions d'articles début 2020. Historique En mars 2000, Jimmy Wales met en ligne sur le Web une encyclopédie libre[1] appelée Nupedia. Jimmy Wales, cofondateur de Wikipédia. La version française de Wikipédia est officiellement créée le 23 mars 2001. Le 20 juin 2003, la Wikimedia Foundation est créée pour financer le soutien technique de Wikipédia[5]. Nature