Le Web sémantique : de nouveaux enjeux documentaires ?
Qu'est-ce que le web sémantique ? Une nouvelle ambition pour le web de demain ? Une plate-forme technologique visant à développer de nouveaux services ? Un nouveau champ de recherche et d'expérimentations ? Impulsé par Tim Berners-Lee dès 1998, développé dans le cadre du W3C (Consortium World Wide Web) depuis 2001, le web sémantique se veut une extension du web actuel, visant à rendre les contenus, non plus uniquement accessibles et affichables, mais aussi exploitables et interprétables par des machines. Comment ? D'un point de vue architectural, le web sémantique est une infrastructure articulant trois composantes majeures : - les métadonnées, qui permettent de qualifier les flux informels du web ; - les ontologies, destinées à représenter, dans un formalisme opératoire, les connaissances utiles à la méta-description ; Pourquoi ? Et les professionnels de l'information ?
IFLA 2012 et le Web sémantique
Comme vous le savez, je suis gravement monomaniaque et la seule chose qui m'intéresse à l'IFLA c'est les communications qui portent sur le Web sémantique, le Linked Data ou autre chose du même genre. Heureusement il y en a plein. Voici un petit raccourci à travers les papiers à lire sur le sujet (sans garantie de leur qualité ou de leur contenu, je n'ai pas encore eu le temps de tout regarder ni même d'assister aux présentations...). Dimanche, au sein de la session sur les moments inspirés du catalogage, il y a eu la présentation du projet Pode et de problématiques liées aux données de data.bnf.fr. Lundi dans la session Unimarc, une présentation intitulée "Linked data for libraries" par des gens de l'université de Portsmouth. Dans la même session il y a eu aussi une courte présentation du Bibliographic Framework Initiative par la Library of Congress, mais il n'y a pas de document en ligne et je tiens de Sally Mc Callum elle-même que tout est sur le site web.
GeoNames
Un article de Wikipédia, l'encyclopédie libre. GeoNames est une base de données géographiques gratuite et accessible par Internet sous une licence Creative Commons. Base de données et services Internet[modifier | modifier le code] La base de données[1] contient plus de 8 millions de noms géographiques qui correspondent à plus de 6,5 millions de lieux existants. Les coordonnées géographiques sont basées sur le système de coordonnées WGS 84 (World Geodetic System 1984). Les informations sont accessibles gratuitement par une interface Internet[2]. L'interface est de type wiki et les utilisateurs peuvent ajouter des données, les améliorer ou corriger les données présentes. Intégration web sémantique[modifier | modifier le code] Chaque caractéristique de GeoNames est représentée comme une ressource web identifiée par un identifiant URI stable. Ce dialecte décrit les propriétés des caractères GeoNames en utilisant le OWL[3]. Interfaces de programmation[modifier | modifier le code]
data.bnf.fr
Mis en ligne en 2011, data.bnf.fr permet de rendre les ressources de la BnF plus visibles des internautes et plus utiles sur le web. Ce site s’inscrit dans une démarche de la BnF d’ouverture des données et d’adoption des standards du web sémantique. data.bnf.fr couvre aujourd'hui une partie des ressources de la BnF, et poursuit son développement et son accroissement. Une meilleure exposition sur le web Le projet data.bnf.fr améliore la visibilité des ressources de la BnF, souvent dissimulées dans le web « profond », et signale les documents numériques directement accessibles. En effet, les pages de data.bnf.fr sont indexables par les moteurs de recherches. Ceux-ci ne référencent pas les données et les métadonnées qui sont cachées dans les bases de données non indexables de la BnF. Un pivot entre les ressources data.bnf.fr permet donc de valoriser la richesse des fonds de la BnF sur le web et de servir de pivot entre les différentes ressources. Utilisation des outils du web sémantique
Le Seigneur des Anneaux
Par J. R. R. Tolkien Biographie de l'auteur John Ronald Reuel Tolkien, plus connu sous sa signature : J. Présentation des éditeurs 'Considered to be J.R.R. (Source : Amazon) Infos bibliographiques Le Seigneur des anneaux (The Lord of the Rings) est un roman en trois volumes de J. Langue originale de la publication : Anglais Indices Dewey : 823 : English fiction ; Genres : Adventure novel ; Speculative fiction ; Fiction ; High fantasy ; Chivalric romance ; Fantasy ; Indexation matières avec LCSH : Fiction ; Baggins, Frodo (Fictitious character) ; Middle Earth (Imaginary place)--Fiction ; Fantasy fiction, English ; Correspondances du LCSH avec Rameau : Nouvelles fantastiques anglaises ; Éditions Editions provenant de Freeebase Editions provenant de Libris Les personnages principaux
Rions un peu avec le web de données du Ministère de la Culture
[update du 26/11/2012 : le site data.culture.fr, cité ci-dessous, a été modifié le 22 novembre, après la parution de ce billet et ses mentions légales ont été supprimées. Les captures d'écrans figurant ci-dessous attestent encore de l'état antérieur] En matière de diffusion des données culturelles en France, il y a hélas souvent bien plus d’occasions de pleurer que de rire. Nightmare Fuel. Cette semaine était cependant un peu plus réjouissante, avec la signature d’une convention entre Wikimedia France, l’INRIA et le Ministère de la Culture autour du projet Semanticpédia, qui vise à sémantiser plusieurs jeux de données issues des projets de Wikimedia. A cette occasion, Aurélie Filippetti a prononcé un discours dans lequel c’est la première fois qu’un Ministre de la Culture invite les établissements culturels français à contribuer à l’enrichissement des données de Wikipedia : Mais ce partenariat ne saurait être à sens unique. Sémantisation sans Open Data, nous y sommes… Red Noses. Like this:
Faceted Search - DBpedia
Faceted Wikipedia Search allowed users to ask complex queries, like “Which Rivers flow into the Rhine and are longer than 50 kilometers?” or “Which Skyscrapers in China have more than 50 floors and have been constructed before the year 2000?” against Wikipedia. The answers to these queries are not generated using key word matching as the answers of search engines like Google or Yahoo, but are generated based on structured information that has been extracted from many different Wikipedia articles. Unfortunately, the application cannot be offered any more. Faceted Search DBpedia Search implements the faceted search paradigm. The User Interface The user interface consists of several interacting components, which are highlighted in the following screenshot and described below. Search Results: The names, abstracts and (if available) images of the Wikipedia entries matching the current criteria are displayed in the center of the page. Background neofonie GmbH, Berlin and the
La Transition bibliographique en France | www.transition-bibliographique.fr
English version : Bibliographic transition in France Quel est ce mouvement de transition, qui anime toutes les bibliothèques du monde ? Que vont-elles abandonner, que vont-elles acquérir ? Et comment la France met-elle en œuvre ce changement ? Pourquoi parle-t-on de transition bibliographique ? Jusqu’à la fin du 20e siècle, un document possédé par une bibliothèque était décrit, dans son catalogue informatisé, sous la forme d’une notice bibliographique. insatisfaction des usagers des catalogues, lassés d’obtenir, pour une recherche sur une œuvre souvent éditée, une multitude de résultats quasi-identiques ;inadaptation de cette pratique avec la tendance mondiale initiée par l’apparition du web sémantique, où les données sont agencées entre elles par des relations logiques. Quelle est la position de la France, face à cette transition ? La position française est de reprendre les consignes de RDA, lorsque c’est possible, mais de les adapter au contexte français chaque fois que nécessaire.