background preloader

SPARQL

Facebook Twitter

Sans titre. Plusieurs approches ou outils pour la récupération et le croisement de données sont possibles. Les traitements ont été faits ici avec des outils en ligne de commande tels que « curl » pour le téléchargement, « csvkit » ou les manipulations de CSV et « ogr2ogr » ou les données géographiques. Parmi les sites classés à l’UNESCO, il y en a un d’un peu particulier nommé « Chemins de Compostelle en France ». Celui-ci est composé de 71 constructions (cathédrales, églises, ponts…) et 7 tronçons de chemin répartis en France. Ici, ous recherchons à obtenir des informations sur les différentes « composantes » de ce « site » et leurs environnements immédiats en utilisant et croisant des sources de données libres et ouvertes.

Ils nous l’ont longtemps promis, mais aujourd’hui le web sémantique est disponible et utilisable, notamment via Wikidata. Wikidata est une base de données mais pas au sens le plus classique du terme. Notre point de départ est l’entité Wikidata du « site » classé à l’UNESCO. Accueil - Delair-Tech. Lod-datasets_2009-07-14. Protected SPARQL Query Service. SPARQLer. Parliament High-Performance Triple Store. SIG. Ordnance Survey Linked Data – Combining postcode and spatial queries. In my previous blog posts (here, here and here) I concentrated on a few simple SPARQL queries. However, these SPARQL queries were only performed on one dataset at a time. With linked data things get more interesting when you combine datasets (even if those datasets are both from the same publisher). The original opendata for Code-Point(R) Open was published as a CSV file, and Boundary-Line(TM) was published as a shape file.

Both formats are useful, but combining the two datasets can be tricky if you are not sure how to use shape files. To query both datasets go to the SPARQL endpoint for the combined data: Recall that the query: To find all the postcodes in Bevois and the wards touching Bevois we simply union the two queries above together: As an exercise for the reader – find all postcodes in Southampton and districts touching Southampton.

Like this: Like Loading... IT (513) Ordnance Survey SPARQL Endpoint. I just wanted to quick mention one feature of the Ordnance Survey linked data SPARQL endpoints that I think it pretty neat. Go to the SPARQL endpoint and try one of the queries from my last four blogs posts. In this post I’ll got with the following simple query (recall this query gets the name, lat, long, gss code and unit_id for all districts in Great Britain): select ? Name ? Where ? ? ? ? ? ? You will notice that on hitting the query button that a box will appear that says “Request” and a rather long URL will appear: You can now use this URL to issue a GET request in PHP, Javascript etc. and use these output within a web application just as you would with any API call.

Curl LONG_URL where LONG_URL is your long URL. Happy SPARQLing… Like this: Like Loading... Ordnance Survey Linked Data – A Simple Postcode Query. In the previous two blog posts (here and here) I gave some simple examples of queries you could run on the Ordnance Survey Boundary-Line(TM) linked data. Here I want to give some simple examples of what you can do with the Code-Point(R) Open linked data. The Code-Point(R) Open linked data has a URI for every Postcode Unit, Postcode Sector, Postcode District and Postcode Area in England, Scotland and Wales. Each Postcode Unit is nested within a Postcode Sector, each Postcode Sector is nested within a Postcode District and each Postcode District is nested within a Postcode Area. The reciprocal contains relationships are also included. A Postcode Unit URI takes the form: A Postcode SectorURI takes the form: A Postcode District URI takes the form: A Postcode Area URI takes the form: Let us now try some SPARQL.

So far so easy… Ordnance Survey Linked Data – Combining postcode and spatial queries. Accueil - Espace RDF de l'INSEE. Le tutoriel SPARQL. L'objectif de ce tutoriel SPARQL est de donner un cours rapide en SPARQL. Le tutoriel couvre les fonctionnalités majeures du langage de requête au travers d'exemples, mais ne vise pas à être complet. Si vous cherchez une courte introduction à SPARQL et Jena, essayez Recherche de données RDF avec SPARQL . SPARQL est un langage de requêtes et un protocole pour accéder au RDF conçu par le groupe de travail du W3C RDF Data Access . Comme un langage de requête, SPARQL est « orienté données » en ce sens qu'il interroge uniquement les informations détenues dans des modèles ; il n'y a pas d'inférence dans le langage de requête lui-même. Évidemment, le modèle Jena peut être « intelligent » en ce sens qu'il fournit l'impression que certains triplets existent en les créant à la demande, y compris le raisonnement OWL.

Commentez Tout d'abord, il faut être clair sur quelles données sont interrogées. Il est important de réaliser que ce sont les triplets qui importent, pas la sérialisation. II-A. ? II-B. Sparql Endpoint : entrer dans une base de triplets. La rédaction du précédent billet m’a fait découvrir les interfaces prévues par les bases de triplets pour accéder (via requête SPARQL) aux données qui y sont stockées. J’y ai constaté que dans le formulaire sont généralement proposées, très obligeamment, des requêtes par défaut. Par exemple, pour la DBpedia anglophone, la requête est : select distinct ? Concept where {[] a ? Sur le catalogue collectif Libris : Sur Isidore (tiens, c’est la même que pour la DBpedia anglophone) : SELECT DISTINCT ? Sur la DBpedia francophone : Quand on se contente simplement de valider et exécuter ces requêtes, puis qu’on les modifie progressivement, cela permet d’entrer progressivement dans la base et de comprendre en quoi les linked data sont "auto-documentées" (par comparaison avec les API, par exemple).

Je vais m’arrêter sur 2 de ces requêtes, en guise d’illustration Requête proposée par Isidore et la DBpedia anglophone Je la remets ici, et vais la commenter en détail : SELECT DISTINCT ? [] désigne un noeud blanc. Virtuoso SPARQL Query Editor. SPARQL Endpoint ? Au fil de mes lectures et explorations autour des linked data, voilà une expression que j’ai retrouvé fréquemment — jamais traduite, et toujours dans des phrases du genre "après avoir déclaré le SPARQL Endpoint". C’est un truc qui intervient en bout de chaine, quand on a mis en ligne une base de triplets.

Mais en quoi ça consiste ? En essayant de le comprendre, je suis tombé sur des définitions comme celle-ci : A SPARQL endpoint is a conformant SPARQL protocol service as defined in the SPROT specification. Et encore, c’est ce qu’on trouve de mieux : le pire, c’est de consulter la page officielle du W3C sur SPARQL et d’y constater que le mot "Endpoint" en est absent… Bref, je n’en suis sorti que grâce à quelques tweets de @lespetitescases, très éclairantes.

De l’URL racine pour interroger en SPARQL la base de triplets. Petite définition Commençons par des comparaisons : C’est vrai aussi pour les API : Cas pratique : le SPARQL Endpoint de DBpedia 2 zones essentielles : select distinct ? Like this: