all repos — slides @ 924719cbe8757788660b13b04a22649fc9a1fa82

Reveal-md slides I made for various occasions

semantic.md (view raw)

  1---
  2author: Tim Izzo
  3paging: Slide %d / %d
  4---
  5
  6# C'est quoi le Web sémantique ?
  7
  8- Poussé depuis 20 ans par Tim Berners-Lee [TED](https://www.ted.com/talks/tim_berners_lee_the_next_web)
  9- S’inscrit dans la logique de l’Open-Data mais bien plus ambitieux
 10- Permet une utilisation standardisée et **interconnectée** des données
 11- Permet de faire des rapprochements entre plusieurs sources de données / plusieurs sujets
 12- Considère une distribution de la données / des serveurs plutôt que de la centralisation
 13
 14---
 15
 16# Différence avec HTML
 17
 18- HTML est orienté *présentation des données*
 19- On peut faire du HTML sémantique pour identifier le contenu de nos pages
 20- HTML a certaines limites car contextuel à une page, doit gérer de la navigation
 21
 22```html
 23<!DOCTYPE html>
 24<html>
 25  <head>
 26    <title>Titre du document</title>
 27  </head>
 28  <body>
 29    <article>
 30      <h1>Titre de l'article</h1>
 31      <p>Texte de l'article</p>
 32    </article>
 33  </body>
 34</html>
 35```
 36
 37---
 38
 39# L'existant
 40
 41Il existe déjà beaucoup de choses et on en utilise plein sans le savoir.
 42
 43- Plusieurs initiatives pour rendre Wikipedia sémantique: https://www.dbpedia.org/
 44- Les données OpenGraph sont des données sémantiques consommés par les search engines
 45- La Confédération Suisse a un service intéressant qui cherche à croiser les données [LINDAS](La Confédération Suisse a un service intéressant qui cherche à croiser les données (LINDAS)
 46
 47---
 48
 49# Le turfu
 50
 51- La volonté de TBL est de créer le GGG (Giant Global Graph), un nouveau Web qui met l'accent sur les données
 52- Les GAFAM utilisent à fond les données sémantiques mais pour leur propre gueule
 53   - Google Search, Google Maps,...
 54   - Facebook est un pionner en la matière
 55   - Assistants intelligents (Google Assistant, Siri, Alexa,...)
 56   - IA
 57- Des initiatives comme SOLID ou Semapps visent à démocratiser l'utilisation tout en prônant un Web distribué
 58
 59---
 60
 61# À quoi ça ressemble ?
 62## Format de données
 63
 64Le standard le plus utilisé est RDF, formaté en XML ou JSON.
 65
 66```xml
 67<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
 68   xmlns:foaf="http://xmlns.com/foaf/0.1/"
 69   xmlns:rss="http://purl.org/rss/1.0/"
 70   xmlns:dc="http://purl.org/dc/elements/1.1/">
 71 	<foaf:Person rdf:about="http://example.net/Paul_Dupont">
 72 		<foaf:name>Paul Dupont</foaf:name>
 73 		<foaf:img rdf:resource="http://example.net/Paul_Dupont.jpg"/>
 74 		<foaf:knows rdf:resource="http://example.net/Pierre_Dumoulin"/>
 75 	</foaf:Person>
 76 	<foaf:Person rdf:about="http://example.net/Pierre_Dumoulin">
 77 		<foaf:name>Pierre Dumoulin</foaf:name>
 78 		<foaf:img rdf:resource="http://example.net/Pierre_Dumoulin.jpg"/>
 79 	</foaf:Person>
 80 	<foaf:Image rdf:about="http://example.net/Paul_Dupont.jpg">
 81 		<dc:description>Photo d'identité de Paul Dupont</dc:description>
 82 	</foaf:Image>
 83 	<foaf:Image rdf:about="http://example.net/Pierre_Dumoulin.jpg">
 84 		<dc:description>Photo d'identité de Pierre Dumoulin</dc:description>
 85 	</foaf:Image>
 86 </rdf:RDF>
 87```
 88---
 89
 90#
 91## Requêtage
 92Il existe un (unique?) language de query qui permet de requêter des données. Inspiré de SQL.
 93
 94```sql
 95 PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>
 96 PREFIX foaf: <http://xmlns.com/foaf/0.1/>
 97 PREFIX dc: <http://purl.org/dc/elements/1.1/>
 98 SELECT DISTINCT ?nom ?image ?description
 99 WHERE {
100 	?personne rdf:type foaf:Person.
101 	?personne foaf:name ?nom.
102 	?image rdf:type foaf:Image.
103 	?personne foaf:img ?image.
104 	?image dc:description ?description
105 }
106```
107
108> Il n'est pas simple à prendre en main et va nous nécessiter du temps de formation si on veut en faire quelque chose.
109
110---
111
112# Opportunités pour nous
113
114##### Créer des données sémantiques à partir de R-21 et les proposer à LINDAS
115C’est ce qui me semble le plus riche en terme de données sémantiques car regroupe plusieurs corps de métiers et peut intéresser d’autres pour des décisions politiques ou initiatives communales.
116
117##### Créer des données sémantiques à partir de Caroster et s'interconnecter avec d'autres 
118
119Si on trouve des données sur la géocalisation d’autres transports, on peut proposer des choses plus complètes.
120
121> Par exemple: comment se déplacer d’un point un A à un point B en utilisant que des moyens de transports de type “Covoiturage”, “Bus”, “Train”.
122
123Google fait ça avec Gmaps et c’est du sémantique qu’ils font probablement.
124
125##### Mettre une couche de sémantique sur nos données internes
126
127Les informations qui nous sont nécessaires sont splitées sur plusieurs Saas et serveurs.
128Cela nous demande un effort pour assurer une cohérence de l'ensemble (que l'on fait à travers Notion).
129
130On pourrait revoir la manière dont on traite nos données pour une approche plus sémantique.
131Cela nécessiterait de "casser les structures" mais nous permettrait d'avoir des métriques plus poussées et plus facilement (data lake).
132
133##### Publier les infos d'EVOSPE
134
135EVOSPE a des données hyper intéressantes au niveau communal, cantonal et même fédéral (LINDAS) mais il faut leur accord pour faire quelque chose.
136Peut être en leur montrant l'intérêt ? 
137
138Autre point, on pourrait "sémantiser" toutes les données et mettre un SPARQL dessus pour avoir un système de remonté d'informations puissants.
139Mais il faut voir le besoin avant tout.
140
141##### Decidim ?
142
143---
144
145# Comment avancer ?
146
1471. Monter en compétence sur RDF et SPARQL, faire des formations
1482. Faire un POC sur un projet à nous
1493. Voir si ça intéresse LINDAS
150
151---
152
153# Notes de fin
154
155- Le Web sémantique est un outil et pas un objectif en soi: il faut un but avant de faire quelque chose
156- C'est un nouveau groupe de compétences qu'on ne maîtrise pas (encore)
157- Cela peut nous donner une approche moderne et nouvelle sur la manière de considérer nos données d'applications mais aussi internes