all repos — slides @ de054bece69a4eb0253b3604004d5f157721ee4e

Reveal-md slides I made for various occasions

octree/semantic-old.md (view raw)

  1---
  2author: Tim Izzo
  3paging: Slide %d / %d
  4---
  5
  6# C'est quoi le Web sémantique ?
  7
  8- Réseau d'informations structurées et typées compréhensibles par les machines
  9- S’inscrit dans la logique de l’Open-Data mais bien plus ambitieux
 10- Permet une utilisation standardisée et **interconnectée** des données
 11- Permet de faire des rapprochements entre plusieurs sources de données / plusieurs sujets
 12- Considère une distribution de la données / des serveurs plutôt que de la centralisation
 13- En gros, permet de construire un grand réseau de connaissance étalé sur Internet
 14- Poussé depuis 20 ans par Tim Berners-Lee [TED](https://www.ted.com/talks/tim_berners_lee_the_next_web)
 15
 16---
 17
 18# Différence avec HTML
 19
 20- HTML est orienté _présentation des données_, à destination des humains
 21- On peut faire du HTML sémantique pour identifier le contenu de nos pages
 22- HTML a certaines limites car contextuel à une page (gestion de la navigation, contenus riches et diverses)
 23
 24```html
 25<!DOCTYPE html>
 26<html>
 27  <head>
 28    <title>Titre du document</title>
 29  </head>
 30  <body>
 31    <article>
 32      <h1>Titre de l'article</h1>
 33      <p>Texte de l'article</p>
 34    </article>
 35  </body>
 36</html>
 37```
 38
 39---
 40
 41# L'existant
 42
 43Il existe déjà beaucoup de choses et on en utilise plein sans le savoir.
 44
 45- Plusieurs initiatives pour rendre Wikipedia sémantique: https://www.dbpedia.org/
 46- Les données OpenGraph sont des données sémantiques consommées par les search engines
 47- La Confédération Suisse a un service intéressant qui cherche à croiser les données [LINDAS](La Confédération Suisse a un service intéressant qui cherche à croiser les données (LINDAS)
 48
 49> Aujourd'hui, c'est encore très technique et plutôt complexe, même si ça existe depuis 20 ans.
 50
 51---
 52
 53# Le turfu
 54
 55- La volonté de TBL est de créer le GGG (Giant Global Graph), un nouveau Web qui met l'accent sur les données
 56- Les GAFAM utilisent à fond les données sémantiques mais pour leur propre gueule
 57  - Google Search, Google Maps,...
 58  - Facebook est un pionner en la matière
 59  - Assistants intelligents (Google Assistant, Siri, Alexa,...)
 60  - IA
 61- Des initiatives comme SOLID ou Semapps visent à démocratiser l'utilisation tout en prônant un Web distribué
 62
 63---
 64
 65# À quoi ça ressemble ?
 66
 67## Format de données
 68
 69Le standard le plus utilisé est RDF, formaté en XML ou JSON.
 70
 71```xml
 72<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
 73   xmlns:foaf="http://xmlns.com/foaf/0.1/"
 74   xmlns:rss="http://purl.org/rss/1.0/"
 75   xmlns:dc="http://purl.org/dc/elements/1.1/">
 76 	<foaf:Person rdf:about="http://example.net/Paul_Dupont">
 77 		<foaf:name>Paul Dupont</foaf:name>
 78 		<foaf:img rdf:resource="http://example.net/Paul_Dupont.jpg"/>
 79 		<foaf:knows rdf:resource="http://example.net/Pierre_Dumoulin"/>
 80 	</foaf:Person>
 81 	<foaf:Person rdf:about="http://example.net/Pierre_Dumoulin">
 82 		<foaf:name>Pierre Dumoulin</foaf:name>
 83 		<foaf:img rdf:resource="http://example.net/Pierre_Dumoulin.jpg"/>
 84 	</foaf:Person>
 85 	<foaf:Image rdf:about="http://example.net/Paul_Dupont.jpg">
 86 		<dc:description>Photo d'identité de Paul Dupont</dc:description>
 87 	</foaf:Image>
 88 	<foaf:Image rdf:about="http://example.net/Pierre_Dumoulin.jpg">
 89 		<dc:description>Photo d'identité de Pierre Dumoulin</dc:description>
 90 	</foaf:Image>
 91 </rdf:RDF>
 92```
 93
 94---
 95
 96#
 97
 98## Requêtage
 99
100Il existe un language de query qui permet de requêter des données. Inspiré de SQL.
101
102```sql
103 PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>
104 PREFIX foaf: <http://xmlns.com/foaf/0.1/>
105 PREFIX dc: <http://purl.org/dc/elements/1.1/>
106 SELECT DISTINCT ?nom ?image ?description
107 WHERE {
108 	?personne rdf:type foaf:Person.
109 	?personne foaf:name ?nom.
110 	?image rdf:type foaf:Image.
111 	?personne foaf:img ?image.
112 	?image dc:description ?description
113 }
114```
115
116Cela fonctionne avec des triplets "sujet prédicat objet" et nécessite une base de données de type _triplestore_.
117
118---
119
120# Opportunités pour nous
121
122##### Créer des données sémantiques à partir de R-21 et les proposer à LINDAS
123
124C’est ce qui me semble le plus riche en terme de données sémantiques car regroupe plusieurs corps de métiers et peut intéresser d’autres pour des décisions politiques ou initiatives communales.
125
126##### Créer des données sémantiques à partir de Caroster et s'interconnecter avec d'autres
127
128Si on trouve des données sur la géocalisation d’autres transports, on peut proposer des choses plus complètes.
129
130> Par exemple: comment se déplacer d’un point un A à un point B en utilisant que des moyens de transports de type “Covoiturage”, “Bus”, “Train”.
131
132Google fait ça avec Gmaps et c’est forcément sur une base sémantique afin d'interconnecter toutes les sources.
133
134##### Mettre une couche de sémantique sur nos données internes
135
136Les informations qui nous sont nécessaires sont splitées sur plusieurs Saas et serveurs.
137Cela nous demande un effort pour assurer une cohérence de l'ensemble (que l'on fait à travers Notion).
138
139On pourrait revoir la manière dont on traite nos données pour une approche plus sémantique.
140Cela nous permettrait d'avoir des métriques plus poussées et plus facilement (data lake).
141C'est également une solution pour avoir un système d'archive indexée dans laquelle on peut rapidement trouver ce qu'on veut.
142
143##### Publier les infos d'EVOSPE
144
145EVOSPE a des données hyper intéressantes au niveau communal, cantonal et même fédéral (LINDAS) mais il faut leur accord pour faire quelque chose.
146Peut être en leur montrant l'intérêt ?
147
148Autre point, on pourrait "sémantiser" toutes les données et mettre un SPARQL dessus pour avoir un système de remonté d'informations puissants.
149Mais il faut voir le besoin avant tout.
150
151##### Decidim
152
153Permettrait de cartographier la communauté Decidim et savoir qui fait quoi où. Comme ce qui est fait sur Kumu mais avec des données utilisables plus largement.
154Semapps+Flod.io permettrait d'avoir une vu comme Kumu.
155
156L'ontologie [PAIR](https://www.virtual-assembly.org/ontologie-pair/) est pratique pour ça.
157
158##### Cartographier le réseau d'Octree
159
160Dans la même idée que Decidim, on pourrait cartographier nos projets / clients / partenaires afin de mieux
161distinguer des opportunités ou rapprochements et donner de la visbilité.
162
163---
164
165# Comment avancer ?
166
167- Le Web sémantique est un outil et pas un objectif en soi: il faut un but clair avant de faire quelque chose
168- C'est un nouveau groupe de compétences qu'on ne maîtrise pas (encore)
169- Cela peut nous donner une approche moderne et nouvelle sur la manière de considérer nos données d'applications mais aussi internes, notamment si on veut rendre
170  nos apps interopérables.
171
172- Monter en compétence sur RDF, LPD et SPARQL
173- Alimenter Archipel (Semapps)
174- Faire un POC sur un projet à nous
175- Creuser Ontologie PAIR => https://www.virtual-assembly.org/ontologie-pair/
176- Monter un pod ou un semapps à nous (avec données d'apps + internes)
177
178---
179
180# Démo Semapps
181
182=> Créer le projet Voca sur [https://archipel.assemblee-virtuelle.org/](https://archipel.assemblee-virtuelle.org/)
183
184Les données sont ensuite utilisables depuis https://data.virtual-assembly.org/ (endpoints LDP).
185
186Ou en version plus graphique: https://archipel.flod.io/
187
188---
189
190# Ressources intéressantes
191
192- Présentation SOLID et Semapps => https://pad.lescommuns.org/p/SlideInteroperabiliteSemapps#/
193- Présentation de SOLID => https://pad.lescommuns.org/p/SlideSolid
194- Présentation d'un projet national utilisant des Semapps: https://pad.lescommuns.org/p/SlideCarto4CH#/
195- Présentation d'Archipel => https://www.virtual-assembly.org/wp-content/uploads/2022/01/Archipelago-1.pdf
196- Ontologie PAIR de l'Assemblée Virtuelle : https://www.virtual-assembly.org/ontologie-pair/
197
198---
199
200Voir le contenu de ces slides: `ssh 5ika.ch -p 1917 cat slides/semantic.md -c`