Présentation PPT - Le Forum français de l`OGC

Report
Sémantisation des données pour le
monde
environnemental
Danielle Ziébelin
Philippe Genoud
LIG STEAMER Université de Grenoble
[email protected]
1
Données environnementales
• Que sont les données environnementales :
–
–
–
–
–
Collections : spécimens, échantillons, prélèvements …
Études Écologiques
Séquences génomiques
Analyses d’images, LIDAR
Monitoring de la biodiversité
• Quels sont les traitements :
– identifier, comparer, évaluer les populations ou des quantités,
localiser et dater des données et/ou des analyses
• Les données de la biodiversité sont
– Globalement distribuées et volumineuses
– Hautement hétérogènes au niveau de leur structure et leur
contenu
– Augmentent rapidement
2
Le web sémantique peut aider à
l’intégration et au partage de données
• Métadonnées
– Directive Inspire
– Directive SEIS (Shared Environmental Information System )
– Iso 19115, 19119,19110 …
• Vocabulaires contrôlés
–
–
–
–
–
–
LTRE (Linked Thesaurus fRamework for Environement),
EARTh (Environmental Applications)
Thésaurus Ecoplanète (ministère Ecologie),
Thesaurus AnaEE-France,
EnVoc (en relation avec Convention sur la biodiversité),
…
• Ontologies
–
–
–
–
–
–
OBOE (Extensible Observation Ontology)
SERONTO (Socio-Ecological Research and Observation oNTOlogy)
SWEET (Semantic Web for Earth and Environmental Terminology)
SSN ontology (Semantic Sensor Network Ontology)
Envo (Environment Ontology),
…
3
Charactéristiques communes des
architectures du web sémantiques (1)
Quelle est
l’évolution de cet
écosystème (eau,
sol) par rapport au
réchauffement
climatique ?
Quelles sont les ressources
en eaux que je peux allouer
à un projet d’extraction
pétrolière et gazière ?
Accéder à des
ressources :
données ou des
connaissances
Web
Services WEB configurés
pour ajouter de
l’information
Applications WEB applications
pour des utilisateurs avec un GUI
adapté
Collecter de nouvelles
données
4
Plan
•
•
•
•
•
•
•
Introduction et objectifs
Architecture
Données et modèles de données
Ontologies
Lier les données
Requêtes sémantiques
Conclusions
5
Exemple d’Architecture MAP-EON
MapEON
Client
Query Processor (SPARQL)
Ontology manager
MapEON server
OWL DL
ontologies
RDF Graph
OWL reasoner
Ontology Loader
LOD Cloud
Triplestore
Data Loader
Adaptator1
…
…
Adaptatorn
6
Exemple d’architecture ObsBD
“Lightweight Ontology-Based Tools for Managing Observational Data” Shawn Bowers,
Riley Englin, Carlos Fonseca, Paul Jewell, Lauren Joplin, Patrick Mosca, Tyler Pacheco,
Jacob Troxel, Tyler Weeks, Proceedings of the First International Workshop on Semantics
for Biodiversity Montpellier, France, May 27, 2013
7
Technologies de Web Sémantique
•Données et Ontologies
– Ontologies (RDFS/OWL )
– Annotations (RDF)
– Déduction (Pellet, Hermit, BraidComposer …)
– Requêtes (SPARQL)
• Services
– WFS - WPS
– Web services sémantiques
8
Plan
•
•
•
•
•
•
•
Introduction et objectifs
Architecture
Données et modèles de données
Ontologies
Lier les données
Requêtes sémantiques
Conclusions
9
Données de MAP-EON
• tabular data (excel file)
Measure
Descriptor
Region
Measure
Site
Measures Set
location
site type
10
Modèle de données de l’application
Quelques classes et relations qui décrivent les concepts utilisés dans
l’application
11
Graphe RDF
Les données sont transformées en un graphe RDF qui utilise le vocabulaire défini dans le
modèle d’application.
RDF Resource Description Framework (W3C standard)
subject
individual
(resource
identified by an URI)
predicate
object property
data property
rdf:type
RDFS and OWL add semantic to RDF
object
individual
literal value
Owl class defining the
rdf:type of the individual
rdf:type
rdf:type
rdf:type
rdf:type
12
Exemple d’ontologie de Domaine
• Le graphe peut être enrichi en exploitant une ontologie de domaine
Hydrologic Ontology for Discovery (http://his.cuahsi.org/ontologyfiles.html)
The purpose of this ontology is to support the discovery of time-series data
collected at a fixed point, including physical, chemical, and biological
measurements.
13
Modèle de l’application + Ontologie de
domaine
•
Le graphe peut être enrichi par des
éléments de l’ontologie de domaine
domain ontology
rdf:type
rdf:type
rdf:type
rdf:type
14
Domain-Specific
Ontology
SONet:
Scientific
Observations
Network
Tree
part-of
Tree Leaf
usesStandard
Mass Unit
Weight
is-a
Bio.Entity
is-a
hasCharact
eristic
Leaf Litter
OBOE Semantic
Annotation
is-a
Biomass
is-a
is-a
Wet Weight
Dry Weight
is-a
has-part
is-a
Observation
hasMeasurement
Dr. Mark Schildhauer
Director of Computing
NCEAS, UCSB USA
Measurement
Structural
Metadata
Data
<attribute id=“att.4”>
<attributeName>
Mass
</attributeName>
</attribute>
Site
Species
Ind
Mass
GCE6
Picea Rubens
1
75.13
GCE6
Picea Rubens
2
179.81
GCE7
Picea Rubens
1
443.20
…
…
…
…
Gram
Ontologie d’observations : OBOE
Multiples modèles pour les observations : Exemples O&M, PATO/EQ, ODM, OBOE
“core concepts” décrit : Entities, properties measured, units, protocols, etc.
Observations et mesures : ISO
19156
O&M : dépences directes
• Feature ISO 19109
• Geometry ISO 19107
• Temporal ISO 19108
• Coverage (fields) ISO 19123
• Metadata ISO 19115-12
• Meta-model ISO 19150-2
• Basic datatypes ISO 19103
hasContext
*
*
ofEntity
Observation
*
Entity
1..1
hasMeasurement
*
Measurement
*
O&Min OWL | Simon Cox
Cox, OGC Abstract Specification – Topic 20:
Observations and Measurements 2.0
ISO 19156:2011 Geographic Information –
Observations and measurements
1..1
1..1
usesProtocol
1..1
hasValue
Value
Protocol
*
*
ofCharacteristic
1..1
Characteristic
*
1..1
usesStandard
Standard
Extensible OBservation Ontology (OBOE)
16
Plan
•
•
•
•
•
•
•
Introduction et objectifs
Architecture
Données et modèles de données
Ontologies
Lier les données
Requêtes sémantiques
Conclusions
17
Types d’ontologies : différents objectifs
Catherine Roussey (ISTREA)
• Ontologies terminologiques :
– Interopérabilité lexicale
• Ontologies de données :
– Interopérabilité sur les données
• Ontologie Logique
– Interopérabilité d’objets
18
Types d’ontologies : différents objectifs
Catherine Roussey (IRSTEA)
• Ontologies terminologiques : Interopérabilité
lexicale
*
Property
Logical Definition
*
*
1
hasName
hasLabel
1
*
hasName
Textual Definition
Relation
*
1
Concept/
* hasArgument Semantic Relation
Class
*
isInstanceOf
hasArgument
Object/Instance
Object Relation
*
*
*
hasArgument
Term
hasName
Linguistic Relation
19
Types d’ontologies : différents objectifs
Catherine Roussey (IRSTEA)
• Ontologies de données : Interopérabilité sur les
données
Property
Logical Definition
*
1
1
Relation
*
1
*
hasArgument
hasLabel
Concept /
Semantic Relation
Class
*
*
isInstanceOf
hasName
hasArgument
Object/Instance
Object Relation
*
*
hasName
*
Textual Definition
*
hasArgument
Term
hasName
Linguistic Relation
20
Types d’ontologies : différents objectifs
Catherine Roussey (IRSTEA)
• Ontologie Logique : Interopérabilité d’objets /
de concepts
Property
Logical Definition
*
*
Textual Definition
1
Relation
*
1
hasName
hasLabel
1
*
Concept /
Class
hasArgument
*
*
Semantic Relation
isInstanceOf
hasName
Object/Instance
*
hasArgument
*
*
Object Relation
hasArgument
Term
hasName
Linguistic Relation
21
Plan
•
•
•
•
•
•
•
Introduction et objectifs
Architecture
Données et modèles de données
Ontologies
Lier les données
Requêtes sémantiques
Conclusions
22
Lier les données au LOD cloud
• Lien avec l’ontologie de domaine
• Lien avec des jeux de données ouvertes
domain ontology
corresponding
geonames resource
application
ontology
corresponding
DBpedia resource
legend
Individual
Owl class defining the rdf:type of the individual
:region
Object Property
Data Property
23
Lien avec le LOD cloud
• Liens avec les descriptions RDF de geonames
resource URI
http://sws.geonames.org/5892587/
RDF description
geonames resource
describing Northwest Territories
24
Lier des données de différentes sources
• Lier des entités et les caractéristiques de 2
ontologies : Utilise des axiomes d’inclusion et
d’équivalence de OWL
– Équivalence :
•
•
•
•
propriété owl:equivalentClass
propriété owl:equivalentProperty
propriété owl:sameAs
…
• Généralisation/Spécialisation :
• rdfs:subClassOf
• rdfs:subPropertyOf
25
Querying Data trough Ontology
Global
Ontology
Query
Mapping
Local
Schema
Local
Ontology
Local
Schema
MultiMedia Source
Observation
Data Base
Observation Data
Base
26
Caractéristiques communes des
architectures du web sémantique
• Intéroperabilité et intégration de différentes ressources
• Données structurées ou non structurées
– Documents
– Data-bases
• Données spatio-temporelles hétérogènes
– Multi-sites avec multi-acteurs
– Multi-modèles
– Multi-formats
27
Plan
•
•
•
•
•
•
•
Introduction et objectifs
Architecture
Données et modèles de données
Ontologies
Lier les données
Requêtes sémantiques
Conclusions
28
Requêtes sémantiques
• Accéder à des informations inférées depuis l’ontologie de domaine
• Accéder à des informations supplémentaires au travers de données liées (linked
data)
29
Requêtes sémantiques
• Interroger les données avec des données inférées (SPARQL)
30
Plan
•
•
•
•
•
•
•
Introduction et objectifs
Architecture
Données et modèles de données
Ontologies
Lier les données
Requêtes sémantiques
Conclusions
31
Retour d’expérience sur les pratiques
• Au niveau local : sources de données :
– Amélioration de la qualité des données
– Publication des sources de donnée avec les
métadonnées
– Recherche de documentation et de liaison des
données
– Architecture complexe avec des modules nouveaux :
cartographie et du spatio-temporel
• Au niveau communautaire
– Standards ISO, OGC
– Propriété intellectuelle, information privée et
partagée, accès publique, VGI, licences.
– Infrastructures et portails.
32
Retour d’expérience : les outils
• Recherche et création de liens
– outils existants
• e.g. SILK A Link Discovery Framework for the Web of Data, http://wifo503.informatik.uni-mannheim.de/bizer/silk/)
– exploitation de l’information spatiale et temporelle
• Publication des données
– outils génériques pour transformer des jeux de données en RDF
• dataLift http://datalift.org/ ,
• open refine (former google refine) http://openrefine.org/ )
33
Travaux connexes
– GEO BON Biodiversity Observation Network within
GEOSS Global Earth Observation System of
Systems, Portal (global)
• Worldwide voluntary effort
• GEOSS Earth Observation infrastructure
–
–
–
–
GEO portal : web portal, search registries
GEOSS components and services registry (catalogue)
GEOSS clearinghouse (connects the differents components)
GEOSS standards and interoperability (catalologue of
standards)
– http://www.geoportal.org/web/guest/
– http://wiki.ieee-earth.org/Documents/GEOSS_Tutorials/
• GEOSS Water Services
34
Travaux connexes
• Shared Environmental Information System (Europe)
http://ec.europa.eu/environment/seis/
• Semantic Web for Earth and Environmental
Terminology (SWEET),
http://sweet.jpl.nasa.gov/sweet/
• Extensible Observation Ontology (OBOE)
https://code.ecoinformatics.org/code/semtools/trun
k/dev/oboe/oboe.1.1rc1/oboe-core.owl
• SemantEco/SemantAqua : Rensselaer Polytechnic
Institute (D. McGuinness)
http://tw.rpi.edu/web/project/SemantEco
• ObsDB : Gonzaga University Washington
35

similar documents