Linked Data for the Masses: Η προσέγγισηκαιτολογισμικόLinked Data for the...

29
Linked Data for the Masses 1 Linked Data for the Masses: Η προσέγγιση και το λογισμικό Γιώργος Αναδιώτης, Πάνος Ανδριόπουλος, Πάνος Αλεξόπουλος, ∆ημήτρης Βεκρής, Αριστοτέλης Ζωσάκης IMC Technologies S.A. 15/05/2010

Transcript of Linked Data for the Masses: Η προσέγγισηκαιτολογισμικόLinked Data for the...

Page 1: Linked Data for the Masses: Η προσέγγισηκαιτολογισμικόLinked Data for the Masses 28 Αναφορές • [1] Anadiotis, G., Andriopoulos, P., Vekris, D. and

Linked Data for the Masses 1

Linked Data for the Masses: Ηπροσέγγιση και το λογισμικό

Γιώργος Αναδιώτης, Πάνος Ανδριόπουλος, ΠάνοςΑλεξόπουλος, ∆ημήτρης Βεκρής, Αριστοτέλης

Ζωσάκης

IMC Technologies S.A.15/05/2010

Page 2: Linked Data for the Masses: Η προσέγγισηκαιτολογισμικόLinked Data for the Masses 28 Αναφορές • [1] Anadiotis, G., Andriopoulos, P., Vekris, D. and

Linked Data for the Masses 2

∆ομή Παρουσίασης

1. Εισαγωγή: Από τον Παγκόσμιο Ιστό στονΣημασιολογικό Ιστό και στα Linked Data

2. Η Inbound/Outbound Linked Data Προσέγγιση

3. Υλοποίηση: Πρότυπα και Λογισμικό

4. Εφαρμογές και εξελίξεις

Page 3: Linked Data for the Masses: Η προσέγγισηκαιτολογισμικόLinked Data for the Masses 28 Αναφορές • [1] Anadiotis, G., Andriopoulos, P., Vekris, D. and

Linked Data for the Masses 3

∆ομή Παρουσίασης

1. Εισαγωγή: Από τον Παγκόσμιο Ιστό στονΣημασιολογικό Ιστό και στα Linked Data

2. Η Inbound/Outbound Linked Data Προσέγγιση

3. Υλοποίηση: Πρότυπα και Λογισμικό

4. Εφαρμογές και εξελίξεις

Page 4: Linked Data for the Masses: Η προσέγγισηκαιτολογισμικόLinked Data for the Masses 28 Αναφορές • [1] Anadiotis, G., Andriopoulos, P., Vekris, D. and

Linked Data for the Masses 4

Βασικές ελλείψεις του Παγκόσμιου Ιστού

• Έλλειψη δομής: Πληροφορία ≠ ∆εδομένα. Ο Παγκόσμιος Ιστός, μετην μορφή που παρέχει την πληροφορία (ιστοσελίδες), περιορίζεταιουσιαστικά στην παρουσίασή της. ∆εν μπορεί να δώσει την δομήτης πληροφορίας, ακόμα και αν υπάρχει τέτοια (π.χ. η πληροφορίααυτή προέρχεται από κάποια Βάση ∆εδομένων): έχουμε ανάμιξηπαρουσίασης και περιεχομένου με την μορφή εγγράφων.

• Έλλειψη σημασιολογικού προσδιορισμού: Τι σημαίνει αυτό? Ακόμακαι αν μπορέσουμε να διαχωρίσουμε την παρουσίαση από τοπεριεχόμενο, η ερμηνεία του τελευταίου είναι κάτι που εναπόκειταιαποκλειστικά στον αναγνώστη: δεν είναι δυνατή η αυτόματηεπεξεργασία και ο συνδυασμός των δεδομένων, καθώς δενπροσδιορίζεται η ‘σημασία’ τους.

Page 5: Linked Data for the Masses: Η προσέγγισηκαιτολογισμικόLinked Data for the Masses 28 Αναφορές • [1] Anadiotis, G., Andriopoulos, P., Vekris, D. and

Linked Data for the Masses 5

Ο Σημασιολογικός Ιστός

• Τις ελλείψεις αυτές υπόσχεται να αντιμετωπίσει ο ΣημασιολογικόςΙστός, επιχειρώντας να φέρει στοιχεία Αναπαράστασης Γνώσης καιΤεχνητής Νοημοσύνης στην δομή του Παγκόσμιου Ιστού, αποτελώντας την μετεξέλιξή του.

Page 6: Linked Data for the Masses: Η προσέγγισηκαιτολογισμικόLinked Data for the Masses 28 Αναφορές • [1] Anadiotis, G., Andriopoulos, P., Vekris, D. and

Linked Data for the Masses 6

Πρότυπα Σημασιολογικού Ιστού

• Το πρότυπο XML (eXtended Markup Language) είναι το πλέονδιαδεδομένo πρότυπο δομημένης αναπαράστασης δεδομένων και ηυποστήριξή του εξασφαλίζει την δυνατότητα ανταλλαγής δεδομένωνανάμεσα σε διαφορετικές εφαρμογές και συστήματα.

• RDF(S). Η γλώσσα RDF (Resource Description Framework) είναιένα μοντέλο δεδομένων για τα αντικείμενα και τις μεταξύ τους σχέσεις, μεαναπαράσταση και σε μορφή XML. Το RDF Schema με τη σειρά του είναιένα λεξιλόγιο για την περιγραφή των ιδιοτήτων και των κλάσεων RDF αντικειμένων, με μια σημασιολογία για τις γενικευμένες ιεραρχίες τέτοιωνιδιοτήτων και κλάσεων.

• Η γλώσσα OWL (Web Ontology Language) προσθέτει επιπλέονδυνατότητες για την περιγραφή των ιδιοτήτων και των κλάσεων.

• H γλώσσα SPARQL (Simple Protocol and RDF QueryLanguage) είναι η αντίστοιχη της SQL για επερωτήσεις σε σημασιολογικάδεδομένα. Επιπλέον, αποτελεί και πρωτόκολλο πρόσβασης σε αυτά μέσωHTTP.

Page 7: Linked Data for the Masses: Η προσέγγισηκαιτολογισμικόLinked Data for the Masses 28 Αναφορές • [1] Anadiotis, G., Andriopoulos, P., Vekris, D. and

Linked Data for the Masses 7

Σημασιολογικό Μοντέλο RDF

• Τα RDF δεδομένα διαφέρουν από τα σχεσιακά δεδομέναως προς το μοντέλο που εκφράζουν: το RDF είναιγράφος

• Τα RDF δεδομένα έχουν την μορφή τριπλετών (triples)

• <subject><predicate><object> : <cat><is-a><mammal>

• Το RDF(S) δίνει ένα πρώτο επίπεδο προσδιοριστικήςλογικής: κλάσεις και ταξονομικές σχέσεις (ιεραρχία)

• Η OWL προσθέτει επιπλέον δυνατότητες αξιωματικώνπροσδιορισμών, περιορισμών και συμπερασμού

Page 8: Linked Data for the Masses: Η προσέγγισηκαιτολογισμικόLinked Data for the Masses 28 Αναφορές • [1] Anadiotis, G., Andriopoulos, P., Vekris, D. and

Linked Data for the Masses 8

∆ιασυνδεδεμένα ∆εδομένα(Linked Data)

• Χρήση του Σημασιολογικού Ιστού για να επιτευχθεί πρόσβαση σεδεδομένα, αλλά και διασύνδεση μεταξύ τους

• Οι παρακάτω βασικές αρχές των Linked Data προσδιορίστηκαν απότον Sir Tim Berners Lee, εφευρέτη του Παγκόσμιου Ιστού, με τηνπροοπτική ‘να κάνουν τον Ιστό να λειτουργήσει σωστά’

• Χρήση των υπαρχόντων προτύπων του ∆ιαδικτύου και υλοποίηση4 βασικών αρχών:1. Χρήση URIs ως προσδιοριστών για αντικείμενα κ έννοιες2. Χρήση HTTP URIs ώστε οι προσδιοριστές να μπορούν να

αναζητηθούν3. Παροχή πληροφοριών μέσω σχετικών προτύπων (RDF, SPARQL)

όταν αναζητείται κάποιο URI4. Χρήση συνδέσμων προς άλλα URIs ώστε να είναι δυνατή η πρόσβαση

σε επιπλέον πληροφορία

• Η σημασιολογία των δεδομένων προσδιορίζεται μέσωοντολογιών/λεξιλογίων

Page 9: Linked Data for the Masses: Η προσέγγισηκαιτολογισμικόLinked Data for the Masses 28 Αναφορές • [1] Anadiotis, G., Andriopoulos, P., Vekris, D. and

Linked Data for the Masses 9

The Linked Data cloud

Page 10: Linked Data for the Masses: Η προσέγγισηκαιτολογισμικόLinked Data for the Masses 28 Αναφορές • [1] Anadiotis, G., Andriopoulos, P., Vekris, D. and

Linked Data for the Masses 10

DBpedia

• Εξάγει δομημένη πληροφορία από την Wikipedia και την δημοσιεύειως Linked Data.

• Χρησιμοποιεί μια OWL οντολογία για την αναπαράσταση τωνπληροφοριών και την δημοσίευση τους σε RDF μορφή– Places– Person– Organization– …

• Επιτρέπει την χρήση της γλώσσας SPARQL για την ανάκτησηδεδομένων μέσω επερωτήσεων

• Η πληροφορία που εξάγεται αποθηκεύεται σε μία τεράστια cross-domain knowledge base (479 εκατομμύρια RDF τριάδες)

• Υπάρχουν 2 εκδόσεις:– Αγγλική– Γερμανική

Page 11: Linked Data for the Masses: Η προσέγγισηκαιτολογισμικόLinked Data for the Masses 28 Αναφορές • [1] Anadiotis, G., Andriopoulos, P., Vekris, D. and

Linked Data for the Masses 11

∆ομή Παρουσίασης

1. Εισαγωγή: Από τον Παγκόσμιο Ιστό στονΣημασιολογικό Ιστό και στα Linked Data

2. Η Inbound/Outbound Linked Data Προσέγγιση

3. Υλοποίηση: Πρότυπα και Λογισμικό

4. Εφαρμογές και εξελίξεις

Page 12: Linked Data for the Masses: Η προσέγγισηκαιτολογισμικόLinked Data for the Masses 28 Αναφορές • [1] Anadiotis, G., Andriopoulos, P., Vekris, D. and

Linked Data for the Masses 12

Η Inbound/Outbound Linked Data Προσέγγιση

• Πως μπορούν να φανούν χρήσιμα σε πρακτικέςεφαρμογές τα Linked Data?

• Κάθε κόμβος/εφαρμογή στον Σημασιολογικό Ιστό μπορείνα δρα είτε ως καταναλωτής (Inbound Linked Data) είτεως πάροχος (Outbound Linked Data)

• Ως καταναλωτής, τα πλεονεκτήματα είναι εμφανή: μπορεί να χρησιμοποιήσει εξωτερικά δεδομένα για ναεμπλουτίσει το περιεχόμενο και να παρέχει πρόσθετεςυπηρεσίες

Page 13: Linked Data for the Masses: Η προσέγγισηκαιτολογισμικόLinked Data for the Masses 28 Αναφορές • [1] Anadiotis, G., Andriopoulos, P., Vekris, D. and

Linked Data for the Masses 13

Η Inbound/Outbound Linked Data Προσέγγιση

• Ως πάροχος, τα πλεονεκτήματα είναι λιγότερο εμφανή, πληνυπαρκτά:

Page 14: Linked Data for the Masses: Η προσέγγισηκαιτολογισμικόLinked Data for the Masses 28 Αναφορές • [1] Anadiotis, G., Andriopoulos, P., Vekris, D. and

Linked Data for the Masses 14

Η Inbound/Outbound Linked Data Προσέγγιση

• Η προσέγγιση παρουσιάστηκε στα πλαίσια του διεθνούςδιαγωνισμού Linking Open Data Triplification Challenge2009, ο οποίος διοργανώνεται από διεθνή επιτροπήειδικών υπό την αιγίδα του Sir Tim Berners Lee μεσκοπό την προώθηση των Linked Data διαθέτοντας στοκοινό:– Ανοιχτά Datasets σε μορφή Linked Data– Ανοιχτό λογισμικό που μπορεί να χρησιμοποιηθεί για τηνπαραγωγή Linked Data

• Outbound Linked Data εφαρμογή: Liferay Linked Data Module

• Inbound Linked Data εφαρμογή: Εφαρμογή ΑπόδοσηςΝοήματος Tags

Page 15: Linked Data for the Masses: Η προσέγγισηκαιτολογισμικόLinked Data for the Masses 28 Αναφορές • [1] Anadiotis, G., Andriopoulos, P., Vekris, D. and

Linked Data for the Masses 15

∆ομή Παρουσίασης

1. Εισαγωγή: Από τον Παγκόσμιο Ιστό στονΣημασιολογικό Ιστό και στα Linked Data

2. Η Inbound/Outbound Linked Data Προσέγγιση

3. Υλοποίηση: Πρότυπα και Λογισμικό

4. Εφαρμογές και εξελίξεις

Page 16: Linked Data for the Masses: Η προσέγγισηκαιτολογισμικόLinked Data for the Masses 28 Αναφορές • [1] Anadiotis, G., Andriopoulos, P., Vekris, D. and

Linked Data for the Masses 16

Outbound Linked Data: Liferay Linked Data Module

• Liferay: open source Portal/CMS framework (Java, Portlet container)– Πάνω από 10 χρόνια ανάπτυξης– Μεγάλο μερίδιο αγοράς διεθνώς, με πελάτες όπως UN, Cisco, BMW

Page 17: Linked Data for the Masses: Η προσέγγισηκαιτολογισμικόLinked Data for the Masses 28 Αναφορές • [1] Anadiotis, G., Andriopoulos, P., Vekris, D. and

Linked Data for the Masses 17

Outbound Linked Data: Liferay Linked Data Module

• ∆ιάθεση του περιεχομένου που παράγεται από τονLiferay (blogs, web content, forums, wikis…) σε Linked Data μορφή

• Επιπλέον πληροφορία: users, groups, organizations, tags..

• SPARQL endpoint.

• Χρήση ανοιχτού λογισμικού: D2R Server + Mapping language

• Χρήση προτύπων λεξιλογίων για το περιεχόμενο

• ∆ιαθέσιμο στο Sourceforge, LGPL license

Page 18: Linked Data for the Masses: Η προσέγγισηκαιτολογισμικόLinked Data for the Masses 28 Αναφορές • [1] Anadiotis, G., Andriopoulos, P., Vekris, D. and

Linked Data for the Masses 18

Λεξιλόγια Αναπαράστασης Γνώσης

• Η αναπαράσταση των RDF δεδομένων γίνεται με την χρήσηκατάλληλων λεξιλογίων, όπως:– FOAF: Friend-Of-A-Friend –Λεξιλόγιο περιγραφής χρηστών– DC: Dublin Core - Λεξιλόγιο ορισμού ιδιοτήτων μεταδεδομένων– SIOC: Semantically Interlinked Online Communities - Λεξιλόγιο

αναπαράστασης κοινοτήτων– SKOS: Simple Knowledge Organization System - Λεξιλόγιο

αναπαράστασης ταξονομιών και δομημένης γνώσης– MOAT (Meaning Of A Tag): Λεξιλόγιο περιγραφής Tags, χρήσης και

διαφορετικών νοημάτων τους.

• Η επαναχρησιμοποίηση των λεξιλογίων προωθεί τηνδιασυνδεσιμότητα και βοηθά στην εύκολη και άμεση επεξεργασίατων δεδομένων από τις εκάστοτε εφαρμογές.

Page 19: Linked Data for the Masses: Η προσέγγισηκαιτολογισμικόLinked Data for the Masses 28 Αναφορές • [1] Anadiotis, G., Andriopoulos, P., Vekris, D. and

Linked Data for the Masses 19

D2R Server

• Είναι ένα εργαλείο το οποίο αντιστοιχίζει (mapping) μία Σχεσιακή Βάση∆εδομένων σε μορφή RDF και δημοσιεύει το περιεχόμενο της ως Linked Data

• Επιτρέπει την πλοήγηση και την ανάκτηση των RDF δεδομένων

• Πρόσβαση μέσω SPARQL

• Χρησιμοποιείται για την δημοσίευση επιλεγμένων δεδομένων της βάσηςπεριεχομένου του Liferay Server

Page 20: Linked Data for the Masses: Η προσέγγισηκαιτολογισμικόLinked Data for the Masses 28 Αναφορές • [1] Anadiotis, G., Andriopoulos, P., Vekris, D. and

Linked Data for the Masses 20

Inbound Linked Data: ΕφαρμογήΑπόδοσης Νοήματος Tags

• Αναπτύχθηκε στην πλατφόρμα Liferay Portal• ∆ιασυνδέει δεδομένα τύπου Tag που δημιουργούνται στο

περιβάλλον του Liferay και τα οποία χρησιμοποιούνται για τηνεπισημείωση περιεχομένου

• Παρέχει στο χρήστη γραφικό περιβάλλον για τον σημασιολογικόπροσδιορισμό της έννοιας κάθε Tag στα πλαίσια της εκάστοτεχρήσης του

• Μπορεί να χρησιμοποιηθεί για– ακριβέστερη αναζήτηση– εύρεση όμοιων εννοιών– αντιστοίχιση tags– …

• Ο προσδιορισμός γίνεται μεταξύ πιθανών εννοιών που ανακτώνταιαπό την DBpedia ασύγχρονα, με την χρήση εξειδικευμένουλογισμικού

Page 21: Linked Data for the Masses: Η προσέγγισηκαιτολογισμικόLinked Data for the Masses 28 Αναφορές • [1] Anadiotis, G., Andriopoulos, P., Vekris, D. and

Linked Data for the Masses 21

Inbound Linked Data: ΕφαρμογήΑπόδοσης Νοήματος Tags

• ∆ημιουργίαBlog “Apple”.

• ΠροσθήκηTag στοπεριεχόμενοτου Blog.

– Προσθήκηνέου tag “Wild”.

– Προσθήκηtag “Apple” και“Fruit” απόλίστα.

Page 22: Linked Data for the Masses: Η προσέγγισηκαιτολογισμικόLinked Data for the Masses 28 Αναφορές • [1] Anadiotis, G., Andriopoulos, P., Vekris, D. and

Linked Data for the Masses 22

Inbound Linked Data: Εφαρμογή Απόδοσης Νοήματος Tags

• ∆ιασύνδεσηαυτών μέσω του“Interlink Tags”

– Αναζήτησηπιθανώννοημάτων απόπροηγούμενεςδιασυνδέσεις.

– Ανάκτησηπιθανώννοημάτων γιακάθε tag.

– Συνολικήπαρουσίασηαποτελεσμάτων

– Επιλογήκατάλληλουνοήματος

– Αποθήκευσηνοήματος μέσωτου “Save”.

Page 23: Linked Data for the Masses: Η προσέγγισηκαιτολογισμικόLinked Data for the Masses 28 Αναφορές • [1] Anadiotis, G., Andriopoulos, P., Vekris, D. and

Linked Data for the Masses 23

Presentation Structure

1. Εισαγωγή: Από τον Παγκόσμιο Ιστό στονΣημασιολογικό Ιστό και στα Linked Data

2. Η Inbound/Outbound Linked Data Προσέγγιση

3. Υλοποίηση: Πρότυπα και Λογισμικό

4. Εφαρμογές και εξελίξεις

Page 24: Linked Data for the Masses: Η προσέγγισηκαιτολογισμικόLinked Data for the Masses 28 Αναφορές • [1] Anadiotis, G., Andriopoulos, P., Vekris, D. and

Linked Data for the Masses 24

Εφαρμογές

• Το Liferay Linked Data Module έχει ενσωματωθεί απότην IMC ως μέρος της πλατφόρμας ΗλεκτρονικήςΣυμμετοχής eDialogos, όπως έχει χρησιμοποιηθεί στααντίστοιχα έργα που έχουν υλοποιηθεί από τηνΝομαρχία Σάμου και τις πόλεις της Άρτας και τηςΘεσσαλονίκης

• ∆ημιουργία ‘οικοσυστήματος διαλόγου’, στο οποίομπορούν να συμμετέχουν ως πάροχοι ή/καικαταναλωτές όλοι όσοι επιθυμούν μέσω απευθείαςπρόσβασης στα δεδομένα– ∆ιαφάνεια - Προσβασιμότητα: Ανοιχτά ∆εδομένα– Συμβατότητα: Χρήση προτύπων, πρόσβαση απ’ευθείας σταδεδομένα, χωρίς μεσολάβηση ΑΡΙ

Page 25: Linked Data for the Masses: Η προσέγγισηκαιτολογισμικόLinked Data for the Masses 28 Αναφορές • [1] Anadiotis, G., Andriopoulos, P., Vekris, D. and

Linked Data for the Masses 25

Επέκταση Προτύπων: eDialogos - eDeliberation Ontology

• Συμβατότητα με τα (γενικά) λεξιλόγια που χρησιμοποιήθηκαν, επέκταση με επιπλέον έννοιες που αφορούν το πεδίο τηςΗλεκτρονικής Συμμετοχής

Page 26: Linked Data for the Masses: Η προσέγγισηκαιτολογισμικόLinked Data for the Masses 28 Αναφορές • [1] Anadiotis, G., Andriopoulos, P., Vekris, D. and

Linked Data for the Masses 26

Οικοσύστημα ∆ιαλόγου

Page 27: Linked Data for the Masses: Η προσέγγισηκαιτολογισμικόLinked Data for the Masses 28 Αναφορές • [1] Anadiotis, G., Andriopoulos, P., Vekris, D. and

Linked Data for the Masses 27

Εξελίξεις

• Συνεργασία με Liferay– Ενσωμάτωση του Linked Data Module στο επίσημο distribution

(μετά την επερχόμενη έκδοση)– Consulting για την επέκταση και ενσωμάτωση ακόμαπερισσότερων χαρακτηριστικών στο μέλλον

• Συνεργασία με DBpedia, Πανεπιστήμια– ∆ημιουργία Ελληνικής DBpedia

• ∆ιάθεση του eDialogos σε Open Source έκδοση– Το ακριβές πλαίσιο θα καθοριστεί εντός του 2010

Page 28: Linked Data for the Masses: Η προσέγγισηκαιτολογισμικόLinked Data for the Masses 28 Αναφορές • [1] Anadiotis, G., Andriopoulos, P., Vekris, D. and

Linked Data for the Masses 28

Αναφορές

• [1] Anadiotis, G., Andriopoulos, P., Vekris, D. and Zosakis, A. Linked data for the masses – using open source infrastructure and the inbound/outbound linked data approach to bring added value to end user applications. In I-KNOW 09 and I-SEMANTICS 09, 2009. See http://i-semantics.tugraz.at/2009/triplification/04_liferay_TriplificationChallenge2009.pdf

• [2] Liferay Linked Data Module: http://sourceforge.net/projects/liferayldm/

• [3] Bryan Cheung (Liferay CEO), “Liferay Linked Data Module”, Liferay Blog, December 12, 2009. See http://www.liferay.com/web/bryan.cheung/blog/-/blogs/liferay-linked-data-module

• [4] Anadiotis, G., Alexopoulos, P., Mpaslis, K., Zosakis, A., Kafentzis, K. and Kotis, K. (2010). Facilitating Dialogue – Using Semantic Web Technology for eParticipation. Extended Semantic Web Conference, June 2010, Crete.

Page 29: Linked Data for the Masses: Η προσέγγισηκαιτολογισμικόLinked Data for the Masses 28 Αναφορές • [1] Anadiotis, G., Andriopoulos, P., Vekris, D. and

Linked Data for the Masses 29

Ερωτήσεις

????