Εθνικό Κέντρο Τεκμηρίωσης |...

65

Transcript of Εθνικό Κέντρο Τεκμηρίωσης |...

Page 1: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,
Page 2: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕ 1η ΕΚΔΟΣΗ / Δεκέμβριος 2016

Κείμενο: Χάρης Γεωργιάδης PhD, Αγάθη Παπανότη

Σχεδιασμός Έκδοσης: Δήμητρα Πελεκάνου

Επιμέλεια & Οπτικοποίηση Ύλης: Χάρης Γεωργιάδης, Δήμητρα Πελεκάνου

Μονάδα Ανάπτυξης Εφαρμογών ΕΚΤ | Ομάδα Έργου Semantics.gr: Οργάνωση Σχεδιασμού – Ανάπτυξη Λογισμικού: Χάρης Γεωργιάδης, PhD

Συντονισμός: Δέσποινα Χαρδούβελη, Χάρης Γεωργιάδης

Γραφιστικός Σχεδιασμός: Δήμητρα Πελεκάνου

Συνδιαμόρφωση Προδιαγραφών - Έλεγχος Λογισμικού: Αγάθη Παπανότη

Ομάδα Συστημάτων και Δικτύων: Μανώλης Μεγαλοοικονόμου, Μιχάλης Σίμου, Γιώργος Ζαχαριάδης

Σημασιολογικός Εμπλουτισμός SearchCulture.gr: Αγάθη Παπανότη, Χάρης Γεωργιάδης, Μαρία

Πάσχου, Αλεξάνδρα Ρουμπάνη

Προτεινόμενος τρόπος αναφοράς: ΕΚΤ(2016), Semantics.gr: Το Ενιαίο Σύστημα Σημασιολογικών Λεξιλογίων. Αθήνα: Εθνικό Κέντρο Τεκμηρίωσης

Copyright © 2016 Εθνικό Κέντρο Τεκμηρίωσης Ι EIE

δ. Βασιλέως Κωνσταντίνου 48, 11635 Αθήνα | τ.: 210 7273900

| f: 210 7246824 | e: [email protected] | www.ekt.gr

Το έργο αυτό διατίθεται με άδεια Creative Commons Αναφορά-Μη Εμπορική Χρήση-‘Όχι Παράγωγα Έργα 4.0 Ελλάδα

Προκειμένου να δείτε αντίγραφο της άδειας επισκεφθείτε: http://creativecommons.org/licenses/by-nc-nd/4.0/deed.el

Page 3: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

Περιεχόμενα 1 Εισαγωγή ........................................................................................................................... 4

2 Ανοικτή Διαδικτυακή πύλη ................................................................................................ 7

2.1 Αναζήτηση όρου ........................................................................................................ 7

2.2 Περιήγηση στα λεξιλόγια ........................................................................................ 10

3 Διαχειριστικό Περιβάλλον ............................................................................................... 15

3.1 Διαχείριση namespaces, γνωρισμάτων και σημασιολογικών κλάσεων. .............. 16

3.2 Διαχείριση φορέων ................................................................................................. 22

3.3 Διαχείριση Χρηστών ................................................................................................ 24

3.4 Διαχείριση Λεξιλογίων ............................................................................................ 25

3.5 Ρυθμίσεις αναζήτησης σε εξωτερικά λεξιλόγια ...................................................... 28

3.6 Διαχείριση αποθετηρίων ......................................................................................... 30

4 Περιβάλλον για Φορείς/Δημιουργούς λεξιλογίων ......................................................... 33

5 Εργαλείο Σημασιολογικού Εμπλουτισμού ...................................................................... 37

5.1 Βασική παραμετροποίηση φόρμας αντιστοιχίσεων ............................................... 38

5.2 Εμπλουτισμός κατηγορίας Α – αντιστοίχιση τιμών μεταδεδομένων .................... 40

5.3 Εμπλουτισμός κατηγορίας Β – μηχανισμός αυτοεκμάθησης ................................. 42

5.4 Εμπλουτισμός κατηγορίας C – Χρησιμοποιώντας δευτερεύοντα πεδία ................ 45

5.5 Εμπλουτισμός κατηγορίας D – Χρησιμοποιώντας περιγραφικά πεδία .................. 48

6 RESTful Υπηρεσίες ........................................................................................................... 50

7 Αρχιτεκτονική .................................................................................................................. 53

8 Μελέτη Περίπτωσης: Εμπλουτισμός του SearchCulture.gr ............................................ 57

Πίνακας Εικόνων ..................................................................................................................... 62

Αναφορές ................................................................................................................................ 64

Page 4: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

1 Εισαγωγή

Το Ενιαίο Σύστημα Λεξιλογίων και Σημασιολογικού εμπλουτισμού Semantics.gr είναι ένα σύστημα που ανέπτυξε το ΕΚΤ για την δημιουργία, καθιέρωση και διάχυση στο κοινό λεξιλογίων και θησαυρών όρων από έγκριτους φορείς και ταυτόχρονα ένα εργαλείο σημασιολογικού εμπλουτισμού αποθετηρίων και συσσωρευτών ψηφιακού περιεχομένου.

Το Semantics.gr επιτρέπει στο EKT και σε συνεργαζόμενους φορείς να καταχωρούν και να καθιερώνουν τα δικά τους λεξιλόγια και θησαυρούς σημασιολογικών όρων. Ο εγγεγραμμένος στο σύστημα φορέας διαθέτει δικούς του λογαριασμούς χρήστη και αποκτά έτσι τον δικό του χώρο για να δημιουργήσει, να διαχειριστεί, να διασυνδέσει και να δημοσιοποιήσει λεξιλόγια και θησαυρούς.

Το σύστημα διαθέτει ένα φιλικό στην χρήση μηχανισμό παραμετροποίησης για την μοντελοποίηση των σχημάτων των λεξιλογίων που θα δημιουργούνται από τους φορείς. Συγκεκριμένα, ο χρήστης με ρόλο διαχειριστή μπορεί να δημιουργήσει σχήματα ορίζοντας παραμετρικά πεδία και στην συνέχεια ομαδοποιώντας τα σε σημασιολογικές κλάσεις. Κάθε λεξιλόγιο που θα δημιουργείται θα πρέπει να ανήκει σε μία σημασιολογική κλάση. Με τον τρόπο αυτό, το Semantics.gr μπορεί να φιλοξενήσει λεξιλόγια σε οποιοδήποτε καθιερωμένο σχήμα, όπως το skos:Concept, το edm:Place, το edm:Timespan και το edm:Agent, ή σε οποιοδήποτε RDF-based custom σχήμα που καλύπτει τις ανάγκες του εκάστοτε φορέα.

Τα λεξιλόγια που οι φορείς επιλέγουν να δημοσιοποιήσουν διατίθενται ελεύθερα μέσα από την δημόσια διαδικτυακή πύλη ως Ανοικτά Διασυνδεμένα Δεδομένα. Η διαδικτυακή πύλη επιτρέπει στον επισκέπτη να περιηγηθεί στα δημοσιευμένα λεξιλόγια και στους όρους τόσο

Page 5: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

με ιεραρχική πλοήγηση όσο και μέσω της μηχανής αναζήτησης. Η μηχανή αναζήτησης μπορεί να εντοπίσει όχι μόνο όρους λεξιλογίων που καταχωρήθηκαν στο σύστημα από τους φορείς αλλά και όρους σε μια σειρά από εξωτερικά καθιερωμένα δημόσια λεξιλόγια (όπως για παράδειγμα το DBPedia, Geonames, Getty AAT, http://id.loc.gov κλπ). Επομένως η μηχανή αναζήτησης αποτελεί ένα καινοτόμο και χρηστικό εργαλείο για αναζήτηση σημασιολογικών όρων σε πολλαπλές πηγές, ενθαρρύνοντας έτσι τους φορείς να επαναχρησιμοποιούν υπάρχοντες όρους (από λεξιλόγια φορέων που καταχωρήθηκαν ήδη στο σύστημα αλλά και από εξωτερικά καθιερωμένα λεξιλόγια) και αποθαρρύνοντας την δημιουργία όρων που έχουν ήδη καθιερωθεί.

Το Semantics.gr παρέχει μια σειρά από εργαλεία και υπηρεσίες σε τρίτα συστήματα που φιλοξενούν περιεχόμενο, όπως συστήματα αποθετηρίων ή συσσωρευτές. Απαραίτητη προϋπόθεση για ένα σύστημα προκειμένου να χρησιμοποιήσει τις υπηρεσίες αυτές είναι να καταχωρηθεί στο Semantics.gr ως αποθετήριο.

Η πρώτη υπηρεσία είναι η διάθεση προσαρμοσμένων υπηρεσιών ιστού για την δυναμική αναζήτηση όρων σε δεσμευμένα πεδία μεταδεδομένων του αποθετηρίου. Ο εξουσιοδοτημένος χρήστης - αντιπρόσωπος του αποθετηρίου μπορεί να ορίσει στο Semantics.gr μία σειρά από πεδία μεταδεδομένων του αποθετηρίου και να τα συσχετίσει με συγκεκριμένα λεξιλόγια. Το Semantics.gr παρέχει κατάλληλες REST υπηρεσίες ιστού για την αναζήτηση όρων για κάθε πεδίο χωριστά. Το σύστημα αποθετηρίου μπορεί να αξιοποιήσει τις υπηρεσίες αυτές προκειμένου η φόρμα εισαγωγής/επεξεργασίας εγγραφών μεταδεδομένων να υποχρεώνει τον χρήστη να αναζητήσει και να επιλέξει τιμές για τα συγκεκριμένα πεδία από όρους των αντίστοιχων λεξιλογίων (δεσμευμένα πεδία).

Παράλληλα, το Semantics.gr διαθέτει ένα πρωτότυπο και ιδιαίτερα φιλικό εργαλείο για μαζικό ημιαυτόματο σημασιολογικό εμπλουτισμό και ομογενοποίηση περιεχομένου που μπορεί να προσφέρεται ως υπηρεσία τόσο σε αποθετήρια πρωτογενούς περιεχομένου όσο και σε συσσωρευτές. Ο εμπλουτισμός γίνεται ανά αποθετήριο για συγκεκριμένα πεδία μεταδεδομένων και προϋποθέτει τον ορισμό κανόνων αντιστοίχισης μέσα από ένα εύχρηστο και λειτουργικό γραφικό περιβάλλον. To Semantics.gr παρέχει μια σειρά από υπηρεσίες ιστού που επιτρέπουν στα αποθετήρια να εμπλουτίσουν το περιεχόμενό τους μαζικά σύμφωνα με τους κανόνες αντιστοίχησης που ορίστηκαν. Το ΕΚΤ ήδη χρησιμοποιεί το εργαλείο αυτό προκειμένου να εμπλουτίζει το περιεχόμενο που συσσωρεύεται στον συσσωρευτή SearchCulture.gr[13] με συνδέσμους σε καθιερωμένα λεξιλόγια και θησαυρούς όρων αλλά και για να ομογενοποιήσει το περιεχόμενο αυτό με στόχο την βελτιστοποίηση των υπηρεσιών αναζήτησης και πλοήγησης της διαδικτυακής πύλης του SearchCulture.gr.

Το Semantics.gr έχει τρία επίπεδα εξουσιοδότησης:

1. Μη εξουσιοδοτημένη χρήση Καθένας έχει πρόσβαση στο ανοικτό portal του συστήματος και μπορεί ελεύθερα:

• να αναζητήσει όρους δημοσιοποιημένων λεξιλογίων με την βοήθεια μιας μηχανής αναζήτησης. Η αναζήτηση γίνεται βάσει λέξης/φράσης. Προαιρετικά ο χρήστης μπορεί να περιορίσει τα αποτελέσματα ορίζοντας σημασιολογική κατηγορία ή/και συγκεκριμένα λεξιλόγια.

• να πλοηγηθεί στα δημοσιευμένα λεξιλόγια και στους όρους τους

Page 6: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

2. Διαχειριστής του συστήματος Δημιουργεί γνωρίσματα και τα ομαδοποιεί σε σημασιολογικές κλάσεις, δημιουργεί φορείς, χρήστες και αποθετήρια και ορίζει κανόνες αντιστοίχησης για τον σημασιολογικό εμπλουτισμό των εγγεγραμμένων αποθετηρίων. Συγκεκριμένα:

• Δημιουργεί και περιγράφει παραμετρικά γνωρίσματα (π.χ. dc:date, skos:broader)

• Δημιουργεί και περιγράφει σημασιολογικές κλάσεις (π.χ. skos:Concept). Κάθε σημασιολογική κλάση μοντελοποιεί ένα σχήμα και ομαδοποιεί μια σειρά από παραμετρικά γνωρίσματα.

• Διαχειρίζεται το περιεχόμενο (διαγραφή / επανάληψη ευρετηρίασης, επεξεργασία λεξιλογίων και όρων για λογαριασμό φορέων)

• Ρυθμίζει τα εξωτερικά λεξιλόγια τα οποία θα υποστηρίζονται από την μηχανή αναζήτησης

• Εγγράφει φορείς, αποθετήρια και εξουσιοδοτημένους χρήστες. • Δημιουργεί κανόνες αντιστοίχησης πεδίων μεταδεδομένων των

εγγεγραμμένων αποθετηρίων σε όρους λεξιλογίων (εργαλείο σημασιολογικού εμπλουτισμού)

3. Εξουσιοδοτημένοι αντιπρόσωποι φορέων Ο εξουσιοδοτημένος χρήστης ενός φορέα μπορεί να δημιουργήσει νέα λεξιλόγια και να καταχωρήσει/επεξεργαστεί όρους σε αυτά. Συγκεκριμένα:

• Μπορεί να δημιουργήσει νέα λεξιλόγια. Για κάθε νέο λεξιλόγιο πρέπει να ορίζει την σημασιολογική κατηγορία του (έννοιες, άνθρωποι/οργανισμοί, τόποι, χρονικές περίοδοι) και την αντίστοιχη σημασιολογική κλάση, η οποία ορίζει το σχήμα και τα πεδία του κάθε όρου.

• Έχει πρόσβαση σε όλα τα λεξιλόγια που δημιούργησε ο φορέας με δυνατότητα προσθήκης/διαγραφής/επεξεργασίας όρων.

Το Σύστημα Λεξιλογίων υποστηρίζει πολυγλωσσικότητα τόσο σε στατικό όσο και σε δυναμικό περιεχόμενο. Στην τρέχουσα έκδοση υποστηρίζονται Ελληνικά και Αγγλικά. Όλα τα στατικά μηνύματα/ετικέτες της εφαρμογές έχουν μεταφραστεί και στις δύο γλώσσες. Η πολυγλωσσικότητα όμως υποστηρίζεται και στο δυναμικό περιεχόμενο. Όλες οι φόρμες δημιουργίας/επεξεργασίας όλων των οντοτήτων πεδίου (σχήμα, πεδίο, σημασιολογική κλάση, λεξιλόγιο, φορέας, εξωτερικό λεξιλόγιο, χρήστης, αποθετήριο και όρος λεξιλογίου) έχουν τουλάχιστον ένα πολυγλωσσικό πεδίο ονομασίας (ετικέτα, ονομασία, προτεινόμενη ονομασία) αλλά και πολλά άλλα περιγραφικά πεδία τα οποία είναι επίσης πολυγλωσσικά (περιγραφή, τεκμηρίωση, σημειώσεις, πεδία εφαρμογής). Αν ο χρήστης επιλέξει άλλη γλώσσα (επιλέγοντας την σημαία στο πάνω δεξί μέρος της εφαρμογής), τότε εκτός από τις στατικές ετικέτες και τα μηνύματα της εφαρμογής, θα «μεταφραστούν» και δυναμικές πληροφορίες των οντοτήτων, για τις οντότητες φυσικά που έχει οριστεί μετάφραση στη συγκεκριμένη γλώσσα .

Page 7: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

2 Ανοικτή Διαδικτυακή πύλη

Η αρχική σελίδα της διαδικτυακής πύλης (https://semantics.gr) φαίνεται στην Εικόνα 1. Στην αρχική σελίδα εμφανίζεται ένα εισαγωγικό κείμενο, η βασική φόρμα αναζήτησης όρου και ένα μενού επιλογών. Η ίδια φόρμα εμφανίζεται και όταν ο χρήστης επιλέξει ‘Αναζήτηση όρου’ από το μενού (Εικόνα 2).

Εικόνα 1. Αρχική σελίδα

2.1 Αναζήτηση όρου Ο χρήστης μπορεί να πληκτρολογήσει μία χαρακτηριστική λέξη ή φράση για τον όρο πού αναζητά. Καθώς πληκτρολογεί εμφανίζεται βοηθητικό μενού αυτόματης συμπλήρωσης το οποίο βασίζεται στους όρους που είναι ήδη αποθηκευμένοι στο σύστημα. Επιπροσθέτως ο

Page 8: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

χρήστης μπορεί να περιορίσει την αναζήτηση επιλέγοντας σημασιολογική κατηγορία ή λεξιλόγια στα οποία ανήκει ο όρος, όπως φαίνεται στην Εικόνα 3.

Εικόνα 2. Αναζήτηση όρου - Βοηθητικό μενού αυτόματης συμπλήρωσης

Εικόνα 3. Αναζήτηση όρου - Περιορισμός σε συγκεκριμένα λεξιλόγια

Page 9: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

Πατώντας ‘Αναζήτηση’ εμφανίζονται οι όροι που ταιριάζουν στα κριτήρια που έθεσε ο χρήστης. Αν ο χρήστης επέλεξε ‘Αναζήτηση και σε εξωτερικά λεξιλόγια’ τότε το σύστημα θα αναζητήσει σε πραγματικό χρόνο τα εξωτερικά λεξιλόγια τα οποία έχουν εγγραφεί, όπως φαίνεται στην Εικόνα 4. Σημειώνονται ότι τα αποτελέσματα που προέρχονται από το σύστημα εμφανίζονται άμεσα ενώ αυτά που προέρχονται από εξωτερικά λεξιλόγια εμφανίζονται ανάλογα με την ταχύτητα απόκρισής της κάθε εξωτερικής πηγής.

Εικόνα 4. Αποτελέσματα αναζήτησης - Αναζήτηση και σε εξωτερικά λεξιλόγια/θησαυρούς

Αν ο χρήστης επιλέξει έναν όρο που ανήκει σε λεξιλόγιο του συστήματος, τότε θα μεταφερθεί στην σελίδα προβολής όρου λεξιλογίου (Εικόνα 5). Εκεί ο χρήστης μπορεί να δει τις τιμές των πεδίων του όρου σε διάφορες γλώσσες και τις συσχετίσεις του με άλλους όρους και πηγές. Μέσω των συσχετίσεων αυτών μπορεί να πλοηγηθεί στου αντίστοιχους όρους.

Αν ο χρήστης επιλέξει από τα αποτελέσματα έναν όρο που ανήκει σε εξωτερικό λεξιλόγιο, θα μεταφερθεί (σε διαφορετική καρτέλα του φυλλομετρητή) στην σελίδα του όρου στον ιστότοπο του εξωτερικού λεξιλογίου.

Page 10: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

Εικόνα 5. Σελίδα παρουσίασης όρου

2.2 Περιήγηση στα λεξιλόγια Ο δεύτερος τρόπος πρόσβασης σε καταχωρημένους όρους είναι μέσω της περιήγησης στα λεξιλόγια. Ο χρήστης μπορεί να επιλέξει την επιλογή ‘Λεξιλόγια φορέων’ από το μενού, οπότε και θα μεταφερθεί στην σελίδα λεξιλογίων όπου φαίνονται όλα τα λεξιλόγια που έχουν καταχωρηθεί και δημοσιευθεί στο σύστημα (Εικόνα 6). Η σελίδα δίνει την δυνατότητα φιλτραρίσματος της λίστας λεξιλογίων, βάσει σύντομης ονομασίας, ονομασίας, δημιουργού (φορέα) και σημασιολογικής κατηγορίας.

Όταν ο χρήστης επιλέξει ένα λεξιλόγιο από την λίστα, εμφανίζεται η σελίδα περιεχομένου του λεξιλογίου. Η σελίδα αυτή παρουσιάζει όλους τους όρους του λεξιλογίου ως ιεραρχία, εφόσον το λεξιλόγιο έχει οριστεί ως ιεραρχικό. Για παράδειγμα, στην Εικόνα 7 φαίνεται η ιεραρχία όρων ενός λεξιλογίου της σημασιολογικής κλάσης skos:Concept όπου η ιεραρχία ορίζεται από την σχέση γενίκευση/εξειδίκευση η οποία μοντελοποιείται από το ζεύγος πεδίων skos:broader και skos:narrower.

Page 11: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

Εικόνα 6. Πλοήγηση στα λεξιλόγια

Εικόνα 7. Σελίδα περιεχομένων λεξιλογίου (ιεραρχική προβολή)

Page 12: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

Εναλλακτικά ο χρήστης μπορεί να αλλάξει την προβολή των όρων από ιεραρχική σε προβολή λίστας, από την επιλογή που εμφανίζεται πάνω δεξιά (« »). Στη προβολή αυτή οι όροι εμφανίζονται κατά αλφαβητική σειρά σε σελίδες, όπως φαίνεται στην Εικόνα 8.

Εικόνα 8. Σελίδα περιεχομένων λεξιλογίου (προβολή σελιδοποιημένης λίστας)

Μέσα από την σελίδα λεξιλογίου ο χρήστης μπορεί να δει πληροφορίες για την σημασιολογική κλάση του λεξιλογίου και για τον φορέα/δημιουργό του λεξιλογίου, επιλέγοντας τους αντίστοιχους συνδέσμους (πάνω αριστερά). Έτσι, επιλέγοντας την κλάση ‘skos:Concept’ από την σελίδα λεξιλογίου μεταφέρεται στην σελίδα προβολής της σημασιολογικής κλάσης (Εικόνα 9) από όπου μπορεί να επιλέξει ένα συγκεκριμένο γνώρισμα προκειμένου να διαβάσει την σχετική τεκμηρίωση (Εικόνα 10).

Page 13: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

Εικόνα 9. Προβολή σημασιολογικής κλάσης

Εικόνα 10. Προβολή γνωρίσματος

Page 14: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

Αντίστοιχα, επιλέγοντας τον φορέα (‘Εθνικό Κέντρο Τεκμηρίωσης’ στο παράδειγμα) μεταφέρεται στην σελίδα προβολής στοιχείων φορέα, όπως φαίνεται στην Εικόνα 11.

Εικόνα 11. Προβολή Στοιχείων Φορέα

Page 15: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

3 Διαχειριστικό Περιβάλλον

Για να μεταβεί ο χρήστης στο διαχειριστικό περιβάλλον θα πρέπει να έχει λογαριασμό χρήστη με ρόλο διαχειριστή. Από το μενού, επιλέγοντας ΄Σύνδεση’, μεταβαίνει στην αντίστοιχη σελίδα όπου μπορεί να εισάγει το όνομα χρήστη και το συνθηματικό του (Εικόνα 12).

Εικόνα 12. Σελίδα σύνδεσης

Εικόνα 13. Το μενού του διαχειριστή

Στην Εικόνα 13 φαίνεται το μενού που εμφανίζεται στον χρήστη-διαχειριστή. Ο διαχειριστής μπορεί μεταξύ άλλων να δημιουργήσει και να επεξεργαστεί σχήματα, παραμετρικά γνωρίσματα και σημασιολογικές κλάσεις, να εισάγει νέους φορείς και να επεξεργαστεί λεξιλόγια και αποθετήρια για λογαριασμό τους, να ρυθμίσει τα εξωτερικά λεξιλόγια στα οποία θα ψάχνει η μηχανή αναζήτησης όρων, να διαχειριστεί χρήστες και, τέλος, να επαναδημιουργήσει ή να διαγράψει τις εγγραφές του ευρετηρίου της μηχανής αναζήτησης.

Page 16: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

3.1 Διαχείριση namespaces, γνωρισμάτων και σημασιολογικών κλάσεων.

Ο χρήστης με ρόλο διαχειριστή μπορεί να ορίσει τους τύπους μεταδεδομένων (σχήμα) που θα υποστηρίζει το σύστημα για κάθε λεξιλόγιο που θα φιλοξενεί. Αυτό μπορεί να το κάνει ορίζοντας παραμετρικά πεδία και στην συνέχεια ομαδοποιώντας τα σε σημασιολογικές κλάσεις. Κάθε λεξιλόγιο που θα δημιουργείται θα πρέπει να ανήκει σε μία σημασιολογική κλάση. Τόσο τα γνωρίσματα όσο και οι σημασιολογικές κλάσεις ορίζονται από ένα namespace, όπως τα dc, dcterms και skos. Επομένως πρώτα θα πρέπει να εισάγει τα namespaces των γνωρισμάτων και των κλάσεων που θα δημιουργήσει στην συνέχεια. Αυτό το κάνει επιλέγοντας ‘Σχήματα (namespaces)’ από το διαχειριστικό μενού.

Εικόνα 14. Σελίδα διαχείρισης σχημάτων (namespaces)

Μέσα από την σελίδα διαχείρισης σχημάτων namespaces (Εικόνα 14), ο χρήστης μπορεί να αναζητήσει namespaces, να τα επεξεργαστεί, να τα διαγράψει και τέλος να δημιουργήσει καινούργια. Για κάθε namespace θα πρέπει να οριστεί το URI του αλλά και ένα πρόθεμα που θα χρησιμοποιείται από το σύστημα για την διακριτική ονομασία (qualified naming) γνωρισμάτων και κλάσεων. Στην Εικόνα 15 φαίνεται η σελίδα επεξεργασία του namespace dc (Dublin core).

Page 17: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

Εικόνα 15. Σελίδα επεξεργασίας / δημιουργίας σχήματος (namespace)

Αφού δημιουργήσει τα απαραίτητα namespaces, ο διαχειριστής μπορεί να δημιουργήσει παραμετρικά γνωρίσματα επιλέγοντας την αντίστοιχη επιλογή από το διαχειριστικό μενού. Μέσα από την σελίδα ΄Γνωρίσματα’ (Εικόνα 16) ο χρήστης μπορεί να αναζητήσει γνωρίσματα βάσει ονομασίας, τύπου ή σχήματος (namespace). Επίσης μπορεί να τα επεξεργαστεί, να τα διαγράψει ή να δημιουργήσει νέα.

Εικόνα 16. Σελίδα διαχείρισης παραμετρικών γνωρισμάτων

Page 18: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

Εικόνα 17. Σελίδα επεξεργασίας γνωρίσματος (που δεν υποστηρίζει αναφορές)

Στην Εικόνα 17 φαίνεται η σελίδα δημιουργίας νέου RDF γνωρίσματος. Ο χρήστης θα πρέπει να ορίσει το σχήμα και το όνομα (μαζί θα αποτελούν το διακριτικό ‘qualified’ όνομα του γνωρίσματος), επεξηγηματικές ετικέτες σε διάφορες γλώσσες, σχόλια σε διάφορες γλώσσες και ‘Κατηγορία πεδίου τιμών’. Η κατηγορία πεδίου τιμών μπορεί να είναι: Λεκτικό, λεκτικό ή αναφορά, αναφορά, λεκτικό συνοδευόμενο από γλώσσα, λεκτικό συνοδευόμενο από γλώσσα ή αναφορά, πολλαπλό λεκτικό, πολλαπλό λεκτικό ή αναφορά, πολλαπλό αναφορά, πολλαπλό πολυγλωσσικό, πολλαπλό πολυγλωσσικό ή/και αναφορές και τέλος, ένα λεκτικό μόνο ανά γλώσσα. Ανάλογα με τον τύπο που θα επιλεγεί, το πεδίο θα μπορεί ή όχι να υποστηρίζει αναφορές (γνώρισμα rdf:resource σε RDF/XML), να υποστηρίζει γλώσσα (γνώρισμα xml:lang σε RDF/XML) ή/και να είναι πολλαπλό. Αναλόγως θα προσαρμόζεται και η φόρμα επεξεργασίας όρου για ανάθεση τιμών στο συγκεκριμένο πεδίο (βλέπε ενότητα 4).

Στην περίπτωση που επιλεγεί τύπος που υποστηρίζει λεκτικό τότε μπορεί να οριστεί αν αναμένεται το μήκος του λεκτικού να είναι μεγάλο (οπότε θα εμφανίζεται πλαίσιο κειμένου πολλαπλών γραμμών αντί για πεδίο στην φόρμα επεξεργασίας όρου για το συγκεκριμένο πεδίο). Στην περίπτωση που επιλεγεί τύπος που υποστηρίζει αναφορές (Εικόνα 18), ο χρήστης μπορεί να εξειδικεύσει το είδος των αναφορών (αναφορές μόνο σε όρους του ίδιου λεξιλογίου, αναφορές μόνο σε όρους της ίδιας σημασιολογικής κλάσης ή αναφορές που απλώς ανήκουν σε συγκεκριμένη σημασιολογική κατηγορία). Μπορεί ακόμα να ορίσει το αντίστροφο γνώρισμα. Για παράδειγμα, το γνώρισμα skos:broader έχει ώς αντίστροφο το skos:narrower. Αν μια κλάση περιλαμβάνει 2 γνωρίσματα τα οποία έχουν οριστεί ως αντίστροφα κατ’αυτόν τον τρόπο, τότε λεξιλόγια αυτής της κλάσης μπορούν να οριστούν ως ιεραρχικά με φορά ιεραρχίας ένα από τα δύο πεδία (στο παράδειγμα, το skos:boader). (Βλέπε ενότητα 3.4)

Page 19: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

Εικόνα 18. Σελίδα επεξεργασίας γνωρίσματος (που υποστηρίζει αναφορές)

Εικόνα 19. Σελίδα διαχείρισης σημασιολογικών κλάσεων

Page 20: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

Εικόνα 20. Σελίδα επεξεργασίας/δημιουργίας σημασιολογικής κλάσης

Page 21: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

Στην συνέχεια ο διαχειριστής μπορεί να δημιουργήσει και να επεξεργαστεί σημασιολογικές κλάσεις (owl classes). Η Εικόνα 19 παρουσιάζει την σελίδα διαχείρισης σημασιολογικών κλάσεων. Ο χρήστης μπορεί να αναζητήσει σημασιολογική κλάση (βάσει ονομασίας, namespace, σημασιολογικής κατηγορίας ή ετικέτας), να επεξεργαστεί και να διαγράψει κλάσεις και να δημιουργήσει καινούργιες.

Στην Εικόνα 20 φαίνεται η σελίδα επεξεργασίας/δημιουργίας σημασιολογικής κλάσης. Ο χρήστης θα πρέπει να ορίσει το σχήμα και το όνομα (μαζί θα αποτελούν το διακριτικό ‘qualified’ όνομα της κλάσης), επεξηγηματικές ετικέτες σε διάφορες γλώσσες, σχόλια σε διάφορες γλώσσες, πεδίο χρήσης σε διάφορες γλώσσες και, τέλος, τα πεδία που θα περιέχει η συγκεκριμένη κλάση. Ο χρήστης θε πρέπει πρώτα να επιλέξει 3 γνωρίσματα τα οποία έχουν συγκεκριμένη σημασιολογία για το σύστημα: το πεδίο προτεινόμενης ονομασίας, το πεδίο εναλλακτικής ονομασίας και το πεδίο ισοδυναμίας. Πατώντας το κουμπί «Επιλογή» στα αντίστοιχα πλαίσια εμφανίζεται παράθυρο αναζήτησης και επιλογής πεδίου. Για παράδειγμα, στη μοντελοποίηση της κλάσης skos:Concept, τους ρόλους αυτούς παίζουν τα πεδία skos:prefLabel, skos:altLabel και skos:exactMatch, αντίστοιχα. Στην συνέχεια ο χρήστης καλείται να επιλέξει τα υπόλοιπα γνωρίσματα της κλάσης. Επιλέγοντας προσθήκη, εμφανίζεται ένα παράθυρο μέσα από το οποίο ο χρήστης μπορεί να αναζητήσει και να επιλέξει ένα ή περισσότερα γνωρίσματα (Εικόνα 21). Αφού επιλέξει τα γνωρίσματα, ο χρήστης μπορεί να τα ‘σύρει’ (drag and drop) ώστε να ορίσει την σειρά εμφάνισής τους στην συγκεκριμένη κλάση. Στη φόρμα δημιουργίας/επεξεργασίας όρου ενός λεξιλογίου της συγκεκριμένης κλάσης, η σειρά εμφάνισης των πεδίων στην φόρμα θα ταυτίζεται με την σειρά των πεδίων που ορίστηκε στην σημασιολογική κλάση.

Εικόνα 21. Σελίδα επεξεργασίας/δημιουργίας σημασιολογικής κλάσης - Επιλογή γνωρισμάτων

Page 22: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

3.2 Διαχείριση φορέων Ο διαχειριστής είναι υπεύθυνος για την εγγραφή και επεξεργασία των συνεργαζόμενων φορέων οι οποίοι μπορούν να δημιουργούν λεξιλόγια στο σύστημα. Από το μενού του διαχειριστή, επιλέγοντας ‘Φορείς’ εμφανίζεται η σελίδα διαχείρισης φορέων (Εικόνα 22). Από την σελίδα αυτή, ο χρήστης μπορεί να αναζητήσει φορείς βάσει σύντομης ονομασίας, ονομασίας, λεξιλογίου που δημιουργήθηκε από τον φορέα ή λογαριασμού χρήστη που αντιστοιχήθηκε στον φορέα. Ειδικά για το κριτήριο ‘Δημιουργός Λεξιλογίων’, ο χρήστης μπορεί να πατήσει το κουμπί αναζήτηση « » ώστε να αναζητήσει και να επιλέξει ένα λεξιλόγιο μέσα από το παράθυρο που θα εμφανιστεί (Εικόνα 23).

Εικόνα 22. Σελίδα διαχείρισης φορέων

Ο χρήστης μπορεί να δημιουργήσει έναν νέο φορέα (κουμπί «Προσθήκη»), να επεξεργαστεί (μενού στην γραμμή του φορέα, επιλογή «Επεξεργασία») ή να διαγράψει (μενού στην γραμμή του φορέα, επιλογή «Διαγραφή») έναν υπάρχοντα. Στην Εικόνα 24 παρουσιάζεται η φόρμα επεξεργασίας/δημιουργίας φορέα. Ο χρήστης θα πρέπει να εισάγει μια σύντομη ονομασία σε λατινικούς χαρακτήρες χωρίς κενά ή σύμβολα, την επίσημη ονομασία του φορέα σε διάφορες γλώσσες, μία περιγραφή σε διάφορες γλώσσες, την ιστοσελίδα του οργανισμού και, τέλος, να επιλέξει αν χαρακτηρίζεται ως «Δημιουργός έγκριτων λεξιλογίων». Η τελευταία επιλογή σημαίνει ότι τα λεξιλόγια που θα δημιουργεί ο φορέας θα θεωρούνται

Page 23: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

εξαρχής έγκριτα, χωρίς να απαιτείται έγκριση από προσωπικό του ΕΚΤ. Οι όροι έγκριτων λεξιλογίων θα εμφανίζονται στα αποτελέσματα αναζητήσεων και στην πλοήγηση με ειδικό διακριτικό ώστε οι χρήστες να έχουν μία ένδειξη αυξημένης αξιοπιστίας και να ενθαρρύνονται έτσι να χρησιμοποιήσουν τους συγκεκριμένους όρους.

Εικόνα 23. Σελίδα διαχείρισης φορέων - Αναζήτηση βάσει λεξιλογίου

Εικόνα 24. Σελίδα επεξεργασίας/δημιουργίας φορέα

Page 24: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

3.3 Διαχείριση Χρηστών Ο χρήστης με ρόλο διαχειριστή μπορεί να εγγράψει, να επεξεργαστεί και να διαγράψει λογαριασμούς χρηστών επιλέγοντας από το μενού διαχειριστή την επιλογή «Χρήστες». Η σελίδα διαχείρισης χρηστών παρουσιάζεται στην Εικόνα 25. Ο διαχειριστής μπορεί να αναζητήσει χρήστες βάσει μικρού ονόματος, επιθέτου, διεύθυνσης ηλεκτρονικού ταχυδρομείου, ονόματος χρήστη, ρόλου, φορέα στον οποίο ανήκει ή συνδυασμού αυτών.

Εικόνα 25. Σελίδα διαχείρισης χρηστών

Η Εικόνα 26 παρουσιάζει την φόρμα εγγραφής/επεξεργασίας λογαριασμού χρήστη. Θα πρέπει να οριστούν ένας ή περισσότεροι ρόλοι («Διαχειριστής», «Αντιπρόσωπος Φορέα»), όνομα, επίθετο, διεύθυνση ηλεκτρονικού ταχυδρομείου, τηλέφωνο επικοινωνίας, όνομα χρήστη και συνθηματικό. Αν επιλεγεί ο ρόλος «Αντιπρόσωπος Φορέα», ο χρήστης θα πρέπει να επιλέξει έναν φορέα (πατώντας το κουμπί «Επιλογή» εμφανίζεται παράθυρο αναζήτησης και επιλογής φορέα).

Page 25: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

Εικόνα 26. Σελίδα επεξεργασίας/δημιουργίας χρήστη - Χρήστης με ρόλο αντιπροσώπου φορέα

3.4 Διαχείριση Λεξιλογίων Ο διαχειριστής μπορεί να δημιουργήσει, να επεξεργαστεί, να εγκρίνει και να διαγράψει λεξιλόγια. Σημειώνεται ότι οι εξουσιοδοτημένοι φορείς μπορούν από μόνοι τους να δημιουργήσουν τα λεξιλόγιά τους, όπως περιγράφεται αναλυτικά στο κεφάλαιο 4. Παρόλο αυτά, ο διαχειριστής του ΕΚΤ μπορεί να δημιουργήσει ένα λεξιλόγιο για λογαριασμό κάποιου φορέα. Από το μενού του διαχειριστή, επιλέγοντας «Λεξιλόγια» εμφανίζεται η σελίδα διαχείρισης λεξιλογίων, η οποία παρουσιάζεται στην Εικόνα 27. Ο χρήστης μπορεί να αναζητήσει λεξιλόγια βάσει σύντομης ονομασίας, βάσει ονομασίας, βάση δημιουργού (φορέα), βάσει λογαριασμού χρήστη, βάσει σημασιολογικής κατηγορίας και, τέλος, βάσει σημασιολογικής κλάσης. Μπορεί να χρησιμοποιήσει οποιονδήποτε συνδυασμό κριτηρίων επιθυμεί.

Page 26: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

Εικόνα 27. Σελίδα διαχείρισης λεξιλογίων

Ο χρήστης μπορεί να δημιουργήσει έναν νέο λεξιλόγιο για λογαριασμό εγγεγραμμένου φορέα (κουμπί «Προσθήκη»), να επεξεργαστεί και να εγκρίνει (μενού στην γραμμή του λεξιλογίου, επιλογή «Επεξεργασία») ή να διαγράψει (μενού στην γραμμή του λεξιλογίου, επιλογή «Διαγραφή») ένα υπάρχον. Στην Εικόνα 28 παρουσιάζεται η φόρμα επεξεργασίας/δημιουργίας λεξιλογίου.

Ο διαχειριστής θα πρέπει να πληκτρολογήσει μία σύντομη ονομασία (σε λατινικούς χαρακτήρες χωρίς κενά ή σύμβολα), να επιλέξει έναν φορέα «δημιουργό» (με το κουμπί «Επιλογή» εμφανίζεται παράθυρο για αναζήτηση και επιλογή φορέα), να εισάγει την ονομασία του λεξιλογίου σε διάφορες γλώσσες, να επιλέξει την σημασιολογική κλάση του λεξιλογίου (με το κουμπί «Επιλογή» εμφανίζεται παράθυρο για αναζήτηση και επιλογή σημασιολογικής κλάσης) η οποία θα καθορίζει το σχήματα μεταδεδομένων των όρων του, να ορίσει την κύρια γλώσσα του λεξιλογίου (οι όροι θα ταξινομούνται βάσει της προτεινόμενης ονομασίας skos:prefLabel σε αυτήν την γλώσσα κατά προτίμηση), να το χαρακτηρίσει «έγκριτο» (το λεξιλόγιο και οι όροι του θα εμφανίζονται στα αποτελέσματα αναζητήσεων και στην πλοήγηση με ειδικό διακριτικό ώστε οι χρήστες να έχουν μία ένδειξη αυξημένης αξιοπιστίας), να το χαρακτηρίσει «δημοσιευμένο» (μόνο τα δημοσιευμένα λεξιλόγια και οι

Page 27: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

όροι τους θα εμφανίζονται στις αναζητήσεις και στην πλοήγηση στην ανοικτή πύλη) και τέλος αν θα είναι ιεραρχικό ή όχι. Αν ο χρήστης χαρακτηρίσει το λεξιλόγιο ως ιεραρχικό, τότε εμφανίζεται η λίστα επιλογών «Γνώρισμα ορισμού ιεραρχίας» η οποία περιλαμβάνει όλα τα πεδία που συμμετέχουν σε σχέσεις «Αντίστροφο (συμμετρικό)», όπως φαίνεται στην Εικόνα 29. Ο χρήστης θα πρέπει να ορίσει το πεδίο πάνω στο οποίο θα ορίζεται η φορά της ιεραρχίας. Για παράδειγμα, για ένα skos:Concept λεξιλόγιο, το πεδίο αυτό θα είναι το skos:broader.

Εικόνα 28. Σελίδα επεξεργασίας/δημιουργίας λεξιλογίου από διαχειριστή για λογαριασμό φορέα

Page 28: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

Εικόνα 29. Χαρακτηρισμός λεξιλογίου ως «Ιεραρχικό»

3.5 Ρυθμίσεις αναζήτησης σε εξωτερικά λεξιλόγια Το σύστημα λεξιλογίων υποστηρίζει την on-line αναζήτηση όρων και σε εξωτερικά λεξιλόγια. Για να υποστηριχθεί ένα εξωτερικό λεξιλόγιο θα πρέπει ο διαχειριστής να το εγγράψει στην σελίδα διαχείρισης εξωτερικών λεξιλογίων (μενού διαχειριστή «Εξωτερικά λεξιλόγια»), η οποία παρουσιάζεται στην Εικόνα 30. Προϋπόθεση για να υποστηριχθεί ένα εξωτερικό λεξιλόγιο είναι να έχει κάποιο http API για αναζήτηση το οποίο να επιστρέφει τα αποτελέσματα σε XML μορφή. Στην Εικόνα 31 παρουσιάζεται η φόρμα εγγραφής.

Εικόνα 30. Σελίδα εγγραφής και παραμετροποίησης εξωτερικών λεξιλογίων

Page 29: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

Εικόνα 31. Σελίδα επεξεργασίας/δημιουργίας εγγραφής παραμετροποίησης εξωτερικού λεξιλογίου

Ο διαχειριστής θα πρέπει να συμπληρώσει μια σύντομη ονομασία, μία αναλυτική ονομασία σε διάφορες γλώσσες, μία ή περισσότερες σημασιολογικές κατηγορίες στις οποίες ανήκει το λεξιλόγιο και μία σειρά από πεδία τα οποία θα αποτελούν τις οδηγείες για την αναζήτηση και την εμφάνιση των αποτελεσμάτων. Τα στοιχεία αυτά είναι τα εξής:

• Υπόδειγμα URL αναζήτησης με μεταβλητές την φράση ${QUERY} και, προαιρετικά, την γλώσσα ${LANG}.

Παράδειγμα: http://api.geonames.org/search?maxRows=10&username=aggregator.ekt.gr&style=FULL&lang=${LANG}&q=${QUERY}

• Το HTTP Accept header της κλίσης αναζήτησης (Προαιρετικό)

Page 30: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

Παράδειγμα: application/xml • Το XML element στο οποίο ενθυλακώνεται κάθε όρος στα αποτελέσματα • Ένα υπόδειγμα για την εξαγωγή του URI ενός όρου στα αποτελέσματα, με μεταβλητή

συγκεκριμένο XML στοιχείο ( μέσα σε #{ } ) . Παράδειγμα: http://www.geonames.org/#{geonameId}

• Το XML στοιχείο για την εξαγωγή της ετικέτας (ονομασίας) του όρου • Ένα υπόδειγμα με μεταβλητές XML στοιχεία (μέσα σε #{ }) για την κατασκευή μίας

περιγραφής Παράδειγμα: #{adminName1} #{adminName2} #{countryName}

3.6 Διαχείριση αποθετηρίων Το Σύστημα Λεξιλογίων προσφέρει ως υπηρεσία την ενοποίηση με εξωτερικά συστήματα. Ο διαχειριστής μπορεί να εγγράψει το αποθετήριο ενός εγγεγραμμένου φορέα έτσι ώστε το αποθετήριο να υλοποιήσει λειτουργικότητα δεσμευμένων πεδίων (να μπορεί να αναζητά όρους χρησιμοποιώντας την μηχανή αναζήτησης του Συστήματος Λεξιλογίων μέσω REST API) ή για να πραγματοποιηθεί ο σημασιολογικός εμπλουτισμός του περιεχομένου του. Η εγγραφή και η διαχείριση αποθετηρίων γίνεται μέσα από την σελίδα αποθετηρίων (Μενού διαχειριστή «Αποθετήρια»), η οποία παρουσιάζεται στην Εικόνα 32.

Εικόνα 32. Σελίδα διαχείρισης αποθετηρίων

Page 31: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

Εικόνα 33. Σελίδα προβολής αποθετηρίου

Για κάθε αποθετήριο, ο διαχειριστής μπορεί να συσχετίσει συγκεκριμένα πεδία μεταδεδομένων του αποθετηρίου με λεξιλόγια του Semantics.gr είτε για να υποστηριχθεί η λειτουργικότητα δεσμευμένων πεδίων είτε για να πραγματοποιηθεί σημασιολογικός εμπλουτισμός για τα συγκεκριμένα πεδία.

Για την υλοποίηση δεσμευμένων πεδίων, όταν ο χρήστης του συγκεκριμένου αποθετηρίου κληθεί να ορίσει τιμή για ένα από αυτά τα πεδία, το σύστημα του αποθετηρίου θα κάνει την κατάλληλη REST κλίση στο Σύστημα Λεξιλογίων, η οποία θα δηλώνει το αποθετήριο και το πεδίο για το οποίο αναζητούνται όροι και θα περιλαμβάνει την λέξη/φράση αναζήτησης. Το Σύστημα Λεξιλογίων θα αποκριθεί με όρους που ταιριάζουν στην λέξη/φράση της αναζήτησης και που ανήκουν στην κατηγορία που έχει οριστεί ή στα λεξιλόγια που έχουν οριστεί για το συγκεκριμένο πεδίο.

Για την λειτουργία σημασιολογικού εμπλουτισμού, για κάθε πεδίο μεταδεδομένων του αποθετηρίου που συσχετίζεται με λεξιλόγια, ο διαχειριστής μπορεί να δημιουργήσει κανόνες αντιστοίχησης από τιμές του συγκεκριμένου πεδίου σε όρους του συσχετιζόμενου λεξιλογίου (βλέπε Ενότητα 5).

Page 32: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

Στην Εικόνα 33 παρουσιάζεται η σελίδα προβολής αποθετηρίου και στην Εικόνα 34 η φόρμα εγγραφής/επεξεργασίας αποθετηρίου. Κάθε πεδίο μεταδεδομένων μπορεί να συσχετιστεί με συγκεκριμένη σημασιολογική κατηγορία ή με συγκεκριμένα λεξιλόγια.

Εικόνα 34. Σελίδα επεξεργασίας/δημιουργίας αποθετηρίου - Παραμετροποίηση πεδίων

Page 33: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

4 Περιβάλλον για Φορείς/Δημιουργούς λεξιλογίων

Οι χρήστες που αντιπροσωπεύουν φορείς μπορούν να συνδεθούν στο Σύστημα Λεξιλογίων για να δημιουργήσουν και να επεξεργαστούν τα λεξιλόγιά τους αλλά και να δουν τα στοιχεία των αποθετηρίων τους (η δημιουργία και η επεξεργασία αποθετηρίων πραγματοποιείται από τον διαχειριστή του ΕΚΤ για λογαριασμό τους). Στην Εικόνα 35 παρουσιάζεται το μενού που εμφανίζεται σε έναν χρήστη (με όνομα «hgeorgiadis”) που είναι αντιπρόσωπος του Φορέα «Εθνικό Κέντρο Τεκμηρίωσης».

Εικόνα 35. Μενού επιλογών αντιπροσώπου φορέα

Εικόνα 36. Σελίδα 'Τα λεξιλόγια μου'

Page 34: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

Επιλέγοντας «Τα λεξιλόγιά μου», ο χρήστης μεταβαίνει σε μία λίστα με όλα τα λεξιλόγια του φορέα του (Εικόνα 36). Μέσα από την σελίδα αυτή, ο χρήστης μπορεί να δημιουργήσει ένα νέο λεξιλόγιο ή να επεξεργαστεί ένα υπάρχον (π.χ. να το δημοσιεύσει ή να εισάγει νέους όρους). Οι σελίδες δημιουργίας/επεξεργασίας είναι σχεδόν ίδιες με τις αντίστοιχες που εμφανίζονται στον διαχειριστή (και που περιγράφηκαν στις ενότητα 3.4) με την διαφορά ότι τώρα απουσιάζει η δυνατότητα έγκρισης λεξιλογίου (την δυνατότητα αυτή την έχει μόνο προσωπικό του ΕΚΤ) ενώ φυσικά ο δημιουργός/φορέας είναι προεπιλεγμένος.

Εικόνα 37. Σελίδα περιεχομένου λεξιλογίου

Ο χρήστης φορέα μπορεί να εισάγει περιεχόμενο (όρους) στα λεξιλόγια που δημιούργησε. Αυτό μπορεί να το κάνει από την λίστα με τα λεξιλόγιά του, είτε επιλέγοντας σε μια γραμμή ενός λεξιλογίου το μενού «Όροι λεξιλογίου» ή κλικάροντας στον σύνδεσμο της σύντομης ονομασίας του λεξιλογίου. Αμέσως μεταφέρεται στην σελίδα περιεχομένου λεξιλογίου, η οποία παρουσιάζεται στην Εικόνα 37.

Πατώντας το κουμπί «Προσθήκη», ο χρήστης μπορεί να δημιουργήσει έναν νέο όρο στο συγκεκριμένο λεξιλόγιο μέσα από την φόρμα δημιουργίας/επεξεργασίας όρου λεξιλογίου (Εικόνα 38). Στην φόρμα αυτή εμφανίζονται όλα τα πεδία που ορίστηκαν στην σημασιολογική κλάση στην οποία ανήκει το λεξιλόγιο. Τα πεδία τα οποία ορίστηκαν ως πολλαπλά συνοδεύονται από το κουμπιά «+» και «-» με τα οποία ο χρήστης προσθέτει ή αφαιρεί πεδία τιμών. Τα πεδία τα οποία έχουν οριστεί ως πολυγλωσσικά συνοδεύονται από λίστα επιλογής γλώσσας. Τα πεδία τα οποία έχουν οριστεί ώς αναφορικά συνοδεύονται από τα κουμπιά «Σύνδεσμος » και «Αναζήτηση ». Αν το πεδίο είναι αποκλειστικά αναφορικό, το κουμπί «Σύνδεσμος » είναι ανενεργό, το πεδίο δεν επιτρέπει την εισαγωγή ελεύθερου κειμένου και ο χρήστης θα πρέπει να πατήσει το κουμπί «Αναζήτηση » προκειμένου να αναζητήσει/επιλέξει/εισάγει μια αναφορά σε όρο. Αν το πεδίο μπορεί να είναι είτε αναφορικό είτε λεκτικό, αυτό ορίζεται από τον χρήστη ενεργοποιώντας ή απενεργοποιώντας το κουμπί «Σύνδεσμος ». Ενεργοποιώντας το κουμπί, εμφανίζεται και το κουμπί «Αναζήτηση » και απενεργοποιείται η δυνατότητα εισαγωγής ελεύθερου κειμένου.

Page 35: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

Εικόνα 38. Σελίδα δημιουργίας όρου σε λεξιλόγιο

Page 36: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

Επιλέγοντας το κουμπί «Αναζήτηση » ενός αναφορικού πεδίου, εμφανίζεται ένα παράθυρο (Εικόνα 39) για την αναζήτηση/επιλογή όρου (στα λεξιλόγια του συστήματος και στα εξωτερικά λεξιλόγια που υποστηρίζονται). Σημειώνεται ότι το παράθυρο πιθανώς να περιορίσει το εύρος της αναζήτησης ανάλογα με το πως έχει οριστεί το αντίστοιχο παραμετρικό πεδίο. Συγκεκριμένα, στο παράθυρο δημιουργία/επεξεργασίας πεδίου (Ενότητα 3.1), ο διαχειριστής ορίζει το είδος των αναφορών που υποστηρίζει το πεδίο: αναφορές μόνο σε όρους του ίδιου λεξιλογίου, αναφορές μόνο σε όρους της ίδιας σημασιολογικής κλάσης ή αναφορές που ανήκουν σε συγκεκριμένη σημασιολογική κατηγορία. Αν δεν επιλέχθηκε ότι το συγκεκριμένο πεδίο θα πρέπει να αναφέρεται μόνο σε όρους του συγκεκριμένου λεξιλογίου, τότε δίνεται η δυνατότητα εισαγωγής απευθείας αναφοράς (εισάγοντας το URI και την ετικέτα ενός πιθανώς εξωτερικού όρου που ο χρήστης έχει ήδη αναζητήσει από πριν χωρίς να χρησιμοποιήσει την μηχανή αναζήτησης), όπως φαίνεται στην Εικόνα 40.

Εικόνα 39. Συσχέτιση με άλλον όρο (παράθυρο επιλογής)

Εικόνα 40. Συσχέτιση με εξωτερικό όρο με απευθείας εισαγωγή ετικέτας και URI

Ο Φορέας μπορεί να επεξεργαστεί έναν υπάρχοντα όρο, επιλέγοντας «Επεξεργασία» από το μενού που εμφανίζεται στα δεξιά του όρου στην σελίδα περιεχομένου λεξιλογίου.

Page 37: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

5 Εργαλείο Σημασιολογικού Εμπλουτισμού

Το Semantics.gr διαθέτει ένα πρωτότυπο και ιδιαίτερα φιλικό εργαλείο για μαζικό ημιαυτόματο σημασιολογικό εμπλουτισμό και ομογενοποίηση περιεχομένου που μπορεί να προσφέρεται ως υπηρεσία τόσο σε αποθετήρια πρωτογενούς περιεχομένου όσο και σε συσσωρευτές. Ο εμπλουτισμός γίνεται ανά αποθετήριο για συγκεκριμένα πεδία μεταδεδομένων και προϋποθέτει τον ορισμό κανόνων αντιστοίχισης. To σύστημα παρέχει μια σειρά από REST υπηρεσίες ιστού που επιτρέπουν στα αποθετήρια να εμπλουτίσουν το περιεχόμενό τους μαζικά σύμφωνα με τους κανόνες αντιστοίχισης που ορίστηκαν.

Αρχικά το προς διαχείριση αποθετήριο ή συλλογή καταχωρείται στο σύστημα. Το εργαλείο δεν πραγματοποιεί τον καθ’ αυτό εμπλουτισμό του περιεχομένου. Αντ’ αυτού παρέχει ένα GUI περιβάλλον με μια σειρά εργαλείων αυτοματισμού που βοηθούν τον επιμελητή να ορίσει κανόνες αντιστοίχισης για τα μεταδεδομένα της κάθε συλλογής. Οι κανόνες εμπλουτισμού καθορίζονται ανά ξεχωριστή τιμή ενός προκαθορισμένου πεδίου (πρωτεύον πεδίο) ή λαμβάνοντας υπόψη και τις τιμές ενός δεύτερου πεδίου (δευτερεύον πεδίο), πάντως όχι ανά τεκμήριο ή βιβλιογραφική εγγραφή. Το εργαλείο επικοινωνεί με τα μεταδεδομένα του αποθετηρίου μέσω OAI-PMH harvesting (χρησιμοποιώντας το σύστημα συγκομιδής περιεχομένου του ΕΚΤ Harvester [13]) προκειμένου να παράξει τις τιμές συγκεκριμένων πεδίων μεταδεδομένων πάνω στις οποίες θα χτιστούν οι αντιστοιχίσεις. Αξίζει να σημειωθεί ότι το εργαλείου εμπλουτισμού αποθηκεύει μόνο τις τιμές των προεπιλεγμένων πεδίων που πρόκειται να εμπλουτιστούν ή να χρησιμοποιηθούν ως φίλτρα και όχι το σύνολο των μεταδεδομένων.

Το εργαλείο μπορεί να χρησιμοποιηθεί για τον εμπλουτισμό τόσο αποθετηρίων όσο και συσσωρευτών περιεχομένου (aggregators). Ειδικά για την περίπτωση ενός aggregator συνίσταται η διαμόρφωση κανόνων εμπλουτισμού του περιεχομένου ανά ξεχωριστή συλλογή, η οποία θα πρέπει να καταχωρηθεί χωριστά ως αποθετήριο στο semantics.gr (βλ. ενότητα 3.6), προκειμένου να αντιμετωπιστούν οι ιδιαιτερότητες των μεταδεδομένων κάθε χωριστού παρόχου/αποθετηρίου.

Εφόσον ολοκληρωθεί η διαδικασία καθορισμού των κανόνων αντιστοίχησης και εμπλουτισμού, οι κανόνες αυτοί διατίθενται μέσω REST API σε json format (βλ. κεφάλαιο 6) που μπορεί εν συνεχεία να χρησιμοποιηθεί από το σύστημα σταθερής απόθεσης ή συσσώρευσης για να εμπλουτίσει μαζικά το περιεχόμενό του.

Για την καλύτερη κατανόηση της λειτουργίας του εργαλείου εμπλουτισμού θα χρησιμοποιηθεί το ακόλουθο παράδειγμα.

Ας υποθέσουμε ότι ένας συσσωρευτής (aggregator) έχει συλλέξει συλλογές τεσσάρων αποθετηρίων και πρόκειται να εμπλουτίσει και να ομογενοποιήσει το πεδίο «τύπος περιεχομένου» (dc:type). Στον Πίνακα Ι καταγράφονται οι ιδιαιτερότητες κάθε μιας συλλογής

Page 38: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

αναφορικά με την ποιότητα της τεκμηρίωσης της. Κάθε συλλογή ανήκει σε διαφορετική κατηγορία βάση της ποιότητας των μεταδεδομένων της. Οι κατηγορίες είναι οι Α, Β, C και D.

Συλλογή Κατηγορία αποθετηρίου

Περιγραφή της τεκμηρίωσης

R1 Α Καλή τεκμηρίωση του πεδίου dc:type.

R2 Β

Πολύ λεπτομερής και εξειδικευμένη τεκμηρίωση του πεδίου dc:type.

R3 C

Ανεπαρκής τεκμηρίωση του πεδίου dc:type, χρήσιμο το πεδίο dc:subject.

R4 D

Ανεπαρκής τεκμηρίωση του πεδίου dc:type, χρήσιμο το πεδίο dc:title.

Πίνακας I. 4 συλλογές ανά κατηγορία τεκμηρίωσης

Ο φορέας επιδιώκει τον εμπλουτισμό του πεδίου dc:type χρησιμοποιώντας ως όρους αναφοράς ένα δίγλωσσο ιεραρχικό λεξιλόγιο V που είναι ήδη δημοσιευμένο στο semantics.gr:

http://scs.gr/sculpture skos:prefLabel “Sculpture”@en | “Γλυπτό”@el http://scs.gr/figurine skos:prefLabel “Figurine”@en | “Ειδώλιο”@el http://scs.gr/Jewellery

skos:prefLabel “Jewellery”@en | “Κόσμημα”@el http://scs.gr/vessel skos:prefLabel “Vessel”@en | “Σκεύος”@el http://scs.gr/vase skos:prefLabel “Vase”@en | “Αγγείο”@el

5.1 Βασική παραμετροποίηση φόρμας αντιστοιχίσεων Ο επιμελητής δημιουργεί μια νέα φόρμα αντιστοίχισης για τη συλλογή R1. Για να το κάνει αυτό θα πρέπει από το βασικό μενού να επιλέξει «Διαχείριση» «Αντιστοιχίσεις Πεδίων Αποθετηρίων». Στην συνέχεια θα πρέπει να επιλέξει «Προσθήκη» για να δημιουργήσει ένα σύνολο αντιστοιχίσεων για το πεδίο ενός αποθετηρίου, στο παράδειγμά μας για το «dc:type» του R1, μέσα από ειδική φόρμα η οποία παρουσιάζεται στην Εικόνα 41. Ο χρήστης θα πρέπει να ορίσει το αποθετήριο, το πεδίο μεταδεδομένων προς εμπλουτισμό (θα πρέπει να έχει δηλωθεί το πεδίο στην φόρμα επεξεργασίας του αποθετηρίου) και ορισμένες οδηγίες που χρειάζεται το σύστημα για την εξαγωγή των ξεχωριστών τιμών του πεδίου μεταδεδομένων από το περιεχόμενο του αποθετηρίου (μέσω του συστήματος Harvester [13]). Συγκεκριμένα, θα πρέπει να οριστεί η κατηγορία του πεδίου, αν δηλαδή είναι απλό λεκτικό (όπως το dc:type στο σχήμα μεταδεδομένων ESE) ή υποστηρίζει RDF αναφορές (όπως το dc:type στο RDF-

Page 39: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

based σχήμα μεταδεδομένων EDM). Στην δεύτερη περίπτωση, απαιτείται να δοθεί το XML υπο-στοιχείο του RDF πόρου που περιέχει το λεκτικό (π.χ. skos:prefLabel).

Εικόνα 41. Φόρμα ορισμού αντιστοιχίσεων πεδίου αποθετηρίου – εισαγωγή βασικών στοιχείων

Ο χρήστης προαιρετικά καλείται να συμπληρώσει προτεινόμενη γλώσσα για πολυγλωσσικά πεδία ώστε οι αντιστοιχίσεις να γίνουν βάσει του λεκτικού σε αυτή την γλώσσα καθώς και ένα μοτίβο (pattern) ενός URL το οποίο θα αποτελεί οδηγό για την εμφάνιση όλων των τεκμηρίων με συγκεκριμένη τιμή στο αντιστοιχιζόμενο πεδίο, δυνατότητα που θα δίνεται με τον ειδικό σύνδεσμο « » σε κάθε μία τιμή χωριστά (deep linking). Εφόσον χρησιμοποιηθεί δευτερεύον πεδίο, ο χρήστης μπορεί να εισάγει μοτίβο και για την συνδυαστική αναζήτηση βάσει τιμών στο πρωτεύον και στο δευτερεύον πεδίο. Οι σύνδεσμοι αυτοί είναι ιδιαίτερα χρήσιμοι καθώς ο χρήστης που ορίζει τις αντιστοιχίσεις μπορεί εύκολα να περιηγηθεί στις εγγραφές τεκμηρίων για κάθε μία ξεχωριστή τιμή του πρωτεύοντος πεδίου μεταδεδομένων (ή για κάθε ζεύγος τιμών πρωτεύοντος και δευτερεύοντος πεδίου). Σημειώνεται ότι για αποθετήρια των οποίων το περιεχόμενο έχει ήδη συλλεχθεί από έναν συσσωρευτή, όπως το SearchCulture.gr, το URL μπορεί να είναι ένα κατάλληλο μοτίβο αναζήτησης στην

Page 40: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

διαδικτυακή του πύλη (ή σε μια acceptance εγκατάσταση της πύλης) . Για παράδειγμα, για ένα αποθετήριο του SearchCulture.gr με σύντομη ονομασία “AMusChania” και για το πεδίο dc:type, το URL θα μπορούσε να έχει την μορφή:

http://searchculture.gr/aggregator/portal/search?keywords%5B0%5D.value=#####&keywords%5B0%5D.field=proxy_dc_type&providerShortName=AMusChania όπου “#####” το σημείο το οποίο θα αντικαθίσταται από το σύστημα δυναμικά με την εκάστοτε τιμή.

Τέλος, ο χρήστης θα πρέπει να συμπληρώσει τον προσδιοριστή της διαδικασίας συγκομιδής των μεταδεδομένων του αποθετηρίου από το σύστημα συγκομιδής Harvester [13] (ο χρήστης θα πρέπει πρώτα να επισκεφθεί το σύστημα Harvester, να εντοπίσει την διαδικασία συγκομιδής μεταδεδομένων και να σημειώσει τον προσδιοριστή της).

Το λεξιλόγιο αναφοράς συμπληρώνεται αυτόματα. Είναι το λεξιλόγιο που συσχετίστηκε με το συγκεκριμένο πεδίο μεταδεδομένων του αποθετηρίου στην φόρμα εισαγωγής/επεξεργασίας αποθετηρίου (βλ. ενότητα 3.6).

Στην συνέχεια ο επιτηρητής θα πρέπει να πατήσει το κουμπί «Συγκομιδή τιμών» ώστε το εργαλείο εμπλουτισμού να συλλέξει τις τιμές του πρωτεύοντος πεδίου (ή και του δευτερεύοντος, εφόσον έχει οριστεί) των μεταδεδομένων του αποθετηρίου. Πάνω σε αυτές τις τιμές θα οριστούν οι αντιστοιχήσεις σε όρους του λεξιλογίου αναφοράς.

5.2 Εμπλουτισμός κατηγορίας Α – αντιστοίχιση τιμών μεταδεδομένων

Στην απλούστερη μορφή τους οι κανόνες εμπλουτισμού είναι απλές αντιστοιχίσεις μοναδικών τιμών ενός συγκεκριμένου πεδίου που αποκαλείται «πρωτεύον» (στην προκειμένη περίπτωση το πεδίο dc:type) με όρους λεξιλογίου. Το εργαλείο εμπλουτισμού υποστηρίζει τη λειτουργία αυτόματης αντιστοίχισης (που βασίζεται σε ομοιότητα συμβολοσειρών) μεταξύ τιμών πεδίων μεταδεδομένων και ευρετηριασμένων γνωρισμάτων του λεξιλογίου (εν προκειμένω των τιμών των skos:prefLabel και skos:altLabel).Η λειτουργία αυτόματης αντιστοίχισης είναι ιδιαίτερα αποτελεσματική και αποδοτική καθώς εκμεταλλεύεται το σύστημα ευρετηρίασης Apache Solr που χρησιμοποιεί το semantics.gr για τη μηχανή αναζήτησης της διαδικτυακής του πύλης.

Η συλλογή R1 ανήκει στην κατηγορία Α και η διαδικασία εμπλουτισμού της είναι η απλούστερη. Έστω στο παράδειγμά μας ότι μετά τη συγκομιδή τιμών παράγεται μια λίστα 3 διαφορετικών τιμών dc:type μαζί με των αριθμό των τεκμηρίων που αντιστοιχούν σε αυτές (Πίνακας II, 1η στήλη). Η Εικόνα 42 παρουσιάζει την φόρμα αντιστοιχίσεων όπως φαίνεται στην πραγματικότητα αμέσως μετά την συγκομιδή.

Τιμές dc:type Όροι λεξιλογίου V γλυπτική (120 items) http://scs.gr/sculpture auto αγγεία (230 items) http://scs.gr/vase auto κοσμήματα (135 items) http://scs.gr/Jewellery auto

Πίνακας II. Πρωτεύον πεδίο dc:type (παράδειγμα κατηγορίας A )

Page 41: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

Εικόνα 42. Η φόρμα αντιστοιχίσεων πεδίου αποθετηρίου αμέσως μετά την συγκομιδή τιμών

Εικόνα 43. Η φόρμα αντιστοιχίσεων πεδίου αποθετηρίου αμέσως μετά την αυτόματη αντιστοίχηση

Page 42: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

Κατόπιν ο επιμελητής πατώντας το κουμπί «αυτόματη αντιστοίχιση» ενεργοποιεί την αντίστοιχη διαδικασία η οποία παράγει επιτυχημένα προτάσεις για όλες τις διαφορετικές τιμές χρησιμοποιώντας τους ορθούς όρους του λεξιλογίου. Η Εικόνα 43 παρουσιάζει την φόρμα αντιστοιχίσεων όπως φαίνεται στην πραγματικότητα αμέσως μετά την αυτόματη αντιστοίχιση. Τέλος ο επιμελητής εγκρίνει τις προτάσεις του συστήματος αλλάζοντας για κάθε πρόταση την κατάστασή της από «προς επικύρωση» σε «τελική», όπως φαίνεται στην Εικόνα 44, και έτσι ολοκληρώνεται η διαδικασία.

Εικόνα 44. O επιμελητής ορίζει την κατάσταση μιας αντιστοίχισης ως τελική.

Οι κανόνες αντιστοίχισης για τη συλλογή R1 παρουσιάζονται στον Πίνακα ΙΙ (2η στήλη). Η τιμή «auto» καταδεικνύει ότι ο συγκεκριμένος κανόνας προέκυψε αυτόματα.

5.3 Εμπλουτισμός κατηγορίας Β – μηχανισμός αυτοεκμάθησης Η συλλογή R2 ανήκει στην κατηγορία Β που περιλαμβάνει συλλογές με πολύ αναλυτική ή και εξειδικευμένη τεκμηρίωση του πρωτεύοντος πεδίου. Όπως δείχνει ο Πίνακας III , όλες οι τιμές dc:type της R2 είναι πιο εξειδικευμένοι όροι από αυτούς του λεξιλογίου V.

Εφόσον η λειτουργία αυτόματης αντιστοίχισης δεν θα μπορούσε να δώσει ικανοποιητικά αποτελέσματα στην περίπτωση αυτή, ένας εξειδικευμένος επιμελητής, εν προκειμένω ένας αρχαιολόγος, θα καλείται να κάνει χειροκίνητα την αντιστοίχιση. Το περιβάλλον παρέχει εργαλεία όπως drop down lists με μηχανισμό αυτόματης συμπλήρωσης (Εικόνα 45) αλλά και αναδυόμενα παράθυρα για σύνθετη αναζήτηση και επιλογή λεξιλογικών όρων.

Τιμή dc:type Όροι λεξιλογίου V αμφορέας (100 items) http://scs.gr/ vase manual οινοχόη (110 items) http://scs.gr/ vase manual

Πίνακας III. Πρωτεύον πεδίο: dc:type (Παράδειγμα κατηγορίας Β)

Page 43: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

Εικόνα 45. Χειροκίνητη αντιστοίχιση με όρο λεξιλογίου

Το εργαλείο σημασιολογικού εμπλουτισμού έχει σχεδιαστεί κατά τέτοιο τρόπο ώστε να μπορεί να «απομνημονεύσει» επιλεγμένες αντιστοιχίσεις, δίνοντας έτσι τη δυνατότητα αυτοματοποίησης της διαδικασίας σε επόμενες συλλογές. Για τις επιλεγμένες αντιστοιχίσεις, οι τιμές που αντιστοιχήθηκαν σε συγκεκριμένους όρους λεξιλογίου αποθηκεύονται ως λέξεις-κλειδιά στους αντίστοιχους όρους. Οι λέξεις κλειδιά των όρων ευρετηριάζονται κανονικά όπως οι προτεινόμενες και εναλλακτικές τους ονομασίες. Με αυτόν τον τρόπο, σε μελλοντικές αντιστοιχίσεις, η λειτουργία αυτόματης αντιστοίχισης θα μπορεί να προτείνει αυτόματα όρους λαμβάνοντας υπόψη και τις λέξεις-κλειδιά αυτών.

Εικόνα 46. Δημιουργία λέξεων-κλειδιών από αντιστοιχίσεις

Ο επιμελητής έχει την δυνατότητα να επιλέξει ποιες αντιστοιχίσεις θα πρέπει απομνημονεύσει το σύστημα. Για να το κάνει αυτό θα πρέπει μέσα από την σελίδα διαχείρισης λεξιλογίων (Ενότητα 3.4) για το συγκεκριμένο λεξιλόγιο αναφοράς να επιλέξει από το μενού του «ΕνέργειεςΔημιουργία λέξεων-κλειδιών όρων λεξιλογίου από αντίστοιχίσεις πεδίων αποθετηρίου», όπως φαίνεται στην Εικόνα 46. Αμέσως εμφανίζεται η φόρμα δημιουργία λέξεων-κλειδιών από προηγούμενες αντιστοιχίσεις (Εικόνα 47). Στην φόρμα αυτή, ο επιμελητής επιλέγει σύνολα αντιστοιχίσεων ορίζοντας ένα ή περισσότερα αποθετήρια (συλλογές) καθώς και το πρωτεύον πεδίο μεταδεδομένων των αντιστοιχίσεων (π.χ dc:type). Στην συνέχεια, επιλέγοντας «Δημιουργία προτάσεων για λέξεις κλειδιά»

Page 44: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

εμφανίζονται όλοι οι όροι του λεξιλογίου και για κάθε όρο όλες οι τιμές στις οποίες πραγματοποιήθηκαν αντιστοιχίσεις στα επιλεγμένα αποθετήρια. Ο επιμελητής επιλέγει τιμές που εκτιμά ότι θα πρέπει να καταχωρηθούν ως λέξεις-κλειδιά στους αντίστοιχους όρους.

Εικόνα 47. Φόρμα δημιουργία λέξεων-κλειδιών από προηγούμενες αντιστοιχίσεις

Page 45: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

Η Εικόνα 48 παρουσιάζει την φόρμα επεξεργασίας ενός όρου λεξιλογίου όπου φαίνεται το ειδικό πεδίο «Λέξεις-κλειδιά» το οποίο είναι ένα απλό πλαίσιο κειμένου όπου κάθε γραμμή περιλαμβάνει μία λέξη-κλειδί. Ο χρήστης μπορεί μέσα από αυτή την φόρμα να τροποποιήσει τις λέξεις-κλειδιά εφόσον το επιθυμεί.

Εικόνα 48. Λέξεις-κλειδία σε όρο λεξιλογίου

Επιστρέφοντας στο παράδειγμά μας (Πίνακας III), ο επιμελητής μπορεί να πραγματοποιήσει την παραπάνω διαδικασία ώστε το σύστημα να «θυμάται» ότι ο αμφορέας και η οινοχόη είναι τύποι αγγείων για μελλοντικές αντιστοιχίσεις. Έτσι, οι λέξεις «αμφορέας» και «οινοχόη» προστίθενται ως λέξεις κλειδιά στον όρο «Αγγείο» του λεξιλογίου V.

5.4 Εμπλουτισμός κατηγορίας C – Χρησιμοποιώντας δευτερεύοντα πεδία

Οι συλλογές της κατηγορίας C έχουν ανεπαρκή τεκμηρίωση του πρωτεύοντος πεδίου (είτε για μέρος ή για το σύνολο των τεκμηρίων τους) αλλά η παρεχόμενη πληροφορία άλλων πεδίων μεταδεδομένων μπορεί να βοηθήσει στη διαδικασία εμπλουτισμού. Ένα τέτοιο πεδίο ονομάζεται «δευτερεύον» και οι τιμές του «φίλτρα». Παραδείγματος χάριν σε μία εγγραφή

Page 46: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

μεταδεδομένων ένα τεκμήριο μπορεί να έχει την τιμή «λαογραφικό αντικείμενο» στο πεδίο dc:type αλλά στο πεδίο dc:subject την τιμή «κόσμημα». Προκειμένου να χρησιμοποιηθεί δευτερεύον πεδίο κατά τη διαδικασία εμπλουτισμού, ο επιμελητής θα πρέπει εξ’ αρχής να επιλέξει το πεδίο που θα λειτουργήσει ως φίλτρο (Εικόνα 49).

Εικόνα 49. Το πεδίο dc:subject ορίζεται ως δευτερεύον πεδίο.

Αυτή τη φορά, κατά την συγκομιδή τιμών, το σύστημα θα συγκεντρώσει τις ξεχωριστές τιμές του πρωτεύοντος πεδίου για κάθε τιμή του οποίου θα συγκεντρώσει και όλες τις τιμές του δευτερεύοντος πεδίου προκειμένου να προχωρήσει σε αντιστοιχήσεις.

dc:type Φίλτρα (dc:subject) Entry from vocabulary V1 Κεραμικά αντικείμενα (101)

αμφορέας () , αγγείο (), ειδώλιο () …

http://scs.gr/vase if filter in [“αγγείο”, “αμφορέας”]

auto auto

http://scs.gr/figurine if filter in [“ειδώλιο”]

auto auto

εκθέματα (55) σκουλαρίκι (), αμφορέας (), …

http://scs.gr/Jewellery if filter in [“σκουλαρίκι”]

auto auto

http://scs.gr/vase if filter in [“αμφορέας”] & NOT in [“σκουλαρίκι”]

auto manual

Πίνακας IV. Πρωτεύον πεδίο: dc:type, Δευτερεύον πεδίο φίλτρων: dc:subject (Παράδειγμα κατηγορίας C)

Η συλλογή R3 ανήκει στην κατηγορία αυτή. Ως δευτερεύον πεδίο καθορίζεται το dc:subject και οι τελικοί κανόνες, μετά την πυροδότηση της αυτόματης αντιστοίχισης, εμφανίζονται στον Πίνακα IV. Αναλυτικά, όταν το σύστημα εντοπίζει στην τιμή του πρωτεύομτος πεδίου ή σε κάποιο φίλτρο τους όρους «αγγείο» (όρος του λεξιλογίου) ή «αμφορέας» (αποθηκευμένη λέξη-κλειδί στον όρο «αγγείο») προτείνει αυτόματα τον όρο «αγγείο» του λεξιλογίου V. H Εικόνα 50 παρουσιάζει την φόρμα αντιστοιχίσεων με χρήση φίλτρων όπως φαίνεται στην πραγματικότητα.

Στις περιπτώσεις που η λειτουργία αυτόματης αντιστοίχισης δεν μπορεί να δώσει ικανοποιητικά αποτελέσματα ο επιμελητής μπορεί να διαμορφώσει χειροκίνητα τους κατάλληλους κανόνες χρησιμοποιώντας τις πολλαπλές drop down lists για τον καθορισμό των φίλτρων. Ο μηχανισμός επιτρέπει στον επιμελητή να δημιουργήσει λογικές εκφράσεις επί των φίλτρων για την αποφυγή λαθών (λογικό ΚΑΙ, λογικό ‘Η, λογικό ΌΧΙ). Επιστρέφοντας στο παράδειγμα του Πίνακα IV, τεκμήρια με τιμή dc:type “εκθέματα» θα εμπλουτιστούν με τον όρο http://scs.gr/vase εφόσον έχουν την τιμή «αμφορέας» στο πεδίο dc:subject αλλά ΟΧΙ αν έχουν την τιμή «σκουλαρίκι» στο ίδιο πεδίο (αν υποθέσουμε ότι ένα ψηφιακό αντικείμενο

Page 47: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

εικονίζει ένα σκουλαρίκι σε σχήμα αμφορέα). H Εικόνα 50 παρουσιάζει τον καθορισμό λογικών εκφράσεων πάνω σε φίλτρα.

Εικόνα 50. Προσθήκη φίλτρων

Εικόνα 51. Η φόρμα αντιστοίχισης μιας συλλογής κατηγορίας C (πρωτεύον πεδίο dc:type, δευτερεύον πεδίο: dc:subject)

Page 48: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

5.5 Εμπλουτισμός κατηγορίας D – Χρησιμοποιώντας περιγραφικά πεδία

Οι συλλογές της κατηγορίας D έχουν εξαιρετικά ανεπαρκή τεκμηρίωση του πρωτεύοντος πεδίου και οι τιμές των άλλων πεδίων δεν είναι τέτοιες ώστε να διευκολύνουν τη διαδικασία του εμπλουτισμού. Υπάρχουν ωστόσο περιγραφικά πεδία, όπως το dc:title ή το dc:description, που μπορεί να περιέχουν συγκεκριμένες λέξεις που βοηθούν την αντιστοίχιση με τους ορθούς όρους του λεξιλογίου. Για παράδειγμα ο τίτλος «Αμφορέας Μυκηναϊκής εποχής» υποδηλώνει ότι το τεκμήριο που περιγράφει είναι «αγγείο». Ασφαλώς η χρήση ολόκληρων των τιμών των περιγραφικών πεδίων ως φίλτρα δεν είναι πρακτική (εξάλλου ο πληθάριθμός τους ταυτίζεται με των αριθμό τεκμηρίων). Για τον λόγο αυτό, το σύστημα παρέχει τη δυνατότητα αναζήτησης μέσα στις τιμές αυτές συγκεκριμένων λέξεων. Οι λέξεις που τελικά εντοπίστηκαν μέσα στις τιμές του περιγραφικού πεδίου χρησιμοποιούνται στη συνέχεια ως φίλτρα. Ο επιμελητής μπορεί να ορίσει ο ίδιος το σύνολο των λέξεων που θα αναζητηθούν εισάγοντάς τες στο πεδίο «Περιορισμός αναζήτησης φίλτρων μόνο στην ακόλουθη λίστα», κάνοντας ταυτόχρονα την επιλογή «Φιλτράρισμα βάσει της σχέσης του περιέχεσθαι» (Εικόνα 52).

Εναλλακτικά, ο επιμελητής πατώντας το κουμπί «Αυτόματη δημιουργία» εντοπίζει όλες τις λέξεις που περιέχονται στο περιγραφικό πεδίο χρησιμοποιώντας ως «δεξαμενή» πιθανών λέξεων όλες τις προτεινόμενες ονομασίες, τις εναλλακτικές ονομασίες και τις λέξεις κλειδιά όλων των όρων του λεξιλογίου αναφοράς. Στη συνέχεια η διαδικασία του εμπλουτισμού είναι ίδια ακριβώς με αυτή των συλλογών της κατηγορίας C. Η Εικόνα 53 παρουσιάζει την φόρμα αντιστοιχίσεων με χρήση περιγραφικού δευτερεύοντος πεδίου και φίλτρα συγκεκριμένες λέξεις που εντοπίστηκαν μέσα στις τιμές του πεδίου αυτού.

Εικόνα 52. Αναζήτηση συγκεκριμένων λέξεων ως φίλτρα σε περιγραφικά πεδία

Page 49: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

Εικόνα 53. Αντιστοιχήσεις με δευτερεύων περιγραφικό πεδίο (dc:title)

Page 50: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

6 RESTful Υπηρεσίες Το REST API του Συστήματος Σημασιολογικών Λεξιλογίων παρέχει μία σειρά από μεθόδους που επιτρέπουν σε ένα εξωτερικό σύστημα (αποθετήριο που επιθυμεί να δημιουργήσει δεσμευμένα πεδία, συσσωρευτή που επιθυμεί να εμπλουτίσει σημασιολογικά το περιεχόμενο αποθετηρίων που συσσωρεύει, αποθετήριο που επιθυμεί να εμπλουτίσει σημασιολογικά το περιεχόμενό του) να χρησιμοποιήσει τις υπηρεσίες του συστήματος. Ακολουθούν οι προδιαγραφές του API.

Υπηρεσίες για ενοποίηση με αποθετήρια (για υλοποίηση δεσμευμένων πεδίων)

GET / rest-api/search/{repositoryShortName}/{repositoryField}

Περιγραφή Επιστρέφει το αποτέλεσμα αναζήτησης όρων λεξιλογίων (εσωτερικών και εξωτερικών) για ένα συγκεκριμένο αποθετήριο και πεδίο μεταδεδομένων και για συγκεκριμένο search keyword. Η αναζήτηση πιθανώς να περιοριστεί σε συγκεκριμένα λεξιλόγια, ανάλογα με την παραμετροποίηση του αποθετηρίου για το συγκεκριμένο πεδίο. Το αντικείμενο που επιστρέφεται περιλαμβάνει δύο ξεχωριστές λίστες, μία με όρους από λεξιλόγια του semantics.gr και μία με όρους εξωτερικών λεξιλογίων.

Response Content Type:

Application/xml

Επιστρέφει: MetadataRecordsPage { internalVocabResults (List[VocabularyEntryLightDTO]), externalVocabResults (List[ExternalVocabularyEntryDTO]), }

Παράμετροι: repositoryShortName (path): η σύντομη ονομασία του αποθετηρίου

repositoryField (path): το πεδίο μεταδεδομένων του αποθετηρίου

Keyword (query) : ο όρος αναζήτησης

GET /rest-api/vocabularies/{vocabularyShortName}/vocabulary-entries

Περιγραφή Επιστρέφει το αποτέλεσμα αναζήτησης όρων συγκεκριμένου λεξιλογίου βάσει όρου αναζήτησης στο γνώρισμα προτεινόμενης ονομασίας.

Response Content Type:

Application/xml

Επιστρέφει: Array Of VocabularyEntryLightRestDTO

Παράμετροι: vocabularyShortName (path): η σύντομη ονομασία του λεξιλογίου

Page 51: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

prefLabel (query) : ο όρος αναζήτησης

GET /rest-api/vocabularies/{vocabularyShortName}/vocabulary-entries/tree

Περιγραφή Επιστρέφει όλους του όρους ενός λεξιλογίου ως δέντρο.

Response Content Type:

Application/xml

Επιστρέφει: VocabularyEntryTreeNodeList

Παράμετροι: vocabularyShortName (path): η σύντομη ονομασία του λεξιλογίου

Υπηρεσίες για μαζικό σημασιολογικό εμπλουτισμό (αποθετηρίων/συσσωρευτών)

GET /rest-api/repositories/{shortName}/fields/{field}/mapping

Περιγραφή Επιστρέφει το σύνολο των αντιστοιχήσεων που ορίστηκαν για το συγκεκριμένο αποθετήριο και το συγκεκριμένο πεδίο μεταδεδομένων (για σημασιολογικό εμπλουτισμό).

Response Content Type:

Application/xml

Επιστρέφει: RepositoryFieldMappingLightRestDTO { repositoryFieldRangeCategory (String), browseByFieldValueLanguage (String), repositoryShortName (String), field (String), filterField (String), containingFilterTerm (Boolean), allMappedEntries (List[Entry«String, «String»]), // entry URI // entry XML representation map (List[Entry«String, List«RepositoryFieldMappingValueResourceDTO»]) // field // value RepositoryFieldMappingValueResourceDTO vocEntryToVocEntriesReverseMapping (List[Entry«String, List«String»]) // rules vocURI List of vocURIs }

Παράμετροι: repositoryShortName (path): η σύντομη ονομασία του αποθετηρίου

repositoryField (path): το πεδίο μεταδεδομένων του αποθετηρίου

GET /rest-api/repository-controlled-enrichment-request

Περιγραφή Επιστρέφει ένα αντικείμενο με όρους λεξιλογίων που αποτελούν τον εμπλουτισμό που αντιστοιχεί σε ένα αίτημα. Το αίτημα αντιστοιχεί σε μία μια εγγραφή μεταδεδομένων (τεκμήριο) και

Page 52: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

ορίζει αποθετήριο, πεδίο, λίστα τιμών πρωτεύοντος πεδίου και λίστα τιμών δευτερεύοντος πεδίου.

Response Content Type:

Application/xml

Επιστρέφει: RepositoryFieldMappingLightRestDTO { vocabularyEntries (Set VocabularyEntryDTO) }

Παράμετροι: RepositoryControlledEnrichmentRequestDTO { repositoryShortName (String), field (String), fieldValues ( Set «String» ), secondaryFieldValues (Set «String») }

GET /rest-api/repositoryFieldMappings/{repositoryFieldMappingId}/filters

Περιγραφή Αναζητά φίλτρα διαθέσιμα για μία συγκεκριμένη τιμή πεδίου μεταδεδομένων για ένα συγκεκριμένο σύνολο αντιστοιχήσεων (δηλαδή για συγκεκριμένο αποθετήριο και πεδίο). Η αναζήτηση γίνεται βάσει όρου αναζήτησης (προαιρετικά). Η συγκεκριμένη υπηρεσία χρησιμοποιώντας από το front-end του semantics.gr στα πλαίσια Ajax κλίσης.

Response Content Type:

Application/xml

Επιστρέφει: Array of String

Παράμετροι: repositoryFieldMappingId (path): το id του συνόλου αντιστοιχήσεων

mapKey : Τιμή πρωτεύοντος πεδίου μεταδεδομένων

queryTerm (query): όρος αναζήτησης φίλτρων

Page 53: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

7 Αρχιτεκτονική Το Σύστημα Σημασιολογικών Λεξιλογίων είναι μία Java εφαρμογή ιστού πακεταρισμένη ως war αρχείο και μπορεί να εγκατασταθεί σε οποιονδήποτε Servlet container, όπως ο Apache Tomcat. Ταυτόχρονα είναι ένα Maven project αποτελούμενο από τα εξής 3 modules: authorities-persistence authorities-service και authorities -web.

Το persistence layer παρέχει τις βασικές CRUD μεθόδους καθώς και μεθόδους αναζήτησης για τις οντότητες πεδίου που αποθηκεύονται μόνιμα σε βάσεις. Το Σύστημα Συσσωρευτή χρησιμοποιεί άμεσα δύο βάσεις δεδομένων και ένα σύστημα ευρετηριοποίησης:

1. Μία σχεσιακή βάση (PostgreSQL) για την αποθήκευση πληροφορίας σχετικά με σχήματα, παραμετρικά γνωρίσματα, σημασιολογικές κλάσεις, λεξιλόγια, εξωτερικά λεξιλόγια, φορείς, αποθετήρια, αντιστοιχήσεις πεδίων μεταδεδομένων σε όρους λεξιλογίων και χρήστες.

2. Μία noSQL Mongo DB βάση για την αποθήκευση όρων λεξιλογίων. 3. Ένα σύστημα ευρετηρίασης Apache Solr, για την ευρετηρίαση των όρων λεξιλογίων.

Στην Εικόνα 54 παρουσιάζεται σε αφαιρετικό επίπεδο η αρχιτεκτονική του Semantics.gr και η σύνδεσή του με εξωτερικά συστήματα.

Εικόνα 54. Αρχιτεκτονική του Semantics.gr και η διασύνδεσή του με αποθετήρια και συσσωρευτές

Page 54: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

Στο persistent layer, για όλες τις βάσεις δεδομένων που χρησιμοποιούνται, ορίζονται οι οντότητες πεδίου ως Java POJOs οι οποίες αντιστοιχίζονται με τις αντίστοιχες δομές (PostgreSQL πίνακες ή Mongo DB collections) μέσω ειδικών προγραμματιστικών προτύπων/βιβλιοθηκών (π.χ. JPA). Για κάθε βασική οντότητα πεδίου ορίζεται από ένα αντικείμενο με CRUD μεθόδους και μεθόδους αναζήτησης, σύμφωνα με το σχεδιαστικό πρότυπο DAO [37] όπως υποστηρίζεται από τις προγραμματιστικές βιβλιοθήκες Spring Data JPA, Spring Data Mongo και Spring Data Solr.

Εικόνα 55. Διάγραμμα Κλάσεων οντοτήτων πεδίου

Το service layer παρέχει μία σειρά από υπηρεσίες (services) στο επόμενο layer (authorities-web module) οι οποίες υλοποιούν όλες τις business διαδικασίες του Συστήματος Λεξιλογίου. Για να επιτευχθεί η αποδέσμευση του επόμενου layer από το persistent layer, άρα και από τις οντότητες πεδίου που αυτό ορίζει, δημιουργήθηκαν Data Access Services για κάθε αντικείμενο DAO και υιοθετήθηκε αυστηρά το DTO προγραμματιστικό υπόδειγμα: δημιουργήθηκαν δηλαδή νέες οντότητες πεδίου στο Service Layer, τα DTOs. Τα services χρησιμοποιούν ως είσοδο ή/και επιστρέφουν αποκλειστικά DTO αντικείμενα.

Page 55: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

Εικόνα 56. Διάγραμμα Οντοτήτων-Συσχετίσεων για την σχεσιακή βάση του συστήματος.

Τέλος το web layer υλοποιεί την γραφική διεπαφή ιστού. Αποτελείται από τον δημόσια διαδικτυακή πύλη (Portal) μέσω της οποίας οι πολίτες αποκτούν ανοικτή πρόσβαση (μέσω μηχανής αναζήτησης αλλά και ως Linked Data) στα λεξιλόγια, ένα διαχειριστικό περιβάλλον (Management GUI) που επιτρέπει σε έναν εξουσιοδοτημένο χρήστη να δημιουργεί σημασιολογικές κλάσεις, φορείς, λεξιλόγια για λογαριασμό φορέων, να «εκρίνει» λεξιλόγια, να διαχειρίζεται χρήστες, εξωτερικά λεξιλόγια και αποθετήρια και, τέλος, ένα περιβάλλον για τους φορείς που τους επιτρέπει να δημιουργούν και να επεξεργάζονται τα λεξιλόγιά τους.

Page 56: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

Όλα τα module χρησιμοποιούν το Spring framework για Dependency Injection και για την διαχείριση των διεπαφών (interfaces) και των κλάσεων που τις υλοποιούν. Για την ανάπτυξη της εφαρμογής ιστού και της RESTful υπηρεσίας χρησιμοποιήθηκε το Spring MVC framework.

Το διάγραμμα κλάσεων των οντοτήτων πεδίου που αποθηκεύει η εφαρμογή παρουσιάζεται στην Εικόνα 55. Οι οντότητες πεδίου Institution (Φορέας), User (Χρήστης), Vocabulary (Λεξιλόγιο), ExtrenalVocabulary (Εξωτερικό λεξιλόγιο), SchemaNamespace (Σχήμα), OwlProperty (Owl Γνώρισμα) και οι εξειδικεύσεις OwlDatatypeProperty και OwlObjectProperty, OwlClass (Owl Κλάση), Repository (Αποθετήριο), RepositoryField (Πεδίο μεταδεδομένων αποθετηρίου), RepositoryFieldMapping (Αντιστοιχήσεις πεδίου μεταδεδομένων αποθετηρίου) and RepositoryFieldMappingValue (τιμή αντιστοίχησης πεδίου αποθετηρίου) αποθηκεύονται σε Σχεσιακή Βάση Δεδομένων και ως εκ τούτου θα αντιστοιχίζονται σε πίνακες. Το E/R διάγραμμα παρουσιάζεται στην Εικόνα 56.

Η οντότητα πεδίου VocabularyEntry είναι αφαιρετική (abstract) γενίκευση (δεν θα έχει απευθείας υλοποιήσεις) και εξειδικεύεται στις AgentVocabularyEntry, PlaceVocabularyEntry, TimespanVocabularyEntry και ConceprVocabularyEntry που μοντελοποιούν όρους λεξιλογίου ανά σημασιολογική κατηγορία. Οι οντότητες αυτές αποθηκεύεται σε NoSQL βάση (σε Mongo DB).

Οι noSQL βάσεις δεδομένων προσανατολίζονται στην αποθήκευση (πιθανώς ιεραρχικών) εγγράφων σε σύνολα (collections), αντί για πλειάδες σε πίνακες. Τα συστήματα αυτά :

• θυσιάζουν μια σειρά από υπηρεσίες που παρέχουν τα σχεσιακά συστήματα (όπως η διαχείριση συναλλαγών ή αποδοτική υποστήριξη μιας εκφραστικής γλώσσας επερωτήσεων) προσφέροντας όμως ανταγωνιστικές αποδόσεις σε συγκεκριμένου τύπου επερωτήσεις σε πολύ μεγάλο όγκο δεδομένων.

• δεν προαπαιτούν τον ορισμό αυστηρού σχήματος για τα έγγραφα, παρέχοντας έτσι μεγαλύτερη ευελιξία (αν και προτρέπουν την ομαδοποίηση των εγγράφων σε σύνολα ανάλογα με την δομική και σημασιολογική τους συνάφεια)

• λόγω του ότι αποθηκεύουν έγγραφα τα οποία έχουν ιεραρχική δομή επιτρέπουν την ευέλικτη «από-κανονικοποιημένη» μοντελοποίηση δεδομένων σε σύνολα χωρίς να προκύπτει ο πλεονασμός που θα προέκυπτε στο σχεσιακό μοντέλο. Για παράδειγμα δύο οντότητες με μία εξαρτημένη ένα-προς-πολλά σχέση μεταξύ τους θα μοντελοποιούνταν σε δύο πίνακες στο σχεσιακό μοντέλο, κάλλιστα όμως θα μπορούσαν να μοντελοποιηθούν σε ένα σύνολο στην Mongo DB χωρίς να προκύπτει πλεονασμός, με χρήση «ενσωματωμένων» (embedded) συνόλων.

Οι οντότητες AgentVocabularyEntry, PlaceVocabularyEntry, TimespanVocabularyEntry και ConceprVocabularyEntry είναι ιδανικές για NoSQL βάση κυρίως λόγω των ευέλικτων παραμετρικών πεδίων (τα οποία μπορεί να είναι και πολλαπλά). Σε σχεσιακή βάση, λόγω επίπεδης μοντελοποίησης και περιορισμών κανονικοποίησης, κάθε τιμή πεδίου θα έπρεπε να αποθηκευτεί σε διαφορετική εγγραφή γεγονός που θα έκανε ακριβή την πλήρη ανάκτηση ενός όρου (πολλαπλά joins), χωρίς να βελτιώνεται η αποδοτικότητα ευρετηρίασης, αφού αυτή θα γίνεται από εξωτερικό σύστημα ευρετηρίασης (όπως το Apache Solr).

Page 57: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

8 Μελέτη Περίπτωσης: Εμπλουτισμός του SearchCulture.gr

Ο συσσωρευτής πολιτιστικού περιεχομένου του ΕΚΤ SearchCulture.gr παρέχει την δυνατότητα ελεγχόμενου σημασιολογικού εμπλουτισμού πεδίων μεταδεδομένων των αποθετηρίων που φιλοξενεί με αναφορές σε λεξιλόγια όρων που δημιουργήθηκαν και διατίθενται στο Σύστημα Σημασιολογικών Λεξιλογίων του ΕΚΤ Semantic.gr. Ο εμπλουτισμός γίνεται ανά αποθετήριο για συγκεκριμένα πεδία και προϋποθέτει τον ορισμό κανόνων αντιστοίχισης στο εργαλείο σημασιολογικού εμπλουτισμού του Semantics.gr. Μόλις ολοκληρωθούν οι αντιστοιχίσεις απαιτείται η επανεισαγωγή των μεταδεδομένων του αποθετηρίου στο SearchCulture.gr προκειμένου να πραγματοποιηθεί μαζικά ο εμπλουτισμός βάσει των κανόνων αντιστοίχισης που ορίστηκαν (και που διατίθενται σε JSON μορφή από το REST API του Semantics.gr).

Το EKT δημιούργησε ένα πρότυπο ιεραρχικό και δίγλωσσο (ελληνικά-αγγλικά) Λεξιλόγιο Τύπων Ψηφιακού Περιεχομένου αποτελούμενο από 392 όρους το οποίο διατίθεται ανοικτά μέσα από το Semantics.gr στην διεύθυνση http://semantics.gr/authorities/vocabularies/ekt-item-types/vocabulary-entries/tree. Στην συνέχεια δημιουργήθηκαν εγγραφές αποθετηρίων στο Semantcics.gr που αντιστοιχούν στα αποθετήρια/συλλογές που καταχωρήθηκαν στο Σύστημα Διαχείρισης Φορέων/ Αποθετηρίων του SearchCulture.gr.

Για τον ορισμό κανόνων αντιστοίχισης, θα πρέπει o εξουσιοδοτημένος χρήστης να εγγράψει κάθε αποθετήριο στο Semantic.gr με την ίδια σύντομη ονομασία που έχει το αποθετήριο στο SearchCulture.gr (Ενότητα 3.6). Για κάθε αποθετήριο, ο διαχειριστής του Semantics.gr θα πρέπει να ορίσει το πεδίο μεταδεδομένων dc:type και να το συσχετίσει με Λεξιλόγιο Τύπων Ψηφιακού Περιεχομένου. Εναλλακτικά, μέσα από το διαχειριστικό περιβάλλον του SearchCulture.gr, στην καρτέλα διαχείρισης περιεχομένου αποθετηρίου υπάρχει σύνδεσμος με το πάτημα του οποίου το αποθετήριο εγγράφεται αυτόματα στο Σύστημα Λεξιλογίων Semantics.gr (μέσω REST POST κλίσης).

Για καθένα από αυτά τα αποθετήρια και συγκεκριμένα για το πεδίο dc:type ορίστηκαν κανόνες αντιστοίχισης προς όρους του Λεξιλογίου Τύπων του ΕΚΤ. Πολλά αποθετήρια υιοθέτησαν επαρκή τεκμηρίωση στο πεδίο dc:type και επομένως η αντιστοίχηση σε όρους του λεξιλογίου πραγματοποιήθηκε εύκολα, χάρις στην λειτουργία αυτόματων προτάσεων αντιστοίχησης του εργαλείου (κατηγορία A, ενότητα 5.2). Κάποια αποθετήρια παρείχαν πολύ λεπτομερή και εξειδικευμένη τεκμηρίωση του πεδίου dc:type, οπότε οι αντιστοιχίσεις έγιναν σε γενικότερους όρους του Λεξιλογίου Τύπων του ΕΚΤ (κατηγορία B, ενότητα 5.3). Για τα αποθετήρια αυτά, αρχικά, οι αντιστοιχήσεις στους γενικότερους όρους του λεξιλογίου έγιναν χειροκίνητα. Ωστόσο, ο μηχανισμός αυτό-εκμάθησης βοήθησε ώστε σταδιακά το εργαλείο σημασιολογικού εμπλουτισμού να αναγνωρίζει τους ειδικότερους όρους από προηγούμενες αντιστοιχίσεις και έτσι να τους αντιστοιχίζει αυτόματα στους σωστούς όρους λεξιλογίου. Πολλά αποθετήρια χαρακτηρίζονται από φτωχή τεκμηρίωση του πεδίου dc:type και για τον λόγο αυτό χρησιμοποιήθηκε ως δευτερεύων πεδίο αντιστοίχισης το πεδίο

Page 58: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

dc:subject για την δημιουργία φίλτρων (κατηγορία C, ενότητα 5.4). Το αποτέλεσμα πολλές φορές ήταν εντυπωσιακό, όπως φαίνεται από το πραγματικό παράδειγμα που παρουσιάζεται στην Εικόνα 57. Τέλος, κάποια αποθετήρια χαρακτηρίζονται από ανεπαρκή τεκμηρίωση του πεδίου dc:type χωρίς να έχουν κάποιο πεδίο που θα μπορούσε να χρησιμοποιηθεί ως έχει για φίλτρα. Στα αποθετήρια αυτά χρησιμοποιήθηκε ως δευτερεύων πεδίο το dc:title (κατηγορία D, ενότητα 5.5). Το εργαλείο σημασιολογικού εμπλουτισμού αναζήτησε συγκεκριμένες λέξεις (prefLabel και altLabel των όρων του λεξιλογίου τύπων του ΕΚΤ καθώς και όρους από παλαιότερες αντιστοιχήσεις που αποθηκεύτηκαν ως λέξεις-κλειδιά) μέσα στις τιμές του πεδίου dc:title και χρησιμοποίησε τις λέξεις που βρέθηκαν ως φίλτρα. Ο Πίνακας V συγκεντρώνει για κάθε μία κατηγορία τεκμηρίωσης τον αριθμό των αποθετηρίων/συλλογών του SearchCulture.gr και τον συνολικό αριθμό τεκμηρίων που εμπλουτίστηκαν.

Κατηγορία τεκμηρίωσης – στρατηγική εμπλουτισμού

αριθμός αποθετηρίων /

συλλογών αριθμός τεκμηρίων

A: Επαρκής τεκμηρίωση του πεδίου dc:type 20 30764

B: Λεπτομερής τεκμηρίωση του πεδίου dc:type 5 11102

C:

Ανεπαρκής τεκμηρίωσης του πεδίου dc:type– συνυπολογισμός του πεδίου dc:subject ως δευτερεύων πεδίο για φίλτρα 24 60181

D:

Ανεπαρκής τεκμηρίωσης του πεδίου dc:type– συνυπολογισμός τους dc:title για αναζήτηση συγκεκριμένων λέξεων για φίλτρα 4 55912

Σύνολο 53 157959

Πίνακας V. Αριθμός συλλογών/αποθετηρίων και τεκμηρίων ανά κατηγορία τεκμηρίωσης

Αφού ολοκληρώθηκαν οι αντιστοιχίσεις για ένα αποθετήριο, ο εξουσιοδοτημένος χρήστης του διαχειριστικού περιβάλλοντος του SearchCulture.gr επανεισήγαγε το περιεχόμενο του αποθετηρίου (χωρίς να απαιτηθεί η επανάληψη της συγκομιδής αφού μπορούν να χρησιμοποιηθούν τα μεταδεδομένα της τελευταίας συγκομιδής από το σύστημα Harvester [13]). Κατά την διάρκεια της εισαγωγής, ο συσσωρευτής SearchCulture.gr για κάθε εγγραφή συμβουλεύεται τους κανόνες αντιστοίχισης που ορίστηκαν στο Semantics.gr και εμπλουτίζει την εγγραφή με νέες σημασιολογικές αναφορές. Τονίζεται ότι οι νέες τιμές-αναφορές αποθηκεύονται σε ξεχωριστή δομή (edm:EuropeanaProxy) από την δομή που συγκεντρώνει τα πρωτότυπα μεταδεδομένα του αποθετηρίου (edm:ProvidedCHO) ενώ το νέο πεδίο dc:type ονομάστηκε «ΕΚΤ Τύπος τεκμηρίου». Έτσι, η πρωτότυπη τεκμηρίωση των φορέων δεν μεταβάλλεται από την διαδικασία εμπλουτισμού γεγονός πολύ σημαντικό ιδιαίτερα για τις περιπτώσεις φορέων της κατηγορίας B που έκαναν πολύ αναλυτική και λεπτομερή τεκμηρίωση (λεπτομέρεια όμως που βοηθά μεν στην αναζήτηση αλλά δεν βοηθά στην ομοιόμορφη πλοήγηση ενός χρήστη στο περιεχόμενο ενός συσσωρευτή). Οι εμπλουτισμένοι

Page 59: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

τύποι διαχωρίζονται σαφώς και με διακριτό τρόπο στην διαδικτυακή πύλη του SearchCulture.gr. Εξάλλου, οι πρωτότυποι τύποι είναι αναζητήσιμοι (ευρετηριάζονται όπως όλα τα πεδία κανονικά) και εξακολουθούν να εμφανίζονται τόσο στην καρτέλα τεκμηρίου όσο και στα φίλτρα αναζήτησης.

Εικόνα 57. Πραγματικό παράδειγμα εμπλουτισμού αποθετηρίου του SearchCulture.gr.

Με το σημασιολογικό εμπλουτισμό, το SearchCulture.gr βελτιώθηκε ως προς την ευρεσιμότητα, την πολυγλωσσικότητα, τις δυνατότητες περιήγησης και την παρουσίαση του περιεχομένου. Συγκεκριμένα :

• Αυξήθηκε η ευρεσιμότητα του περιεχομένου αφού ο χρήστης μπορεί να ανακαλύψει περιεχόμενο εξερευνώντας μέσα από ένα ομοιόμορφο και συμπαγές σύνολο τύπων ακόμα και αν δεν γνωρίζει ακριβώς τι ψάχνει. Δημιουργήθηκε δίγλωσσο διαδραστικό νέφος δημοφιλών ομογενοποιημένων ΕΚΤ τύπων τεκμηρίων, σελίδα ιεραρχικής περιήγησης στο περιεχόμενο μέσα από όλους τους ΕΚΤ τύπους τεκμηρίων ενώ στη σελίδα παρουσίασης των φορέων και των συλλογών/αποθετηρίων τους, για κάθε συλλογή/αποθετήριο παρατίθενται οι ΕΚΤ τύποι τεκμηρίων για πιο στοχευμένη πλοήγηση (Εικόνα 58)

• Δίνεται η δυνατότητα σε αγγλόφωνο κοινό να ανακαλύψει τεκμήρια βάσει του τύπου τους ακόμα και αν τα μεταδεδομένα τους πρωτοτύπως δεν περιείχαν καθόλου πολυγλωσσική πληροφορία.

Page 60: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

• Συλλογές που είναι σημασιολογικά εμπλουτισμένες ομογενοποιούνται με στόχο την ποιοτικότερη πολυγλωσσική ενιαία αναζήτηση και εξερεύνηση.

• Συλλογές που δεν περιλαμβάνουν καθόλου σημασιολογικές αναφορές μπορούν πλέον να εμπλουτιστούν και να αναδειχθούν μέσα από το SearchCulture.gr ως Διασυνδεδεμένα Δεδομένα.

Εικόνα 58. Νέες δυνατότητες αναζήτησης και περιήγησης περιεχομένου στο SearchCulture.gr

Στην Εικόνα 59 παρουσιάζεται ένα διάγραμμα στο οποίο συγκρίνεται η αποτελεσματικότητα της αναζήτησης 8 αντιπροσωπευτικών τύπων πριν και μετά τον σημασιολογικό εμπλουτισμό / ομογενοποίηση. Ανάλογα είναι τα αποτελέσματα και για τους υπόλοιπους τύπους τεκμηρίων στους οποίους ταξινομήθηκε το περιεχόμενο.

Στην αγγλική έκδοση, ο χρήστης μπορεί να επιλέξει/αναζητήσει τους ίδιους τύπους στα αγγλικά. Στην Εικόνα 60 παρουσιάζεται το αντίστοιχο διάγραμμα στο οποίο συγκρίνεται η αποτελεσματικότητα της αναζήτησης των ίδιων 8 τύπων αυτή τη φορά στα αγγλικά πριν και μετά τον σημασιολογικό εμπλουτισμό / ομογενοποίηση. Εδώ τα αποτελέσματα είναι ακόμα πιο εντυπωσιακά.

Page 61: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

Εικόνα 59. Σημασιολογικός εμπλουτισμός: Βελτίωση ευρεσιμότητας

Εικόνα 60. Σημασιολογικός εμπλουτισμός: Βελτίωση πολυγλωσσικής ευρεσιμότητας

Page 62: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

Πίνακας Εικόνων Εικόνα 1. Αρχική σελίδα ........................................................................................................................... 7 Εικόνα 2. Αναζήτηση όρου - Βοηθητικό μενού αυτόματης συμπλήρωσης .............................................. 8 Εικόνα 3. Αναζήτηση όρου - Περιορισμός σε συγκεκριμένα λεξιλόγια .................................................... 8 Εικόνα 4. Αποτελέσματα αναζήτησης - Αναζήτηση και σε εξωτερικά λεξιλόγια/θησαυρούς ................. 9 Εικόνα 5. Σελίδα παρουσίασης όρου ..................................................................................................... 10 Εικόνα 6. Πλοήγηση στα λεξιλόγια ......................................................................................................... 11 Εικόνα 7. Σελίδα περιεχομένων λεξιλογίου (ιεραρχική προβολή) ......................................................... 11 Εικόνα 8. Σελίδα περιεχομένων λεξιλογίου (προβολή σελιδοποιημένης λίστας) .................................. 12 Εικόνα 9. Προβολή σημασιολογικής κλάσης .......................................................................................... 13 Εικόνα 10. Προβολή γνωρίσματος .......................................................................................................... 13 Εικόνα 11. Προβολή Στοιχείων Φορέα ................................................................................................... 14 Εικόνα 12. Σελίδα σύνδεσης ................................................................................................................... 15 Εικόνα 13. Το μενού του διαχειριστή ..................................................................................................... 15 Εικόνα 14. Σελίδα διαχείρισης σχημάτων (namespaces) ....................................................................... 16 Εικόνα 15. Σελίδα επεξεργασίας / δημιουργίας σχήματος (namespace) ............................................... 17 Εικόνα 16. Σελίδα διαχείρισης παραμετρικών γνωρισμάτων ................................................................ 17 Εικόνα 17. Σελίδα επεξεργασίας γνωρίσματος (που δεν υποστηρίζει αναφορές) ................................ 18 Εικόνα 18. Σελίδα επεξεργασίας γνωρίσματος (που υποστηρίζει αναφορές) ....................................... 19 Εικόνα 19. Σελίδα διαχείρισης σημασιολογικών κλάσεων .................................................................... 19 Εικόνα 20. Σελίδα επεξεργασίας/δημιουργίας σημασιολογικής κλάσης ............................................... 20 Εικόνα 21. Σελίδα επεξεργασίας/δημιουργίας σημασιολογικής κλάσης - Επιλογή γνωρισμάτων ........ 21 Εικόνα 22. Σελίδα διαχείρισης φορέων.................................................................................................. 22 Εικόνα 23. Σελίδα διαχείρισης φορέων - Αναζήτηση βάσει λεξιλογίου ................................................. 23 Εικόνα 24. Σελίδα επεξεργασίας/δημιουργίας φορέα ........................................................................... 23 Εικόνα 25. Σελίδα διαχείρισης χρηστών................................................................................................. 24 Εικόνα 26. Σελίδα επεξεργασίας/δημιουργίας χρήστη - Χρήστης με ρόλο αντιπροσώπου φορέα ....... 25 Εικόνα 27. Σελίδα διαχείρισης λεξιλογίων ............................................................................................. 26 Εικόνα 28. Σελίδα επεξεργασίας/δημιουργίας λεξιλογίου από διαχειριστή για λογαριασμό φορέα .. 27 Εικόνα 29. Χαρακτηρισμός λεξιλογίου ως «Ιεραρχικό» ......................................................................... 28 Εικόνα 30. Σελίδα εγγραφής και παραμετροποίησης εξωτερικών λεξιλογίων ...................................... 28 Εικόνα 31. Σελίδα επεξεργασίας/δημιουργίας εγγραφής παραμετροποίησης εξωτερικού λεξιλογίου 29 Εικόνα 32. Σελίδα διαχείρισης αποθετηρίων ......................................................................................... 30 Εικόνα 33. Σελίδα προβολής αποθετηρίου ............................................................................................ 31 Εικόνα 34. Σελίδα επεξεργασίας/δημιουργίας αποθετηρίου - Παραμετροποίηση πεδίων .................. 32 Εικόνα 35. Μενού επιλογών αντιπροσώπου φορέα .............................................................................. 33 Εικόνα 36. Σελίδα 'Τα λεξιλόγια μου' ..................................................................................................... 33 Εικόνα 37. Σελίδα περιεχομένου λεξιλογίου .......................................................................................... 34 Εικόνα 38. Σελίδα δημιουργίας όρου σε λεξιλόγιο ................................................................................ 35 Εικόνα 39. Συσχέτιση με άλλον όρο (παράθυρο επιλογής) ................................................................... 36 Εικόνα 40. Συσχέτιση με εξωτερικό όρο με απευθείας εισαγωγή ετικέτας και URI .............................. 36 Εικόνα 41. Φόρμα ορισμού αντιστοιχίσεων πεδίου αποθετηρίου – εισαγωγή βασικών στοιχείων ..... 39 Εικόνα 42. Η φόρμα αντιστοιχίσεων πεδίου αποθετηρίου αμέσως μετά την συγκομιδή τιμών ........... 41 Εικόνα 43. Η φόρμα αντιστοιχίσεων πεδίου αποθετηρίου αμέσως μετά την αυτόματη αντιστοίχηση 41 Εικόνα 44. O επιμελητής ορίζει την κατάσταση μιας αντιστοίχισης ως τελική. ..................................... 42 Εικόνα 45. Χειροκίνητη αντιστοίχιση με όρο λεξιλογίου ........................................................................ 43 Εικόνα 46. Δημιουργία λέξεων-κλειδιών από αντιστοιχίσεις ................................................................ 43 Εικόνα 47. Φόρμα δημιουργία λέξεων-κλειδιών από προηγούμενες αντιστοιχίσεις ............................ 44

Page 63: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

Εικόνα 48. Λέξεις-κλειδία σε όρο λεξιλογίου ......................................................................................... 45 Εικόνα 49. Το πεδίο dc:subject ορίζεται ως δευτερεύον πεδίο. ............................................................ 46 Εικόνα 50. Προσθήκη φίλτρων ............................................................................................................... 47 Εικόνα 51. Η φόρμα αντιστοίχισης μιας συλλογής κατηγορίας C (πρωτεύον πεδίο dc:type, δευτερεύον πεδίο: dc:subject) ................................................................................................................................... 47 Εικόνα 52. Αναζήτηση συγκεκριμένων λέξεων ως φίλτρα σε περιγραφικά πεδία ................................ 48 Εικόνα 53. Αντιστοιχήσεις με δευτερεύων περιγραφικό πεδίο (dc:title)............................................... 49 Εικόνα 54. Αρχιτεκτονική του Semantics.gr και η διασύνδεσή του με αποθετήρια και συσσωρευτές . 53 Εικόνα 55. Διάγραμμα Κλάσεων οντοτήτων πεδίου .............................................................................. 54 Εικόνα 56. Διάγραμμα Οντοτήτων-Συσχετίσεων για την σχεσιακή βάση του συστήματος. .................. 55 Εικόνα 57. Πραγματικό παράδειγμα εμπλουτισμού αποθετηρίου του SearchCulture.gr. .................... 59 Εικόνα 58. Νέες δυνατότητες αναζήτησης και περιήγησης περιεχομένου στο SearchCulture.gr ......... 60 Εικόνα 59. Σημασιολογικός εμπλουτισμός: Βελτίωση ευρεσιμότητας .................................................. 61 Εικόνα 60. Σημασιολογικός εμπλουτισμός: Βελτίωση πολυγλωσσικής ευρεσιμότητας ........................ 61

Page 64: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,

Αναφορές [1] Παναγιώτης Σταθόπουλος, Νίκος Χούσος, και Γεώργιος Σταύρου, “Προδιαγραφές και

χαρακτηριστικά διαλειτουργικότητας για ανοικτό ψηφιακό περιεχόμενο”, Αθήνα, EKT(2013): http://helios-eie.ekt.gr/EIE/handle/10442/8887

[2] Γεωργία Αγγελάκη “Ανοικτά και Διασυνδεδεμένα Πολιτιστικά Δεδομένα” http://helios-eie.ekt.gr/EIE/handle/10442/14420

[3] Dublin Core Metadata Element Set http://dublincore.org/documents/dces/ [4] DC XML Schema adjusted for usage in the OAI-PMH:

http://www.openarchives.org/OAI/2.0/OAI DC.xsd [5] ESE Documentation: http://pro.europeana.eu/web/guest/ese-documentation [6] EDM Definition: http://pro.europeana.eu/documents/900548/4b190b0f-9adc-4a65-

bc09-3a9b16e45827 [7] RDF και RDFS (http://www.w3.org/2000/01/rdf-schema#/) [8] (SKOS) namespace (http://www.w3.org/2004/02/skos/core# ) [9] EDM Primer: http://pro.europeana.eu/documents/900548/770bdb58-c60e-4beb-

a687-874639312ba5 [10] Expressing Dublin Core Description Sets using XML (DC-DS-XML), available at

http://dublincore.org/documents/dc-ds-xml/ , date issued: 2008-09-01 [11] Expressing Dublin Core metadata using the Resource Description Framework (RDF),

available at http://dublincore.org/documents/dc-rdf/, date issued: 2008-01-14. [12] Chris Bizer, Richard Cyganiak, Tom Health: How to Publish Linked Data on the Web

http://wifo5-03.informatik.uni-mannheim.de/bizer/pub/LinkedDataTutorial/ [13] Χάρης Γεωργιάδης “SearchCulture.gr: Μία Πρότυπη Πλατφόρμα Συσσώρευσης &

Αναζήτησης Πολιτιστικού Περιεχομένου, Παρουσίαση – Αρχιτεκτονική”. Αθήνα, Αθήνα, EKT(2016): http://helios-eie.ekt.gr/EIE/handle/10442/15324

Δημοσιεύσεις

Haris Georgiadis, Agathi Papanoti, Maria Paschou, Alexandra Roubani, Dimitra Pelekanou, Despoina Chardouveli, Evi Sachini: Semantics.gr: A self-improving service to repositories and aggregators for massively enriching their content, MTSR 2016: DHC Workshop (to be published in DHC 2016 Workshop proceedings)

Page 65: Εθνικό Κέντρο Τεκμηρίωσης | ΕΙΕhelios-eie.ekt.gr/EIE/bitstream/10442/15446/1/Σύστημα Λεξιλογίων... · (περιγραφή, τεκμηρίωση,