Presentazione Laurea Picariello Vincenzo Matr. 450334
-
Upload
vincenzo-picariello -
Category
Technology
-
view
1.954 -
download
2
description
Transcript of Presentazione Laurea Picariello Vincenzo Matr. 450334
![Page 1: Presentazione Laurea Picariello Vincenzo Matr. 450334](https://reader035.fdocuments.net/reader035/viewer/2022070316/55615319d8b42aa20d8b507e/html5/thumbnails/1.jpg)
Servizio di popolamento automatico per una piattaforma semantica di
gestione di biblioteche elettroniche
Relatore: Chiar.mo Prof. Semeraro GiovanniCorelatore: Chiar.mo Dott. Iaquinta Leo
Laureando:
Picariello Vincenzo matr. 450334
1
![Page 2: Presentazione Laurea Picariello Vincenzo Matr. 450334](https://reader035.fdocuments.net/reader035/viewer/2022070316/55615319d8b42aa20d8b507e/html5/thumbnails/2.jpg)
Outline
Biblioteca digitale FEDORA(Flexible Extensible Digital
Object Repository Architecture) Popolamento automatico di un repository
2Outline
![Page 3: Presentazione Laurea Picariello Vincenzo Matr. 450334](https://reader035.fdocuments.net/reader035/viewer/2022070316/55615319d8b42aa20d8b507e/html5/thumbnails/3.jpg)
Biblioteca digitale Biblioteca digitale
è la biblioteca della società dell’informazione; si basa sulla connettività e su una disponibilità organizzata in rete
dell’informazione; è una realtà virtuale che produce servizi reali; richiede tecnologia per connettere risorse di molti; è un sistema informativo organizzato e integrato; è un servizio di accesso ai contenuti delle varie collezioni; ha per obiettivo l’accesso universale.
Biblioteca digitale 3
![Page 4: Presentazione Laurea Picariello Vincenzo Matr. 450334](https://reader035.fdocuments.net/reader035/viewer/2022070316/55615319d8b42aa20d8b507e/html5/thumbnails/4.jpg)
La biblioteca digitale può essere definita in termini di:
contenuti: le risorse, oggetti digitali veri e propri (ossia le sequenze di bit che li rappresentano) e i metadati associati ad essi, i quali includono i metadati descrittivi (Dublin Core);
servizi: consentono la fruibilità degli oggetti digitali da parte degli utenti, avvalendosi delle informazioni veicolate dai metadati;
utenti: tutti i soggetti che hanno accesso alla rete possono essere definiti “utilizzatori delle risorse digitali”;
tecnologie: che consentono la conservazione e l'archiviazione a lungo termine, la diffusione degli strumenti per il commercio elettronico, e la definizione di standard per la gestione digitale dei diritti (Digital Rights Management).
Biblioteca digitale 4
Biblioteca digitale
![Page 5: Presentazione Laurea Picariello Vincenzo Matr. 450334](https://reader035.fdocuments.net/reader035/viewer/2022070316/55615319d8b42aa20d8b507e/html5/thumbnails/5.jpg)
Metadati Metadati
La componente della biblioteca digitale in cui l’interoperabilità è influenzata nel modo più evidente e decisivo è quello dei metadati, ovvero di quelle informazioni, generalmente strutturate e scandite in campi, relative a documenti primari, che ne permettono una più efficiente organizzazione, gestione e recupero.
Dublin Core È un sistema di metadati costituito da un nucleo d’elementi essenziali ai
fini della descrizione di qualsiasi materiale digitale accessibile via rete informatica; si propone come uno standard di descrizione delle risorse in formato elettronico.
È stato concepito allo scopo di descrivere risorse informative generiche che potessero essere recuperate in una sola sessione di ricerca, trattando i documenti come oggetti forniti d’etichette (tag) che ne evidenziano determinate caratteristiche.
5Biblioteca digitale
![Page 6: Presentazione Laurea Picariello Vincenzo Matr. 450334](https://reader035.fdocuments.net/reader035/viewer/2022070316/55615319d8b42aa20d8b507e/html5/thumbnails/6.jpg)
Fedora Repository Fedora è un software open source della “University of Virginia Library and
Cornell University”.
Modello di oggetto digitale flessibile ed estensibile
Oggetto digitale (Digital Object D.O.) contenuti di tipo eterogeneo Behavior Definition e Behavior Mechanism Object
Caratteristiche principali: è open source; accetta dati in un qualsiasi tipo di formato digitale; utilizza per metadati lo standard DublinCore; gestione di relazioni tra oggetti; sfrutta l’inserimento e l’archiviazione dei metadati nello standard XML.
6Fedora
![Page 7: Presentazione Laurea Picariello Vincenzo Matr. 450334](https://reader035.fdocuments.net/reader035/viewer/2022070316/55615319d8b42aa20d8b507e/html5/thumbnails/7.jpg)
Fedora 7
Modello Digital Object
Identificatore Digital Object
Service view: metodi per disseminare contenuto
Internal view: metadati necessari a gestire l’oggetto
Content view: insieme di dati e metadati
identificativo unico e persistente dell’oggetto
elemento che associa un servizioesterno con lo scopo di fornire una vista estensibile dell’oggetto o del contenuto
è il componente dell’oggetto digitale che rappresenta il vero e proprio contenuto multimediale(immagine, testo, video)
è un file in formato FOXML(Fedora Object XML) che facilita la gestione dell’oggetto e in cui sono descritte tutte le proprietà dell’oggetto
![Page 8: Presentazione Laurea Picariello Vincenzo Matr. 450334](https://reader035.fdocuments.net/reader035/viewer/2022070316/55615319d8b42aa20d8b507e/html5/thumbnails/8.jpg)
Il FEDORA Object Model permette di asserire delle relazioni tra gli oggetti archiviati, in modo che un certo numero d’oggetti collegati tra loro possano andare a costituire gli items di una collezione, i componenti di un oggetto più grande oppure un insieme di risorse con un qualcosa in comune.
Relazioni tra DO RELS-EXT ("RELationShips-External")
Oggetti digitali identificati tramite URI (Uniform Resource Identifiers) ottenuta
concatenando il PID alla stringa "info:fedora/“ Il Fedora relationship ontology
rappresenta un insieme di relazioni; le relazioni possono essere ridefinite o estese; le relazioni sono dichiarate dalla prospettiva di un oggetto ad un altro
come il seguente pattern:
<subjectFedoraObject> <relationshipProperty> <targetFedoraObject>
Fedora 8
Fedora Relationship ontology
![Page 9: Presentazione Laurea Picariello Vincenzo Matr. 450334](https://reader035.fdocuments.net/reader035/viewer/2022070316/55615319d8b42aa20d8b507e/html5/thumbnails/9.jpg)
9
Movie Domain Internet Movie Database (http://www.imdb.com)
EachMovie Dataset 72.916 utenti 1.628 film Valutazione degli utenti scala 0 e 5
Informazioni principali: Titolo, Regista, Cast, Genere, Trama e Keywords.
Si sono definite le seguenti tipologie di DO: coll:FilmsCollection coll:ActorsCollection film:nomefilm act:nomeattore
Ingest
![Page 10: Presentazione Laurea Picariello Vincenzo Matr. 450334](https://reader035.fdocuments.net/reader035/viewer/2022070316/55615319d8b42aa20d8b507e/html5/thumbnails/10.jpg)
Automatic ingesting Ingesting di Digital Objects di tipo collezione (coll:nomecollezione)
Si è pensato di definire DO per le collezioni Films e Actors, al fine di creare oggetti concettualmente intesi come classe di oggetti, dove i singoli film e i singoli attori rappresentano istanze di queste due classi.
Sui singoli membri delle collezioni sono stati definiti i seguenti Datastream, oltre a quello indispensabile relativo al DublinCore:
MemberQuery MemberList ViewStylesheet
Ingest 10
![Page 11: Presentazione Laurea Picariello Vincenzo Matr. 450334](https://reader035.fdocuments.net/reader035/viewer/2022070316/55615319d8b42aa20d8b507e/html5/thumbnails/11.jpg)
Automatic ingesting Ingesting di Digital Objects di tipo non-collezione (film:nomefilm)Sui singoli membri della collezione FilmsCollection sono stati definiti i seguenti Datastream:
DC RELS-EXT Photo Rating Trailer Trama
Sono stati definiti due Disseminator per rendere fruibili l’immagine e il video associati al DO e dei meccanismi tali da legare essi alla particolare risorsa definita.
Ingesting di Digital Objects di tipo non-collezione (act:nomeattore)Sui singoli membri della collezione ActorsCollection sono stati definiti i seguenti Datastream:
DC Photo RELS-EXT
Ingest 11
![Page 12: Presentazione Laurea Picariello Vincenzo Matr. 450334](https://reader035.fdocuments.net/reader035/viewer/2022070316/55615319d8b42aa20d8b507e/html5/thumbnails/12.jpg)
RDF Il Resource Description Framework (RDF) è un framework per la
descrizione della conoscenza nel web. È lo strumento base per la codifica, lo scambio e il riutilizzo di metadati strutturati; è alla base del web semantico e permette la condivisione d’informazioni sul web.
L’RDF si basa su tre principi chiave: qualunque cosa può essere identificata da un URI; the least power: utilizzare il linguaggio meno espressivo per definire qualunque
cosa; qualunque cosa può dire qualunque cosa su qualunque cosa.
Il data model RDF è semplice, ed è basato su tre tipi di oggetti: Risorsa: qualunque cosa descritta da una espressione RDF viene detta risorsa; una risorsa
può essere una pagina Web o un elemento XML all’interno del documento sorgente; Proprietà: è un aspetto specifico, una caratteristica, un attributo, o una relazione utilizzata
per descrivere una risorsa; Espressione: una risorsa, con una proprietà distinta da un nome, e un valore della
proprietà per la specifica risorsa, costituisce un’espressione RDF.
Ingest 12
![Page 13: Presentazione Laurea Picariello Vincenzo Matr. 450334](https://reader035.fdocuments.net/reader035/viewer/2022070316/55615319d8b42aa20d8b507e/html5/thumbnails/13.jpg)
Relazioni RDF
Ingest 13
isMemberOf
isCostituentOf
isMemberOf
Graficamente, le relazioni tra Risorse, Proprietà e Espressioni vengono rappresentate mediante grafi etichettati orientati, in cui le Risorse vengono identificate come nodi (graficamente delle ellissi), le Proprietà come archi orientati etichettati, e i valori come rettangoli. Una rappresentazione grafica della descrizione RDF utilizzata nel nostro dominio è la seguente:
film:ToyStory
coll:FilmsCollection
act:TomHanks
act:TimAllen
act:DonRickles
coll:ActorsCollection
![Page 14: Presentazione Laurea Picariello Vincenzo Matr. 450334](https://reader035.fdocuments.net/reader035/viewer/2022070316/55615319d8b42aa20d8b507e/html5/thumbnails/14.jpg)
Grazie per l’attenzione…
14End