Web semantico: metadati e ontologie
Transcript of Web semantico: metadati e ontologie
1
Web semantico: metadati e ontologie
Prof. Monica Palmirani – CIRSFIDUniversità di Bologna, Facoltà di Giurisprudenza
Corso di Elementi di [email protected]
Uno sguardo al futuro: verso il web 2.0
Web 1.0Web 1.0
Web 2.0Web 2.0
Web technologyWeb technology
Semantic WebSemantic Web
HTML, organizzazione dei contenuti, presentazione per lo più statica
HTML, organizzazione dei contenuti, presentazione per lo più statica
Pagine dinamiche Applicazioni interattiveCodice eseguito via web direttamente nel browser
Pagine dinamiche Applicazioni interattiveCodice eseguito via web direttamente nel browser
Semantica del contenutoMetadatiMachine readableOntologie
Semantica del contenutoMetadatiMachine readableOntologie
Cooperazione di ideeSocial networkingCooperazione di contenutiSimultaneità di azioni• Wiki• Blog• YouTube
Cooperazione di ideeSocial networkingCooperazione di contenutiSimultaneità di azioni• Wiki• Blog• YouTube
2
Dal Web 1.0 al Web 3.0 passando per il semantic web
Semantic Web
“The Semantic Web is an extension of the current web in which information is given well-defined meaning, better enabling computers and people to work in cooperation.”
Tim Berners-Lee 2001
“The Semantic Web is what we will get if weperform the same globalization process toKnowledge Representation that the Web initiallydid to Hypertext”
Tim Berners-Lee, September 1998
3
What the Semantic Web can representTim Berners-Lee Date: September 1998
A Semantic Web is not Artificial IntelligenceA semantic Web will not require every application to useexpressions of arbitrary complexityA semantic Web will not require proof generation to be useful: proof validation will be enoughA semantic web is not an exact rerun of a previous failedexperimentKnowledge Representation goes Global
The Semantic Web is what we will get if we perform the same globalization process to Knowledge Representationthat the Web initially did to Hypertext. We remove the centralized concepts of absolute truth, total knowledge, and total provability, and see what we can do with limitedknowledge
Pila classica del Semantic Web Tim Berners-Lee
4
http://www.w3.org/DesignIssues/Semantic.html
Tim Berners-Lee Date: 1998/10/14
Interpretazione della pila del semantic web nell’Informatica Giuridica
Sartor G. 2008
5
Metadati
Abbiamo già visto URI e XML partiamo quindi dai metadati:
Informazioni aggiuntive di altri datiDati su dati
Metadati oggettivi vs. metadati soggettiviMetadati autoriali (fatti dall’autore) vs. metadati documentali (fatti dai vari editors)Metadati del testo vs. metadati di processo del documento (workflow, protocolli, sicurezza)In ambito giuridico queste divisioni creano problemi: fino a che punto inserire un metadato è un’interpretazione in senso giuridico del termine?Marcare un documento è sempre un’azione di interpretazione del documento, del testo, del contenuto
Trattazione dei metadati
Annotazioni: arricchimento del testo con parti aggiuntive posizionate in una porzione apposita del testo (es. Akoma Ntoso – blocco meta)Vocabolari: lista di termini, chiusa o apertaTassonomie: gerarchie di termini fra loro correlatiThesauri: tassonomie con relazioni semplici non solo gerarchiche (similitudini, vicinanza di concetti, polisemia, etc.)Ontologie: gerarchie di concetti dotate di relazioni complesse, di assiomi e proprietàFolksonomie: rete complessa di concetti fra loro correlati non solo da gerarchie e che consente di classificare il documento rispetto molti punti di vista
6
Altra visione
Vocabolari = termini + definizioniTassonomie = vocabolari + gerarchiaThesauri = tassonomie + relazioni sempliciOntologie = tassonomie+ assiomi+proprietàFolksonomie = taggatura dell’informazione libera da ogni tassonomia pre-costituita ma come integrazione di classificazioni multiple cooperative (classificazione dei video di Youtube, dei post nei blog)
Esempio di metadati giuridici inclusi nell’XML NIR come annotazione aggiuntiva
<DecretoLegislativo id="S2602414"><meta>
<descrittori><pubblicazione tipo="GU" num="082" norm="20060407"/><entratainvigore norm="20060422"/><redazione id="rd1" norm="20060511" nome="CIRSFID"
url="http://www.cirsfid.unibo.it"/><urn>urn:nir:stato:decreto.legislativo:2006-03-16;140</urn>
</descrittori><inquadramento>
<infodoc natura="decreto legislativo" normativa="si"funzione="regolativa" fonte="primario"/>
</inquadramento></meta>
Metadati di cui non si comprende la provenienza, il
soggetto e il predicato
7
Vocabolari
Vocabolario aperto:Lista liberaNon deve essere condivisaCoincide con i termini nel testoDifficoltà di ricerche
Vocabolario di termini controllati:Lista chiusaDeve essere condivisaSpesso non coincide con i termini presenti nel testoOmogeneità di ricerche
Tassonomie
Carl von Linné - svedese - 18th secolo definisce la moderna tavola di classificazione zoologica e botanicaMetodo classificatorio, gerarchico del dominio da modellare
8
Esempio di tassonomia dei metadati: Akoma notoso
Thesauri
Tassonomia arricchita di relazione fra i nodi gerarchiciBT/NT – broader term/narrower termUSE/UF - sinonimiRT – related termTT – top term - l’antenato del termineSN – scope note
Es. EURO-VOC, TESEO del Senato
9
RDF – un modello dati per rappresentare i metadati nel Web
RDF – Resource Description FrameworkDescrive le risorse nel web assegnando loro proprietà e valoriE’ un data-model – molto simile al modello ER ma non chiuso, la definizione delle relazioni è flessibile, così come delle proprietàE’ scritto in XML ed ha come namespace
rdf:
E’uno standard del W3C dal febbraio 2004
RDF - Elementi di base
Ogni risorsa è identificata tramite un URIRisorsa, proprietà, valoreOggetto, soggetto, predicatoAsserzione=(risorsa, proprietà, valore)Descrizione della risorsa: insieme di asserzioni
R1 R2 R3
R6R4
R7
R5
R8
P1 P2
P3 P4 P5
P6
P7
10
RDF-Schema
E’ una estensione dell’RDF che consente di definire vocabolari distribuiti machine-readableHa il concetto di subClassof e di subPropertyOf- implementa le classi e le gerarchie fra classiMa non ancora i concetti astratti
Esempio
Modifications
TimeModContest Mod
Mod-in-forceRepeal
1-1-1999Repeal
subClassOfsubClassOf
subClassOfsubClassOf
hasTimeproduce
hasTime
typetypedata level
ontology level
11
Esempio
language level
ontology level
Repeal
CassationAbrogation Revocation
Modifications
TimeModContest Mod
Mod-in-forceRepeal
subClassOfsubClassOf
subClassOfsubClassOf
hasTimeproduce
RDF: altro modo di esprimere i metadati, un esempio in MetaLex/CEN
<rdf:Statement><rdf:subject rdf:resource="Document.xml"/><rdf:predicate rdf:resource="lkif-legal-action:
Act_of_Publication"/><rdf:object rdf:resource="nir:pubblicazione"/>
</rdf:Statement>
12
RDF : modellazione della pubblicazione mediante un grafo
Ontologia informaticaIl termine ontologia deriva dalla filosofia dove però acquista significati diversi. Essa è una branca della filosofia metafisica che studia l’esistenza e l’essenza intrinseca delle cose e ne fornisce una classificazione"eon" + "logos“ = discorso sull'ente
In ambito informatico il termine ontologia viene usato per definire una metodologia per rappresentare la conoscenza di un determinato ambito
AI KBS, logicaNLP linguaggioDatabase ER, OOA, ODBMKMS Knowledge Engineering ComunitySemantic Web
13
Alcune definizioni illustri
Neches (1991): “an ontology defines the basic terms and relations comprising the vocabulary of a topic area as well as the rules for combining terms and relations to define extensions to the vocabulary”Gruber (1993): “an explicit specification of a conceptualization”Borst (1997): “Ontology are defined as a formal specification of a shared conceptualization”Guarino (1995): “a logical theory which gives an explicit, partial account of a conceptualization”Bernaras (1996): “provides the means for describing explicitly the conceptualization behind the knowledge represented in the a knowledge base”
Caratteristiche delle ontologieModella i concetti, non i terminiCrea una gerarchia fra i concetti (simile all’ObjectOriented)Definisce delle relazione/associazioni fra i concettiI concetti sono indipendenti dai vocabolari/terminiSi esprimono assiomi e proprietà (transitive, riflessive, inverse) fra oggetti
Esprime le relazioni fra concetti in modo che siano machine-undestandableAumenta l’interoperabilità fra sistemi e il ragionamento logico delle risorse in rete
14
Tipi di ontologie
Ontologia fondazionaleconcetti astratti di modellazione delle variecategorie del mondo (es. Dolce)
Ontologia coreconcetti astratti ma di una determinatadisciplina (es. LKIF per l’ambito giuridico)
Ontologia di dominiomodellazione dei concetti di un particolaresettore di dominio (es. Ontologia dei concettirelativi alla Proprietà Intellettuale – progettoALIS)
OWL – standard W3C
The Web Ontology Language OWL is a semantic markup language for publishing and sharing ontologies on the World Wide Web. OWL is developed as a vocabulary extension of RDF (the Resource Description Framework) and is derived from the DAML+OIL Web Ontology Language. This document contains a structured informal description of the full set of OWL language constructs and is meant to serve as a reference for OWL users who want to construct OWL ontologies.
http://www.w3.org/TR/owl-ref/
15
Relazione fra i linguaggi
Elementi del Semantic Web
Ogni ontologia OWL Lite è valida anche in OWL DL Ogni ontologia OWL DL è valida anche in OWL Full
Ogni asserzione in OWL Lite è una asserzione anche in OWL DL Ogni asserzione in OWL DL è una asserzione anche in OWL Full
16
Ontologie giuridiche
Valente, 1995, (ISI-Amsterdam)Van Kralingen, 1995Visser e Bench-Capon, 1999 (University of Liverpool)Dolce, di GuarinoLegOntoWeb in OntoWebAction Specifique Ontologie du Droit in Francia, FOLaw Univ. Amsterdam LKIF-core in Estrella
I tre livelli dell’ontologia giuridica
Sartor, Corso di Informatica Giuridica, Giappichelli, 2008, cap. 4.
17
Topic Map Model - ISO 13250-2
Le topic Map non sono uno standard W3C ma ISONascono per superare i limiti delle gerarchie presenti in OWL
Ogni concetto, relazione, proprietà è un topicUn topic è collegato ad altri topic mediante associazioni le quali hanno delle proprietà di tipo, ruolo, ambito (scope)Un topic ha delle occorrenze (istanze) concrete che sono dotate anche queste di tipo e ambitoAd un topic possono essere associati molti termini di diversi vocabolari
TopicAssociationOccurence
TypeRoleScope
Metamodel
20
XTM
Topic Map ontology è“the set of privileged topics and their characteristics, including associations between them” [Grønmo, 2006]E’ un’alternativa a RDF/OWL mediante XTME’ orientata alla modellazione dei concetti ed è più vicina alle discipline umanistiche Scarsi sono i tools per la modellazione visiva e concettuale, nonchè motori inferenziali o di ragionamento
Topic Maps – Ontologies for Humans?Lars Marius GarsholDevelopment Manager, Ontopia<[email protected]>
22
TOPIC MAP in Wiki
References – KM
http://knowledgeweb.semanticweb.org/index.htmlhttp://www.semanticweb.org/http://wonderweb.semanticweb.org./http://www.loa-cnr.it/http://wordnet.princeton.edu/http://wntw.sourceforge.net/M. Gruninger, O. Bodenreider, F. Olken, L. Obrst, P. Yim: “Ontology, taxonomy, folksonomy: understanding the distinctions”, Applied Ontologyjournal, 3 (2008) pagg.191-200
23
References – Topic Map
http://www.ontopia.net/topicmaps/materials/tao.htmlhttp://www.topicmap.com/http://www.topicmaps.org/xtm/1.0/http://www.idealliance.org/papers/extreme03/html/2003/Presutti01/EML2003Presutti01.htmlhttp://www.w3.org/TR/2005/WD-rdftm-survey-20050329/http://www.isotopicmaps.org/sam/sam-model/http://www.techquila.com/tm-samples.html