Web semantico: metadati e ontologie

23
Web semantico: metadati e ontologie Prof. Monica Palmirani – CIRSFID Università di Bologna, Facoltà di Giurisprudenza Corso di Elementi di legimatica [email protected] Uno sguardo al futuro: verso il web 2.0 Web 1.0 Web 1.0 Web 2.0 Web 2.0 Web technology Web technology Semantic Web Semantic Web HTML, organizzazione dei contenuti, presentazione per lo più statica Pagine dinamiche Applicazioni interattive Codice eseguito via web direttamente nel browser Semantica del contenuto Metadati Machine readable Ontologie Cooperazione di idee Social networking Cooperazione di contenuti Simultaneità di azioni • Wiki • Blog • YouTube

Transcript of Web semantico: metadati e ontologie

1

Web semantico: metadati e ontologie

Prof. Monica Palmirani – CIRSFIDUniversità di Bologna, Facoltà di Giurisprudenza

Corso di Elementi di [email protected]

Uno sguardo al futuro: verso il web 2.0

Web 1.0Web 1.0

Web 2.0Web 2.0

Web technologyWeb technology

Semantic WebSemantic Web

HTML, organizzazione dei contenuti, presentazione per lo più statica

HTML, organizzazione dei contenuti, presentazione per lo più statica

Pagine dinamiche Applicazioni interattiveCodice eseguito via web direttamente nel browser

Pagine dinamiche Applicazioni interattiveCodice eseguito via web direttamente nel browser

Semantica del contenutoMetadatiMachine readableOntologie

Semantica del contenutoMetadatiMachine readableOntologie

Cooperazione di ideeSocial networkingCooperazione di contenutiSimultaneità di azioni• Wiki• Blog• YouTube

Cooperazione di ideeSocial networkingCooperazione di contenutiSimultaneità di azioni• Wiki• Blog• YouTube

2

Dal Web 1.0 al Web 3.0 passando per il semantic web

Semantic Web

“The Semantic Web is an extension of the current web in which information is given well-defined meaning, better enabling computers and people to work in cooperation.”

Tim Berners-Lee 2001

“The Semantic Web is what we will get if weperform the same globalization process toKnowledge Representation that the Web initiallydid to Hypertext”

Tim Berners-Lee, September 1998

3

What the Semantic Web can representTim Berners-Lee Date: September 1998

A Semantic Web is not Artificial IntelligenceA semantic Web will not require every application to useexpressions of arbitrary complexityA semantic Web will not require proof generation to be useful: proof validation will be enoughA semantic web is not an exact rerun of a previous failedexperimentKnowledge Representation goes Global

The Semantic Web is what we will get if we perform the same globalization process to Knowledge Representationthat the Web initially did to Hypertext. We remove the centralized concepts of absolute truth, total knowledge, and total provability, and see what we can do with limitedknowledge

Pila classica del Semantic Web Tim Berners-Lee

4

http://www.w3.org/DesignIssues/Semantic.html

Tim Berners-Lee Date: 1998/10/14

Interpretazione della pila del semantic web nell’Informatica Giuridica

Sartor G. 2008

5

Metadati

Abbiamo già visto URI e XML partiamo quindi dai metadati:

Informazioni aggiuntive di altri datiDati su dati

Metadati oggettivi vs. metadati soggettiviMetadati autoriali (fatti dall’autore) vs. metadati documentali (fatti dai vari editors)Metadati del testo vs. metadati di processo del documento (workflow, protocolli, sicurezza)In ambito giuridico queste divisioni creano problemi: fino a che punto inserire un metadato è un’interpretazione in senso giuridico del termine?Marcare un documento è sempre un’azione di interpretazione del documento, del testo, del contenuto

Trattazione dei metadati

Annotazioni: arricchimento del testo con parti aggiuntive posizionate in una porzione apposita del testo (es. Akoma Ntoso – blocco meta)Vocabolari: lista di termini, chiusa o apertaTassonomie: gerarchie di termini fra loro correlatiThesauri: tassonomie con relazioni semplici non solo gerarchiche (similitudini, vicinanza di concetti, polisemia, etc.)Ontologie: gerarchie di concetti dotate di relazioni complesse, di assiomi e proprietàFolksonomie: rete complessa di concetti fra loro correlati non solo da gerarchie e che consente di classificare il documento rispetto molti punti di vista

6

Altra visione

Vocabolari = termini + definizioniTassonomie = vocabolari + gerarchiaThesauri = tassonomie + relazioni sempliciOntologie = tassonomie+ assiomi+proprietàFolksonomie = taggatura dell’informazione libera da ogni tassonomia pre-costituita ma come integrazione di classificazioni multiple cooperative (classificazione dei video di Youtube, dei post nei blog)

Esempio di metadati giuridici inclusi nell’XML NIR come annotazione aggiuntiva

<DecretoLegislativo id="S2602414"><meta>

<descrittori><pubblicazione tipo="GU" num="082" norm="20060407"/><entratainvigore norm="20060422"/><redazione id="rd1" norm="20060511" nome="CIRSFID"

url="http://www.cirsfid.unibo.it"/><urn>urn:nir:stato:decreto.legislativo:2006-03-16;140</urn>

</descrittori><inquadramento>

<infodoc natura="decreto legislativo" normativa="si"funzione="regolativa" fonte="primario"/>

</inquadramento></meta>

Metadati di cui non si comprende la provenienza, il

soggetto e il predicato

7

Vocabolari

Vocabolario aperto:Lista liberaNon deve essere condivisaCoincide con i termini nel testoDifficoltà di ricerche

Vocabolario di termini controllati:Lista chiusaDeve essere condivisaSpesso non coincide con i termini presenti nel testoOmogeneità di ricerche

Tassonomie

Carl von Linné - svedese - 18th secolo definisce la moderna tavola di classificazione zoologica e botanicaMetodo classificatorio, gerarchico del dominio da modellare

8

Esempio di tassonomia dei metadati: Akoma notoso

Thesauri

Tassonomia arricchita di relazione fra i nodi gerarchiciBT/NT – broader term/narrower termUSE/UF - sinonimiRT – related termTT – top term - l’antenato del termineSN – scope note

Es. EURO-VOC, TESEO del Senato

9

RDF – un modello dati per rappresentare i metadati nel Web

RDF – Resource Description FrameworkDescrive le risorse nel web assegnando loro proprietà e valoriE’ un data-model – molto simile al modello ER ma non chiuso, la definizione delle relazioni è flessibile, così come delle proprietàE’ scritto in XML ed ha come namespace

rdf:

E’uno standard del W3C dal febbraio 2004

RDF - Elementi di base

Ogni risorsa è identificata tramite un URIRisorsa, proprietà, valoreOggetto, soggetto, predicatoAsserzione=(risorsa, proprietà, valore)Descrizione della risorsa: insieme di asserzioni

R1 R2 R3

R6R4

R7

R5

R8

P1 P2

P3 P4 P5

P6

P7

10

RDF-Schema

E’ una estensione dell’RDF che consente di definire vocabolari distribuiti machine-readableHa il concetto di subClassof e di subPropertyOf- implementa le classi e le gerarchie fra classiMa non ancora i concetti astratti

Esempio

Modifications

TimeModContest Mod

Mod-in-forceRepeal

1-1-1999Repeal

subClassOfsubClassOf

subClassOfsubClassOf

hasTimeproduce

hasTime

typetypedata level

ontology level

11

Esempio

language level

ontology level

Repeal

CassationAbrogation Revocation

Modifications

TimeModContest Mod

Mod-in-forceRepeal

subClassOfsubClassOf

subClassOfsubClassOf

hasTimeproduce

RDF: altro modo di esprimere i metadati, un esempio in MetaLex/CEN

<rdf:Statement><rdf:subject rdf:resource="Document.xml"/><rdf:predicate rdf:resource="lkif-legal-action:

Act_of_Publication"/><rdf:object rdf:resource="nir:pubblicazione"/>

</rdf:Statement>

12

RDF : modellazione della pubblicazione mediante un grafo

Ontologia informaticaIl termine ontologia deriva dalla filosofia dove però acquista significati diversi. Essa è una branca della filosofia metafisica che studia l’esistenza e l’essenza intrinseca delle cose e ne fornisce una classificazione"eon" + "logos“ = discorso sull'ente

In ambito informatico il termine ontologia viene usato per definire una metodologia per rappresentare la conoscenza di un determinato ambito

AI KBS, logicaNLP linguaggioDatabase ER, OOA, ODBMKMS Knowledge Engineering ComunitySemantic Web

13

Alcune definizioni illustri

Neches (1991): “an ontology defines the basic terms and relations comprising the vocabulary of a topic area as well as the rules for combining terms and relations to define extensions to the vocabulary”Gruber (1993): “an explicit specification of a conceptualization”Borst (1997): “Ontology are defined as a formal specification of a shared conceptualization”Guarino (1995): “a logical theory which gives an explicit, partial account of a conceptualization”Bernaras (1996): “provides the means for describing explicitly the conceptualization behind the knowledge represented in the a knowledge base”

Caratteristiche delle ontologieModella i concetti, non i terminiCrea una gerarchia fra i concetti (simile all’ObjectOriented)Definisce delle relazione/associazioni fra i concettiI concetti sono indipendenti dai vocabolari/terminiSi esprimono assiomi e proprietà (transitive, riflessive, inverse) fra oggetti

Esprime le relazioni fra concetti in modo che siano machine-undestandableAumenta l’interoperabilità fra sistemi e il ragionamento logico delle risorse in rete

14

Tipi di ontologie

Ontologia fondazionaleconcetti astratti di modellazione delle variecategorie del mondo (es. Dolce)

Ontologia coreconcetti astratti ma di una determinatadisciplina (es. LKIF per l’ambito giuridico)

Ontologia di dominiomodellazione dei concetti di un particolaresettore di dominio (es. Ontologia dei concettirelativi alla Proprietà Intellettuale – progettoALIS)

OWL – standard W3C

The Web Ontology Language OWL is a semantic markup language for publishing and sharing ontologies on the World Wide Web. OWL is developed as a vocabulary extension of RDF (the Resource Description Framework) and is derived from the DAML+OIL Web Ontology Language. This document contains a structured informal description of the full set of OWL language constructs and is meant to serve as a reference for OWL users who want to construct OWL ontologies.

http://www.w3.org/TR/owl-ref/

15

Relazione fra i linguaggi

Elementi del Semantic Web

Ogni ontologia OWL Lite è valida anche in OWL DL Ogni ontologia OWL DL è valida anche in OWL Full

Ogni asserzione in OWL Lite è una asserzione anche in OWL DL Ogni asserzione in OWL DL è una asserzione anche in OWL Full

16

Ontologie giuridiche

Valente, 1995, (ISI-Amsterdam)Van Kralingen, 1995Visser e Bench-Capon, 1999 (University of Liverpool)Dolce, di GuarinoLegOntoWeb in OntoWebAction Specifique Ontologie du Droit in Francia, FOLaw Univ. Amsterdam LKIF-core in Estrella

I tre livelli dell’ontologia giuridica

Sartor, Corso di Informatica Giuridica, Giappichelli, 2008, cap. 4.

17

Topic Map Model - ISO 13250-2

Le topic Map non sono uno standard W3C ma ISONascono per superare i limiti delle gerarchie presenti in OWL

Ogni concetto, relazione, proprietà è un topicUn topic è collegato ad altri topic mediante associazioni le quali hanno delle proprietà di tipo, ruolo, ambito (scope)Un topic ha delle occorrenze (istanze) concrete che sono dotate anche queste di tipo e ambitoAd un topic possono essere associati molti termini di diversi vocabolari

TopicAssociationOccurence

TypeRoleScope

Metamodel

18

Topic

Topic e Nomi

19

Associazione

Occurence

20

XTM

Topic Map ontology è“the set of privileged topics and their characteristics, including associations between them” [Grønmo, 2006]E’ un’alternativa a RDF/OWL mediante XTME’ orientata alla modellazione dei concetti ed è più vicina alle discipline umanistiche Scarsi sono i tools per la modellazione visiva e concettuale, nonchè motori inferenziali o di ragionamento

Topic Maps – Ontologies for Humans?Lars Marius GarsholDevelopment Manager, Ontopia<[email protected]>

21

eGOV Topic Map - 60 Topics 10 associations

Graphic visualization of the eGOV TM

22

TOPIC MAP in Wiki

References – KM

http://knowledgeweb.semanticweb.org/index.htmlhttp://www.semanticweb.org/http://wonderweb.semanticweb.org./http://www.loa-cnr.it/http://wordnet.princeton.edu/http://wntw.sourceforge.net/M. Gruninger, O. Bodenreider, F. Olken, L. Obrst, P. Yim: “Ontology, taxonomy, folksonomy: understanding the distinctions”, Applied Ontologyjournal, 3 (2008) pagg.191-200

23

References – Topic Map

http://www.ontopia.net/topicmaps/materials/tao.htmlhttp://www.topicmap.com/http://www.topicmaps.org/xtm/1.0/http://www.idealliance.org/papers/extreme03/html/2003/Presutti01/EML2003Presutti01.htmlhttp://www.w3.org/TR/2005/WD-rdftm-survey-20050329/http://www.isotopicmaps.org/sam/sam-model/http://www.techquila.com/tm-samples.html