Metodi e strumenti per l’annotazione semantica

44
Metodi e strumenti per l’annotazione semantica Nunzia Osimi Tesista di Informatica presso il LEKS- CNR 14 Novembre 2003

description

Metodi e strumenti per l’annotazione semantica. Nunzia Osimi Tesista di Informatica presso il LEKS-CNR 14 Novembre 2003. Indice. Introduzione al Web Semantico Interoperabilità e ontologie L’annotazione semantica Criteri di classificazione delle AS Alcuni tool per l’annotazione semantica - PowerPoint PPT Presentation

Transcript of Metodi e strumenti per l’annotazione semantica

Page 1: Metodi e strumenti per  l’annotazione semantica

Metodi e strumenti per l’annotazione semantica

Nunzia OsimiTesista di Informatica presso il LEKS-CNR

14 Novembre 2003

Page 2: Metodi e strumenti per  l’annotazione semantica

2

Indice

Introduzione al Web SemanticoInteroperabilità e ontologieL’annotazione semanticaCriteri di classificazione delle ASAlcuni tool per l’annotazione semanticaConclusioni

Page 3: Metodi e strumenti per  l’annotazione semantica

3

Semantic Web: Motivazioni

Intento Originale: rendere la semantica delle informazioni accessibile agli elaboratori Nel web attuale: necessario l’intervento umano per

comprendere il contenuto di risorse Obiettivo: rendere l’informazione “machine-

understandable” Soluzione: Utilizzare i metadati

Passo successivo: Interoperabilità Semantica combinare informazioni provenienti da sorgenti

diverse ai fini di realizzare: estrazione intelligente, cioè semantica (“Smart” retrieval) Scambio di informazioni tra applicazioni software Web Services: ricerca e composizione di servizi

Page 4: Metodi e strumenti per  l’annotazione semantica

4

Come realizzare l’interoperabilità?

Vocabolario controllatol’interoperabilità migliora se gli stessi termini sono usati per denotare gli stessi concetti

Ontologie Elementi principali

1. Un vocabolario controllato2. Relazioni tassonomiche tra concetti3. Altre relazioni tra concetti

Page 5: Metodi e strumenti per  l’annotazione semantica

5

Cos’è un’ ontologia?

Definizioni “…an explicit specification of a

conceptualization” (Gruber) “…a formal specification of a shared

conceptualization” (Borst) “explicit” i tipi di concetti utilizzati e i vincoli su di

essi sono definiti in modo esplicito. “formal” definita in un ling. formale. “shared” la conoscenza rappresentata in

un’ontologia non è scaturita dalla decisione di un singolo individuo, ma è riconosciuta da una collettività.

“conceptualization“ perchè un’ ontologia identifica i concetti rilevanti di un dominio applicativo stabilito.

Page 6: Metodi e strumenti per  l’annotazione semantica

6

Generalità sulle ontologieCome costruire un ontologia? Nominando una commissione ad hoc … ma è

necessaria una metodologia Ad esempio, il Dublin Core ha impiegato anni per

enucleare 15 elementi metadato principali. approccio “Darwiniano” :

l’ontologia migliore/la più popolare prevale Come combinazione di standard officiali e de-facto Sono in corso progetti per la def. di “upper

ontology”

le Ontologie consentono deduzioni (reasoning) Ciò permette di spostarsi dall’elaborazione della

“sintassi” a quella della “semantica” . ma: da dove scaturiscono i “dati semantici”?

Semantic Annotation

Page 7: Metodi e strumenti per  l’annotazione semantica

7

Annotazioni SemanticheSono informazioni semantiche associate a risorse web.Perché si usano? Per arricchire il contenuto informativo dei

documenti Per esprimere in maniera formale, il

significato di : Porzione di testo in un documento Web service Strutture dati coinvolte in un processo di

collaborazione (interoperabilità tra applicazioni software)

Page 8: Metodi e strumenti per  l’annotazione semantica

8

The Internet

Ontologia

Meta-KR

Utenti

Knowledge Resource Management

KR: Knowledge Resources

Page 9: Metodi e strumenti per  l’annotazione semantica

9

Criteri per classificare le annotazioni

Livello di formalità del linguaggio usato Posizionamento dell’annotazione Destinatario dell’annotazione Tipo di risorsa annotataLivello di restrizione imposto sul linguaggio.Modalità di annotazione

Page 10: Metodi e strumenti per  l’annotazione semantica

10

Livello di formalità del linguaggio usato

formale espressa in un linguaggio formale di rappresentazione della

conoscenza Alcuni linguaggi

RDF e RDFS: un framework per esprimere i metadati nel web DAML, DAML+OIL, OWL sono usati per la definizione di ontologie

Permette di processare i dati senza l’intervento umano (machine understandable)

informale Espressa in linguaggio naturale o in un linguaggio controllato Permette di aggiungere informazioni su documenti o risorse,

fruibili da un utente umano

Page 11: Metodi e strumenti per  l’annotazione semantica

11

EsempioEsempio Annotazione Formale in RDF

<Researcher rdf:about=“file:///C:\…\PagineHtml\Michele Missikoff.htm#Michele Missikoff">

<first_Name> Michele </first_Name><last_Name> Missikoff </last_Name>

<has_affiliation rdf:resource=“file:///C:\…\Michele Missikoff.htm#IASI - CNR"/>

</Researcher>

Esempio Annotazione Informale in linguaggio naturaleMichele Missikoff un ricercatore dello IASI-CNR.

Page 12: Metodi e strumenti per  l’annotazione semantica

12

Posizionamento dell’annotazione

Embedded inserita all’interno dello stesso

documento annotato

Attached Memorizzata separatamente, collegata

al documento da un link.

<html>…

<annot>…

</html>

<html>…

</html>

annot

Page 13: Metodi e strumenti per  l’annotazione semantica

13

Destinatario dell’annotazione

Human user Ha lo scopo di fornire informazioni aggiuntive

su una risorsa in questo caso l’annotazione in genere sarà

poco formale probabilmente realizzata in linguaggio naturale

Computer Ha lo scopo di esplicitare il significato di una

risorsa in tal caso l’annotazione deve essere di tipo

formale per poi essere processabile da una macchina

Page 14: Metodi e strumenti per  l’annotazione semantica

14

Tipo di risorsa annotataAnnotazione di documenti Frammento di testo, pagina HTM, immagini,

ecc.

Annotazione di Web Services Esprimere cosa fa un servizio, descrivere i

parametri di input e l’output Solitamente è di tipo formale

Annotazione di strutture dati, processi,… coinvolti nello scambio di informazioni tra

applicazioni software che cooperano Solitamente è di tipo formale, ontology-

based

Page 15: Metodi e strumenti per  l’annotazione semantica

15

Livello di restrizione imposto al linguaggio

Absence i termini del linguaggio possono essere usati

senza vincoli

Advised (consigliato…) si è liberi di scegliere se utilizzare o meno un

glossario, un ontologia, (o anche parole chiavi) in alternativa al linguaggio naturale.

Mandatory (vincolante) C’è l’obbligo di usare un glossario di riferimento

o un ontologia (Annotazione Ontology-based)

Page 16: Metodi e strumenti per  l’annotazione semantica

16

Modalità di AnnotazioneNB. questa classificazione riguarda solo le SA

Ontology-based

Annotazione attraverso istanze di concetti L’annotazione consiste in

1. Associazione di una istanza all’elemento annotato 2. Valorizzazione delle proprietà che descrivono l’istanza

Annotazione attraverso concetti L’annotazione consiste in

Associazione di un concetto dell’ontologia all’elemento annotato

Associazione di una composizione di concetti dell’ontologia (attraverso opportuni operatori) all’elemento annotato

Page 17: Metodi e strumenti per  l’annotazione semantica

17

Student

Person

Researcher

Faculty_Member

IDMicheleMissikoff

Is a

Is a

Is a

Instance of <IDMicheleMissikoff> Michele Missikoff

</IDMicheleMissikoff> è un ricercatore dello

IASI CNR

Michele Missikoff è un <Researcher>

ricercatore </Researcher> dello IASI CNR

name

address

Ontologia Annotazione attraverso concetti

Annotazione attraverso istanze

Page 18: Metodi e strumenti per  l’annotazione semantica

18

Formalità

Posizionam

Destinatar

Risorsa

Restriz. ElemAnn

Ontomat

Formale (DAML+OIL)

Embedded (nell’header)

Computer Pg.html Ontology-based

Istanze

Mnm Formale (DAML+OIL, RDF)

Attached Computer Pg.htmlOntology-based

Istanze

Smore Formale(RDF,DAML+OIL, OWL)

Embedded (nell’header)/(e-mail,Img.) Attached

ComputerFoto, mail,Pg.html

Advised ??

Annotea

Infomale ------

Human user

Pg.html Absence Non O-B

Cohse Formale ------ Computer Doc/ Pg.html

Ontology-based

Concetti

Melita Formale ------ Computer Doc Ontology-based

Istanze

Classificazione di alcuni tool

Page 19: Metodi e strumenti per  l’annotazione semantica

19

Tool Analizzati

Si è riuscito ad annotare con: OntoMat-Annotizer Mnm Smore

Problemi : Cohse (problemi d’istallazione) Melita (eseguibile non fornito)

Page 20: Metodi e strumenti per  l’annotazione semantica

20

Esempio

Organization

Researcher

Reserch funding

Institution

University

Person

Student

Faculty_Member

IASI-CNR

Michele Missikoff

Is aIs a

Is a

Is a

Is a

Is a

Instance of

Instance of

Has_affiliate

Has affiliation

Page 21: Metodi e strumenti per  l’annotazione semantica

21

Ontomat (caratteristiche generali)

Visualizzazione dell’ontologia (in DAML+OIL) mediante alberoBrowser per l’esplorazione dell’ontologia e delle istanzeBrowser Html che visualizza le parti di testo annotate.Implementato in Java, permette l’estensione tramite plugin Le annotazioni avvengono mediante drag’n’drop

Page 22: Metodi e strumenti per  l’annotazione semantica

22

Page 23: Metodi e strumenti per  l’annotazione semantica

23

OntomatInput : ontologia (DAML+OIL)

pagina html

Output : Pagina Html con annotazioni inserite

nell’ header Istanze esportate (annotazione in DAML+OIL) Ontologia (DAML+OIL)

Ontologia + Istanze (DAML+OIL).

Page 24: Metodi e strumenti per  l’annotazione semantica

24

Annotazione (istanza esportata da OntoMat)

<rdf:RDF ... >

<Research_Funding_Institution rdf:about="http://…\Michele Missikoff.htm#IASI-CNR">

<address> Viale Manzoni,30 </address> <country> Italy </country>

<location> Rome </location> <name> IASI-CNR </name> <has_affiliate rdf:resource="http://…\Michele

Missikoff.htm#Michele Missikoff"/></Research_Funding_Institution>…

Page 25: Metodi e strumenti per  l’annotazione semantica

25

…esempio…

<Researcher rdf:about="http://…\Michele Missikoff.htm#Michele Missikoff">

<first_Name> Michele </first_Name>

<last_Name> Missikoff </last_Name>

<has_affiliation rdf:resource="http://…\Michele

Missikoff.htm#IASI-CNR"/>

</Researcher>

</rdf:RDF>

Page 26: Metodi e strumenti per  l’annotazione semantica

26

Pro e contro di OntoMat (1)PRO

Interfaccia User-friendly

Chiara distinzione tra classi, attributi, relazioni e istanze

Fornisce l’help on line (Wizard)

Estendibile ad altri linguaggi tramite plugin.

Page 27: Metodi e strumenti per  l’annotazione semantica

27

Pro e contro di OntoMat (2)

CONTROImpone vincoli sulla visualizzazione delle proprietà che descrivono una classe:

una proprietà P può essere utilizzata per descrivere una

istanza di una classe C, soltanto se C è stata definita attraverso un "restriction“ su P

Non effettua reasoning: non gestisce in modo automatico l’inversa di una

relazione

L’importazione di “ontologia+istanze” non avviene in modo corretto:

le istanze non vengono caricate automaticamente.

Page 28: Metodi e strumenti per  l’annotazione semantica

28

Mnm (caratteristiche generali)

Browser Browser Html Browser dell’ontologia

Mark-up del testoApprendimento automatico (Amilcare)Annotazione semi-automatica

Page 29: Metodi e strumenti per  l’annotazione semantica

29

Page 30: Metodi e strumenti per  l’annotazione semantica

30

Mnm (I/O)

Input: ontologia in DAML/ DAML+OIL/ RDF Pagina Html.

Output: Base di conoscenza rappresentante

l’annotazione del documento in DAML/ DAML+OIL/ RDF

File “dummy” (proprietario) che mantiene il collegamento tra annotazione e documento.

Page 31: Metodi e strumenti per  l’annotazione semantica

31

Annotazione (base di conoscenza salvata con MNM)

<rdf:RDF…. > <rdf:Description rdf:about='file:/…/MnM2/

KbCreated/Misha1.rdf#Michele Missikoff'> <rdf:type rdf:resource='file:/…/MnM2/Ontologies/

s_community.rdfs#Person'/> <NS0:name>Michele Missikoff</NS0:name>

<NS0:worksAt>LEKS</NS0:worksAt></rdf:Description>…

Page 32: Metodi e strumenti per  l’annotazione semantica

32

…esempio…<rdf:Description rdf:about='file:/…/MnM2/

KbCreated/Misha1.rdf#LEKS'><rdf:type rdf:resource='file:/…/MnM2/Ontologies/ s_community.rdfs#Organisation'/>

<NS0:title>Lab for Ent. Knowledge Systems </NS0:title><NS0:location>IASI-CNR</NS0:location>

</rdf:Description>…</rdf:RDF>

Page 33: Metodi e strumenti per  l’annotazione semantica

33

Pro e contro di MNM (1)

PROLa parte di testo annotata è facilmente riconoscibile perché evidenziata in diversi coloriPossibilità di definire le annotazioni attraverso form o tramite selezione del testoEffettua Apprendimento automatico (Amilcare)

Page 34: Metodi e strumenti per  l’annotazione semantica

34

Pro e contro di MNM (2)CONTRO

Struttura ontologia è poco intuitivaPresuppone conoscenza dell’ RDF da parte dell’utenteImpone vincoli sulla visualizzazione delle proprietà che descrivono una classe:

una proprietà P può essere utilizzata per descrivere una istanza di una classe C soltanto se C è stata dichiarata come dominio di P.

OSS: OntoMat e MNM non interpretano l’ input allo stesso modo

Page 35: Metodi e strumenti per  l’annotazione semantica

35

Smore (caratteristiche generali)

Fornisce Editor pagine html Fornisce un collegamento alle esistenti ontologie su Internet per renderle utilizzabili all’interno della propria web-page.Possibile creazione di una propria ontologia personalizzata costruibile a partire dall’esistenti (Editor di Ontologie)

Page 36: Metodi e strumenti per  l’annotazione semantica

36

Page 37: Metodi e strumenti per  l’annotazione semantica

37

Smore

Input: ontologia in RDF, DAML, DAML+OIL, OWL Pagina html

Output file dataset proprietario (.dat) (rappresentante la

struttura usata per annotare) Pagina html annotazione in RDF (è possibile salvare sia

l’annotazione pura sia il documento con annotazione “embeded” nell’header)

Page 38: Metodi e strumenti per  l’annotazione semantica

38

Annotazione (file RDF salvato con Smore)

<rdf:RDF… xmlns:personal1.0="http://www.cs.umd.edu/projects/plus/DAML/onts/personal1.0.daml#"><personal1.0:Organization rdf:ID="LEKS">

<personal1.0:member>Michele Missikoff

</personal1.0:member></personal1.0:Organization><personal1.0:Person rdf:ID="Michele_Missikoff"></personal1.0:Person>

</rdf:RDF>

Si è perso il link all’istanza

Michele Missikoffdell’ontologia

Page 39: Metodi e strumenti per  l’annotazione semantica

39

Pro e contro di Smore (1)

PROE’ necessaria una minima conoscenza della sintassi e dei termini del RDF da parte dell’utente.Unico tool esaminato che permette di annotare anche in OWL

Page 40: Metodi e strumenti per  l’annotazione semantica

40

Pro e contro di Smore (2)CONTRO

Poco comprensibile come creare effettivamente le istanze di classi e le relazioni tra istanze definite a partire da una ontologia fissata

Help in linea poco dettagliato, molte funzionalità rimangono oscurePoco stabile, genera eccezioni durante l’esecuzione

Page 41: Metodi e strumenti per  l’annotazione semantica

41

Conclusioni (1)Obiettivo di questo lavoro era trovare un tool

che avesse le seguenti caratteristiche: Formale Machine-oriented Per annotare qualsiasi tipo di risorsa

documenti, webServices, risorse coinvolte in un processo di interoperabilità tra applicazioni soft.

Ontology-based Possibilità di annotare sia concetti che istanze Di facile utilizzo (anche da utente inesperto)

Escluso OntoMat gli altri tool sono risultati poco stabili e poco user-friendly.

Page 42: Metodi e strumenti per  l’annotazione semantica

42

Conclusioni (2)

Soluzioni possibili:Estendere OntoMat con Plugin per la gestione di OWL (lasciando comunque cosi’ irrisolta l’ annotazione attraverso concetti )Creare una nuova applicazione che soddisfi tutte le esigenze elencate.

Page 43: Metodi e strumenti per  l’annotazione semantica

43

References (1)

1. S. Bechhofer, C. Goble. Towards Annotation using DAML+OIL K-CAP 2001 workshop on Knowledge Markup and Semantic Annotation, Victoria B.C, October 2001. (COHSE)

2. M. Denny. Ontology Building: A Survey of Editing Tools November 06, 2002 http://www.xml.comp/pub/a/2002/11/06/ontologies.html?pages=2

3. S. Handschuh, S. Staab, A. Mädche . CREAM - Creating relational metadata with a component-based, ontology driven annotation framework . K-CAP 2001

4. S. Handschuh, S. Staab, A. Maedche. An AnnotationFramework for the Semantic Web Karlsruhe, Germany 2001

5. M. Missikoff, F. Schiappelli, F.Taglino A Controlled Language for Semantic Annoatation and Interoperability in e-Business Application IASI-CNR (Italy) 2003

6. M. Missikoff F. Schiappelli. Semantic Annotation for Enterprises Interoperability IASI_CNR (Italy) 2003

Page 44: Metodi e strumenti per  l’annotazione semantica

44

References (2)1. M. Vargas-Vera, E. Motta, J. Domingue, M. Lanzoni, A. Stutt and F. Ciravegna.

"MnM: Ontology Driven Semi-Automatic and Automatic Support for Semantic Markup",The 13th International Conference on Knowledge Engineering and Management (EKAW 2002), ed Gomez-Perez, A., Springer Verlag, 2002.

2. M. Vargas-Vera, E. Motta, J. Domingue, M. Lanzoni, A. Stutt and F. Ciravegna. "MnM: Ontology Driven Tool for Semantic Markup", European Conference on Artificial Intelligence (ECAI 2002). In proceedings of the Workshop Semantic Authoring, Annotation & Knowledge Markup (SAAKM 2002). Lyon France, July 22-23, 2002.

3. M. Vargas-Vera, J. Domingue, E. Motta, S. Buckingham Shum and M. Lanzoni. "Knowledge Extraction by using an Ontology-based Annotation Tool“. In proceedings of the Workshop Knowledge Markup & Semantic Annotation, K-CAP'01, Victoria Canada, October 2001.

4. A. Wolff, Z. Zdrahal, Z. Kouba. Tools for Personalised Annoatation and Organization of Diverse Web Resources KMI

5. WWW.semanticweb.org