Descrição de recursos em wikis semânticos

45
Descrição de recursos em wikis semânticos Dados em RDF para Linked Data Jaider Andrade Ferreira Mestrando em Ciência da Informação Orientadora: Plácida Santos

description

Descrição de recursos em wikis semânticos: dados em RDF para Linked Data Jaider Andrade Ferreira Mestrando em Ciência da Informação Orientadora: Plácida L. V. A. da C. Santos

Transcript of Descrição de recursos em wikis semânticos

Page 1: Descrição de recursos em wikis semânticos

Descrição de recursos em wikis semânticos

Dados em RDF para Linked Data

Jaider Andrade FerreiraMestrando em Ciência da Informação

Orientadora: Plácida Santos

Page 2: Descrição de recursos em wikis semânticos

Conteúdo

O A Ciência da Informação e a atividade de descrição de recursos

O A WebO A Web Semântica

O As tecnologias da Web SemânticaO URI, XML, RDF, OWL...

O Linked Data

O WikisO Wikis semânticos

O Semantic MediaWiki (SMW)

Page 3: Descrição de recursos em wikis semânticos

A Ciência da Informação e a atividade de descrição de recursos

O “A representação da informação é necessária em qualquer ambiente para proporcionar uma recuperação mais eficiente” (SANTOS; ALVES, 2009)

O Qualquer ambiente? Sim: analógico e digital

O Nesse sentido, os desenvolvedores da Web tem procurado construir estruturas e tecnologias que possibilitem a atribuição de metadados aos recursos, melhorando, desse modo, a recuperação de informações em ambientes digitais

Page 4: Descrição de recursos em wikis semânticos

Metadados

O Metadados são informações estruturadas que descrevem, explicam, proveem a localização ou, de alguma forma, tornam mais fácil a recuperação, a utilização ou o gerenciamento de recursos (NISO, 2004, p. 1).

Page 5: Descrição de recursos em wikis semânticos

Da Web para...

O Nesse contexto, há uma tendência a uma maior estruturação das informações disponibilizadas na Web.

O Estruturação essa que diz respeito à representação ou à descrição de recursos (informacionais ou não).

O Da necessidade de estruturar e de descrever semanticamente o conteúdo das páginas ou mesmo de representar e de descrever semanticamente uma entidade não presente no ambiente digital, surge o projeto da Web Semântica.

Page 6: Descrição de recursos em wikis semânticos

... a Web Semântica

O Da Web de documentos linkados para a Web de dados linkados, ou Web das coisas

O Da Web legível por humanos para a Web legível por máquinas

O Dos links sem tipos para os links tipados

O Para que isso ocorra, é necessária a criação de uma estrutura comum (modelos conceituais, tecnologias, práticas, etc.) que permita que os dados sejam compartilhados e reutilizados entre aplicações, empresas e comunidades e para eles que possam ser processados automaticamente por distintas ferramentas de software.

Page 7: Descrição de recursos em wikis semânticos

Tecnologias da Web Semântica

Principais tecnologias: O URIO XMLO RDFO RDFSO OWLO SPARQL

Page 8: Descrição de recursos em wikis semânticos

Tecnologias da Web Semântica

O As tecnologias da Web Semântica podem ser utilizadas em várias áreas de aplicação, por exemplo:

O Na integração de dadosO Na descoberta, na classificação e na busca por

recursosO Na catalogação de recursos e em serviços de

catalogaçãoO Na análise e na representação do conhecimentoO Na construção de agentes de software inteligentes O Na descrição de direitos de propriedade intelectualO Nas rede sociais

(SW-FAQ, 2009)

Page 9: Descrição de recursos em wikis semânticos

RDFResource Description

Framework[Estrutura de descrição de recurso]

Page 10: Descrição de recursos em wikis semânticos

Como o ser humano descreve os recursos?

O A maneira mais comum de descrever um recurso é utilizando-se da linguagem, ou seja, realizando declarações, sentenças, afirmações.

Page 11: Descrição de recursos em wikis semânticos

Como o ser humano descreve os recursos?

O Assim, classificamos os recursos...O Joãozinho é um ser humanoO Ser humano é um mamíferoO Mamífero é um animalO Etc.

(relações hierárquicas do tipo “é um(a)”)

Page 12: Descrição de recursos em wikis semânticos

Como o ser humano descreve os recursos?

O ... e atribuímos propriedades a eles:O Joãozinho tem 23 anosO Joãozinho mora em MaríliaO Joãozinho estuda na UnespO Etc.

(relações associativas, não hierárquicas)

Page 13: Descrição de recursos em wikis semânticos

Declarações

O De um ponto de vista linguístico, podemos considerar que as declarações são constituídas de três partes:

O SujeitoO PredicadoO Objeto

Page 14: Descrição de recursos em wikis semânticos

Declarações e descrições

O De um ponto de vista informacional:

O Recurso (objeto, coisa, entidade a ser descrita)

O Propriedade (atributo, característica, metadado)

O Valor (valor da propriedade)

Page 15: Descrição de recursos em wikis semânticos

Intercâmbio de (meta)dados

O O RDF é uma infraestrutura que permite a codificação, o intercâmbio e o reuso de metadados estruturados.

O Essa infraestrutura permite a interoperabilidade de metadados através da concepção de mecanismos que suportam convenções comuns de semântica, de sintaxe e de estrutura.

(MILLER, 1998)

Page 16: Descrição de recursos em wikis semânticos

Resource Description Framework

O Um mecanismo para a representação semântica que se baseia em um simples, porém poderoso, modelo de dados.

Page 17: Descrição de recursos em wikis semânticos

Grafo

O Um documento RDF está estruturado em forma de um grafo direcionado, isto é, um conjunto de nós que são ligados por arestas direcionadas (setas).

Page 18: Descrição de recursos em wikis semânticos

RDF

Recurso

Valor

Valor

Valor

Valor

Propriedade

Propriedade

Propriedade

Propriedade

Page 19: Descrição de recursos em wikis semânticos

RDF

Jaider

UNESP

Marília

Fabrício

RDF

estuda na

mora em

conhece o

ensina

Page 20: Descrição de recursos em wikis semânticos

Tripla

Recurso ValorPropriedade

Cibercultura Pierre LévyTem como autor

Entidades do mundo real

Page 21: Descrição de recursos em wikis semânticos

Identificadores

O Entidades precisam ser identificadas.

O Na Web Semântica os identificadores são os URIs

Identificador X Identificador ZIdentificador Y

Page 22: Descrição de recursos em wikis semânticos

URI

O URI (Uniform Resource Identifier) é uma sequência de caracteres que identifica (dá nome a) um recurso físico ou abstrato.

O Obs.: URL (Uniform Resource Locator) é um tipo de URI que, além de identificar, localiza um recurso disponível na Web.

O URI http://dbpedia.org/resource/BrazilO URL http://dbpedia.org/page/Brazil

Page 23: Descrição de recursos em wikis semânticos

URIO É o URI que torna o recurso único e não confundível com

outros recursos.

O O RDF pode descrever qualquer objeto que tenha uma clara identidade no contexto de uma dada aplicação: livros, pessoas, locais, editoras, eventos, relacionamentos entre essas coisas, conceitos abstratos... Enfim, qualquer coisa.

O Tais recursos podem, obviamente, não ser recuperados online e, portanto, seus URIs são usados exclusivamente para fins de identificação.

O Tais URIs são feitos para as máquinas referenciarem algum recurso, não para humanos buscarem informações

Page 24: Descrição de recursos em wikis semânticos

DeclaraçõesO Em RDF podemos fazer dois tipos de

declarações. Podemos dizer que:

1. Um recurso possui alguma relação com outro recurso:

O URI do recurso | URI da propriedade | URI do valor O Ex: Jaider | conhece | Fabrício

2. Um recurso possui alguma relação com um valor literal:

O URI do recurso | URI da propriedade | Valor literalO Ex: Jaider | tem como idade | 23 anos

Page 25: Descrição de recursos em wikis semânticos

Sintaxe para RDFO XML:

<?xml version="1.0" encoding="utf-8"?><rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"

xmlns:metadado="http://metadado.org/uri#">

 <rdf:Description rdf:about="http://exemplo.org/uri#jaider">

<metadado:nome>Jaider</metadado:nome><metadado:conhece>

<rdf:Description rdf:about="http://exemplo.org/uri#fabricio"><metadado:nome>Fabrício</metadado:nome>

</rdf:Description></metadado:conhece >

</rdf:Description> </rdf:RDF>

Page 26: Descrição de recursos em wikis semânticos

Vocabulários

O Adicionalmente, o RDF Schema, uma extensão do RDF, proporciona um meio para a publicação tanto de vocabulários legíveis por humanos quanto de vocabulários legíveis por máquinas.

O Vocabulário, nesse contexto, é definido como um conjunto de propriedades ou termos descritivos, isto é, elementos de metadados, definidos por uma comunidade de descrição de recursos.

Page 27: Descrição de recursos em wikis semânticos

Vocabulários

O Exemplos:O DC: http://dublincore.org (descrição geral)O FOAF: http://xmlns.com/foaf/spec (pessoas)O SIOC: http://www.w3.org/Submission/sioc-related

(pessoas)O VoID: http://www.w3.org/TR/void (datasets)O Schema.org: http://schema.org/Book (geral)O vCARD: http://www.w3.org/TR/vcard-rdf (contatos)O Geo: http://www.w3.org/2003/01/geo (localizações)O Bio: http://vocab.org/bio/0.1 (biografia)

Page 28: Descrição de recursos em wikis semânticos

Vocabulários

http://dbpedia.org/resource/Dom_Casmurro http://purl.org/dc/elements/1.1/creator http://dbpedia.org/resource/Machado_de_Assis

http://dbpedia.org/resource/Dom_Casmurro http://purl.org/dc/elements/1.1/date 1900

http://dbpedia.org/resource/Dom_Casmurro http://purl.org/dc/elements/1.1/language Português

http://dbpedia.org/resource/Dom_Casmurro http://purl.org/dc/elements/1.1/publisher http://pt.dbpedia.org/page/Livraria_Garnier

http://dbpedia.org/resource/Dom_Casmurro http://purl.org/dc/elements/1.1/subject Romance impressionista

De propriedades: ex. Dublin Core

De valores: ex. DBpedia

Page 29: Descrição de recursos em wikis semânticos

Linked Data

O Um método de publicação de dados estruturados interligados.

O Esse método utiliza tecnologias da Web Semântica como RDF e URIs.

O Ao invés de esses dados serem utilizados apenas para a visualização por humanos, eles estão dispostos de um modo que possibilita a leitura automática por computadores.

O Isso possibilita que os dados de diferentes fontes sejam interligados e consultados.

Page 30: Descrição de recursos em wikis semânticos

Princípios do Linked Data

1. Utilizar URIs para representar coisas2. Utilizar URIs do tipo HTTP para que essas

coisas possam ser referenciadas e lidas por pessoas e máquinas

3. Fornecer informações úteis sobre as coisas quando seus URIs são utilizados, e para essa tarefa, utilizar padrões como RDF e SPARQL

4. Incluir links para outras coisas relacionadas (utilizando URIs) quando publicar dados na Web

(BERNERS-LEE, 2006)

Page 31: Descrição de recursos em wikis semânticos

Como publicar dados em RDF?

Utilizando wikis semânticos!

Page 32: Descrição de recursos em wikis semânticos

WikiO Um software wikicriaO um site wiki

O Um site wikié composto porO páginas wiki

O Páginas wikisão escritas O de acordo com uma sintaxe wiki

O Páginas wiki são criadas O por uma comunidade wiki

O Uma comunidade wikisegue uma O prática wikique é embasada em umaO Filosofia wiki...

Page 33: Descrição de recursos em wikis semânticos

ExemploO Software wiki: MediaWiki

O (mediawiki.org)

O Site wiki: Wikipédia O (pt.wikipedia.org)

O Página wiki: Brasil O (pt.wikipedia.org/wiki/Brasil)

O Sintaxe wiki: '''Brasil'''O (pt.wikipedia.org/wiki/Ajuda:Guia_de_edição)

O Comunidade wiki: Usuários, Editores, Administradores, etc. O (pt.wikipedia.org/wiki/WP:Portal_comunitário)

O Prática wiki: Políticas (para o conteúdo e para a formatação de páginas wiki, para o comportamento dos editores do site wiki, etc.)O (pt.wikipedia.org/wiki/WP:Lista_de_políticas)

O Filosofia wiki: Princípios gerais, princípios que remontam a origem dos wikis (1995)

Page 34: Descrição de recursos em wikis semânticos

Wikis semânticos

O Um wiki semântico pode ser definido como

um software wiki que se utiliza de tecnologias da Web Semântica para incorporar conhecimento formalizado,

conteúdo, estruturas e links nas páginas wiki.O conhecimento formalizado é representado utilizando

padrões da Web Semântica e é, portanto, acessível e reutilizável por aplicações Web.

(BUFFA et al., 2007)

Page 35: Descrição de recursos em wikis semânticos

Wikis semânticos

O AceWiki (2008)O BOWiki (2008)O COW (2006)O Freebase (2005)O Gnowsis Wiki (2006)O Graphingwiki (2006)O IkeWiki (2006)O Kaukolu (2006)O Kawawiki (2005)O KnowWE (2010)O Makna (2006)O MultiMakna (2006)O MewKISS (2005)O OntoWiki (2006)O OpenRecord (2006)

O Platypus (2004)O Rhizome (2005)O Semantic MediaWiki

(2005)O SemperWiki (2005)O SHAWN (2005)O ShyWiki (2011)O SweetWiki (2006)O SWiki (2005)O Swooki (2008)O TaOPis (2008)O Topincs Wiki (2006)O wikiCalc (2007)O WikSAR (2006)O Ylvi (2006)

Page 36: Descrição de recursos em wikis semânticos

Semantic MediaWikiO O Semantic MediaWiki é um software

livre, de código aberto, disponível como uma extensão do software MediaWiki.

O É um sistema wiki melhorado com tecnologias da Web Semântica que possibilita aos usuários anotar semanticamente o conteúdo com informações explícitas legíveis por máquinas.

O O Semantic MediaWiki coleta os dados semânticos por meio das anotações semânticas que os usuários, cientes ou não, adicionam ao texto das páginas wiki.

Page 37: Descrição de recursos em wikis semânticos

Semantic MediaWiki

O ... é um wiki semântico para dados estruturadosO ... é implementado como uma extensão do

MediaWikiO ... é um software livre, de código abertoO ... é escrito em PHP e JavaScript e suporta o

MySQL como gerenciador de banco de dados além de gerenciadores de banco de dados RDF (triple stores) como um armazenamento secundário

Page 38: Descrição de recursos em wikis semânticos

Semantic MediaWiki

O ... está bem estabelecido e estávelO criado em 2005O é utilizado em centenas de sitesO é bem documentado (em inglês)

O http://semantic-mediawiki.orgO possui um evento que acontece duas vezes ao ano

na Europa e nos Estados Unidos (SMWCon)O é uma das maiores extensões do MediaWiki

O Código, desenvolvedores, usuários, etc.

Page 39: Descrição de recursos em wikis semânticos

Semantic MediaWiki

Possibilita:O O armazenamento e o gerenciamento de dadosO A navegação e a visualização de dadosO A busca por páginas baseada nos dados

armazenadosO A formatação de dadosO A exportação de dados

Page 40: Descrição de recursos em wikis semânticos

O modelo de dados do Semantic MediaWiki

O Dados: pares de propriedade-valor atribuídas às páginas

O Exemplo (página – propriedade - valor)

O Brasil | tem capital | BrasíliaO Jaider | nasceu em | 1990O Dom Casmurro | tem autor | Machado de Assis

Page 41: Descrição de recursos em wikis semânticos

Utilizando o Semantic MediaWiki

O Os dados são registrados na página que representa o que se pretende descrever. Exemplo:

O Página: BrasilO Conteúdo da página: [[tem capital::Brasília]]

Page 42: Descrição de recursos em wikis semânticos

Extensões do Semantic MediaWiki

O Semantic FormsO Formulários para o preenchimento dos dados

O Semantic Result FormatsO Vários formatos de saída para a exibição e o

intercâmbio de dadosO Maps e Semantic Maps

O Gerencia e consulta dados sobre locais geográficos O Semantic Drilldown

O Para a navegação facetada dos dadosO Semantic Watchlist

O Para enviar notificações quando os dados são modificados

O ...

Page 43: Descrição de recursos em wikis semânticos

Em síntese...O A Ciência da Informação trata da representação e da descrição

de recursosO A Web (principal ambiente digital informacional) está passando

por grandes desenvolvimentos, rumo a Web SemânticaO A Web Semântica é composta por várias tecnologias (URI, XML,

RDF, RDFS, OWL, RIF, etc.) que visam representar e descrever uma realidade de maneira interoperável

O A Web Semântica é projetada para forncecer “um pouco mais” de significado (semântica) para as máquinas

O Linked Data é um conjunto de práticas para a publicação de dados estruturados na Web Semântica

O Linked Data exige a utilização de RDFO Wikis semânticos fornecem meios para a descrição de recursos e

para a publicação de dados estruturados em RDF na Web Semântica.

O O wiki semântico mais utilizado é o Semantic MediaWiki.

Page 44: Descrição de recursos em wikis semânticos

ReferênciasO BERNERS-LEE, Tim. Linked Data. 2006. Disponível em:

<http://www.w3.org/DesignIssues/LinkedData.html>. Acesso em: 20 mar. 2013.

O BUFFA, Michel et al. SweetWiki: A semantic wiki. Journal of Web Semantics: Science, Services and Agents on the World Wide Web, [S.l.], Elsevier, v. 6, n. 1, p. 84-97, 2007. Disponível em: <http://dx.doi.org/10.1016/j.websem.2007.11.003>. Acesso em: 25 jun. 2011.

O KRÖTZSCH. Semantic MediaWiki - An introduction. Oxford: SMWCon, 2012. Disponível em: <http://semantic-mediawiki.org/wiki/File:20121024_SMWCon_Fall_Markus_Kr%C3%B6tzsch_Semantic_MediaWiki_-_An_Introduction.pdf>. Acesso em: 20 mar. 2013.

O MILLER, Eric. An Introduction to the Resource Description Framework. D-Lib Magazine, v. 4, n. 5, May 1998. Disponível em: <http://www.dlib.org/dlib/may98/miller/05miller.html>. Acesso em: 16 set. 2012.

O NISO. Understanding Metadata. Bethesda: NISO Press, 2004. Disponível em: <http://www.niso.org/publications/press/UnderstandingMetadata.pdf>. Acesso em: 23 set. 2012.

O SANTOS, Plácida Leopoldina Ventura Amorim da Costa; ALVES, Rachel Cristina Vesú. Metadados e Web Semântica para estruturação da Web 2.0 e Web 3.0. DataGramaZero, Rio de Janeiro, v. 10, n. 6, dez. 2009. Disponível em: <http://www.dgz.org.br/dez09/Art_04.htm>. Acesso em: 25 jun. 2011.

O SW-FAQ. W3C Semantic Web Frequently Asked Questions. 2009. Disponível em: <http://www.w3.org/2001/sw/SW-FAQ>. Acesso em: 20 mar. 2013.

Page 45: Descrição de recursos em wikis semânticos

ObrigadoJaider Andrade Ferreira

[email protected]

Encontro Internacional Dados, Tecnologia e Informação, Marília, 2013