Harvest de Metadados com OAI-PMH / LexML João Lima.

26
Harvest de Metadados com OAI-PMH / LexML João Lima

Transcript of Harvest de Metadados com OAI-PMH / LexML João Lima.

Page 1: Harvest de Metadados com OAI-PMH / LexML João Lima.

Harvest de Metadados com OAI-PMH / LexML

João Lima

Page 2: Harvest de Metadados com OAI-PMH / LexML João Lima.

Introdução Comandos

Exemplos do IBICT OAI-PMH no Projeto LexML

Page 3: Harvest de Metadados com OAI-PMH / LexML João Lima.

OAI-PMH Open Archives Initiative Protocol

for Metadata Harvesting XML e HTTP Versão 2.0

http://www.openarchives.org/OAI/openarchivesprotocol.html

Criado em Janeiro/2001 Expor metadados descritivos

Page 4: Harvest de Metadados com OAI-PMH / LexML João Lima.

Data Provider / Service Provider

SF CD STF TCU

LexML

TJ SP

Page 5: Harvest de Metadados com OAI-PMH / LexML João Lima.

Data Provider / Service Provider

SF CD STF TCU

LexML

ALESP

Pref.SP Estado TJ SP

Page 6: Harvest de Metadados com OAI-PMH / LexML João Lima.

Registro OAI-PMH Header

Identificador único Timestamp (coleta seletiva) 0 ou + conjuntos (coleta seletiva)

Metadados DC (mínimo): oai_dc Proprietário: oai_lexml-br

About Rights Provenance

Informações sobre a origem do metadado, com identificadores (registro e repositório) e timestamp da origem.

Page 7: Harvest de Metadados com OAI-PMH / LexML João Lima.

Header – Exemplo<header> <identifier>oai:arXiv:cs/0112017</identifier> <datestamp>2002-02-28</datestamp> <setSpec>cs</setSpec> <setSpec>math</setSpec></header>

Page 8: Harvest de Metadados com OAI-PMH / LexML João Lima.

Metadata – Exemplo

<metadata> <oai_dc:dc xmlns:oai_dc="http://www.openarchives.org/OAI/2.0/oai_dc/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"

xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/oai_dc/

http://www.openarchives.org/OAI/2.0/oai_dc.xsd"> <dc:title>Using Structural Metadata to Localize Experience of

Digital Content</dc:title> <dc:creator>Dushay, Naomi</dc:creator> <dc:subject>Digital Libraries</dc:subject> <dc:description>With the increasing technical sophistication of

both information consumers and providers, there is increasing

demand for more meaningful experiences of digital information.

</dc:description> <dc:description>Comment: 23 pages including 2 appendices, 8 figures</dc:description> <dc:date>2001-12-14</dc:date> <dc:type>e-print</dc:type> <dc:identifier>http://arXiv.org/abs/cs/0112017</dc:identifier> </oai_dc:dc></metadata

Page 9: Harvest de Metadados com OAI-PMH / LexML João Lima.

About<about> <provenance xmlns="http://www.openarchives.org/OAI/2.0/provenance" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"

xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/provenance http://www.openarchives.org/OAI/2.0/provenance.xsd"> <originDescription harvestDate="2002-02-02T14:10:02Z"

altered="true"> <baseURL>http://the.oa.org</baseURL> <identifier>oai:r2:klik001</identifier> <datestamp>2002-01-01</datestamp>

<metadataNamespace>http://www.openarchives.org/OAI/2.0/oai_dc/</metadataNamespace>

</originDescription> </provenance></about>

Page 10: Harvest de Metadados com OAI-PMH / LexML João Lima.

Eliminação de Registros No

O repositório não mantém informações sobre registros eliminados.

status=delete (nunca) Persistent

O repositório sempre manterá informações sobre registros eliminados.

status=delete (sempre) Transient

Não garante o registro persistente das informações eliminadas

status=delete (talvez)

Page 11: Harvest de Metadados com OAI-PMH / LexML João Lima.

OAI-PMH - comandos

Identify ListMetadataFormats ListSets ListIdentifiers ListRecords GetRecord

Page 12: Harvest de Metadados com OAI-PMH / LexML João Lima.

Comando Identify

Informações sobre o repositório

Page 13: Harvest de Metadados com OAI-PMH / LexML João Lima.
Page 14: Harvest de Metadados com OAI-PMH / LexML João Lima.

ListMetadataFormat

Lista formatos de metadados disponíveis no repositório.

Page 15: Harvest de Metadados com OAI-PMH / LexML João Lima.
Page 16: Harvest de Metadados com OAI-PMH / LexML João Lima.

ListSets

Lista os conjuntos de dados disponíveis no repositório

Page 17: Harvest de Metadados com OAI-PMH / LexML João Lima.
Page 18: Harvest de Metadados com OAI-PMH / LexML João Lima.

ListIdentifiers

Lista apenas os identificadores Intervalo de timestamp Por prefixo Por set Controle do fluxo (resumptionToken)

Page 19: Harvest de Metadados com OAI-PMH / LexML João Lima.
Page 20: Harvest de Metadados com OAI-PMH / LexML João Lima.

ListRecords

Lista os registros Intervalo de timestamp Por prefixo Por set Controle do fluxo (resumptionToken)

Page 21: Harvest de Metadados com OAI-PMH / LexML João Lima.
Page 22: Harvest de Metadados com OAI-PMH / LexML João Lima.

GetRecord

Obtém um registro Identificador e prefixo (metadado)

Page 23: Harvest de Metadados com OAI-PMH / LexML João Lima.

OAI-PMH - LexML Esquema de Metadados

oai_lexml-br Tabelas do Data e Service Providers

Mesma estrutura > agregação Transferência de Dados para Tabelas do Resolver Cadastro do Data-Provider por interface Web Controle de Erros Interface para Consulta no Data-Provider

Alterações pontuais Controle da Coleta (horário da última coleta) SGBDs

MySQL e Oracle (testados) ANSI

Page 24: Harvest de Metadados com OAI-PMH / LexML João Lima.
Page 25: Harvest de Metadados com OAI-PMH / LexML João Lima.

Nas organizações

Impacto mínimo nas organizações Manutenção de tabela de

metadados

Page 26: Harvest de Metadados com OAI-PMH / LexML João Lima.

Cronograma 1 mês

especificação oai_lexml-br 15 dias

modelagem das tabelas 1 mês

Data_provider – interface Serice_provider – registro e coleta

1 mês Relatório de acompanhamento erros

1 mês Rotina de cópia para tabelas do resolver

15 dias Documentação final e Teste integrado