Arquitetura do LexML Resolver Adaptado por João Lima.
-
Upload
luiz-henrique-marroquim-fortunato -
Category
Documents
-
view
219 -
download
1
Transcript of Arquitetura do LexML Resolver Adaptado por João Lima.
Arquitetura do LexML Resolver
Adaptado por João Lima
Definições “Resolvedor” é um agente que, dado um
identificador LexML Brasil (URN), retorna metadados das normas correspondentes. Os metadados contém, além da descrição básica da “obra”, referências (URLs) para o texto completo da norma.
URL – Universal Resource Locator (HTTP) URN – Universal Resource Name
Proposta de ImplementaçãoModelo Distribuído
Cliente
OAI-PMH
Resolvedor “br;sp”
Coletor deMetadados
“br;sp”
Resolvedor “br;sp;sao.paulo”
Coletor deMetadados
“br;sp;sao.paulo”
Resolvedor “br:pb”
Coletor deMetadados
“br;pb”
Resolvedor “br”
Coletor deMetadados
“br”
OAI-PMH
Legislação Federal
Legislação Estadual Legislação Municipal Legislação Estadual
Neste cenário o cliente faz a pergunta a qualquer nó, que redireciona a requisição se necessário.
Cada nó do sistema distribuído é semelhante a um sistema centralizado completo, só que neste caso o nó agrega metadados de apenas uma jurisdição.
Descoberta do nó responsável por determinada jurisdição pode ser feita usando tabelas de lookup ou até mesmo DNS
Lookup
Lookup LookupLookup
Modelo Distribuído:Replicação
Cliente
Resolvedor “br;sp”
Coletor deMetadados
“br;sp”OAI-PMH
Cada “resolvedor” pode ter uma ou mais réplicas do banco de metadados para permitir tolerância a falhas e balanceamento de carga
Réplica A “br;sp”
Réplica AMetadados
“br;sp”
Modelo Distribuído:Precauções Manter registro de “resolvedores” atualizada
Evitar laços infinitos
Gerenciar mudanças nas unidades administrativas
Protocolo de Resolução É necessário desenvolver um protocolo de resolução de
LexML URNs e software que implemente tal protocolo
Web Browsers e bibliotecas HTTP nunca vão dar suporte a esquemas baseados em URNs Facção diz que URN vai contra a “arquitetura web” Antiga disputa entre HTTP URL vs. URN
Ainda assim há vantagens claras em usar URNs: Distinção entre URN e HTTP URLs Geração automática a partir de metadados Persistência Compatibilidade com a “arquitetura web” através de proxies
Implementação do Protocolo
Outros identificadores têm bibliotecas que implementam o protocolo de resolução Suporte a várias linguagens e plataformas Bibliotecas para Clientes e Servidores
Mas identificadores LexML Brasil requerem dados para operar Melhor implementar Web Services REST (HTTP GET)
A Armadilha dos Protocolos Personalizados Web Browsers permitem a implementação de protocolos personalizados
Um exemplo é o protocolo lsidres: Usado pelos plugins LSID p/ Firefox e Internet Explorer lsidres:urn:lsid:herbimi.info:specimens:100069
É uma armadilha para o sistema Links só funcionam se o usuário instalar o plugin Caso contrário, os links parecerão quebrados. O browser apenas emite uma
mensagem de erro inútil, que não leva o usuário a instalar o plugin. O mesmo acontece com bibliotecas http, só que não há plugins
É preferível usar um proxy HTTP: http://lsid.tdwg.org/urn:lsid:herbimi.info:specimens:100069 http://www.lexml.gov.br/n2l?urn:lex:br:federal:lei:lei.geral.telecomunicacoes
O Que Retornar ao Cliente?
Uma página web (XHTML)? Conteúdo XML? XML + XSLT?
Negociação de ConteúdoCabeçalho HTTP “Accept:”
Arquitetura:Centralizada ou Distribuída
Decisão baseada nos parâmetros:Estimativa do tamanho do banco
Considerações políticas: Quem detém o controle sobre o sistema?
Complexidade (custo) de Implementação
Estimativa do Tamanho do Banco de Dados
0
500
1000
1500
2000
2500
Fed Est Mun
Fonte: Quantidade de Normas Editadas no Brasil: Período 05/10/1988 a 05/10/2004. IBPT - Instituto Brasileiro de Planejamento Tributário.Extraído de apresentação de João Lima - PRODASEN
Núm. de Registros: ~ 3.3 milhões(desde outubro/1988)
Tamanho do Registro: ~ 2-4 KB(apenas metadados)
Tamanho do Banco de Dados: ~ 13 GB (apenas dados) ~ 40 GB (incluindo “padding” – 3x)
Estimativa de acréscimo anual: ~ 800 MB/ano (apenas dados) ~ 2,5 GB/ano (incluindo “padding”)
Arquitetura:Centralizada ou Distribuída
Banco não é tão grande (40GB + 2,5GB/ano): Sistema poderia ser centralizado
Entretanto, sistema distribuído é mais apropriado: Controle compartilhado pelos vários parceiros Tolerância a falhas – sistema continua funcionando se um componente
falha Escalabilidade – desempenho é mantido com adição de dados e
componentes ao longo do tempo
Benefícios justificam complexidade (custo) adicional do sistema distribuído
Conclusões
Possível implementar “resolvedores” LexML Brasil Piloto com bases de dados representativas em 3 a 6
meses Demais nós podem ser adicionados em etapas
Sistema distribuído é mais apropriado Benefícios justificam complexidade (custo) adicional Possibilidade de utilização de DNS na resolução
Interface do usuárioInterface de gerência
Referência direta via sistemas dos portais governamentais
Portal urn palavras
Plugins
Referência Direta
Após incluir o http proxy (http://www.lexml.gov.br/n2l?urn), codifica-se a URN desejada
Pode ser codificada em qualquer fonte ex:
parecer legislativo referenciando normas, proposições e acórdãos
trabalho acadêmico com referências monografia no formato PDF com links externos acórdão referenciando outros acórdão, súmulas
Referência via sistemas dos portais governamentais Uso de ícone para identificar o serviço
Resultado poderá vir com a programação visual da origem do link
Lexml URN Resolver
Pesquisa por Link (SF)
Pesquisa por Link (STF)
Portal LexML Aceita
URNs Palavras significativas
Retorna se resultado = 1 ocorrência
a página diretamente se resultado > 1 ocorrência
as opções para o usuário escolher se resultado = 0 ocorrências
informa que ainda não está disponível e/ou solicita ao usuário que reveja os argumento de pesquisa
Obra Complexa (FRBR)
Obra Indiv. (FRBR) Manifestação e Item (FRBR)Itens (FRBR)
Plugins
Exemplos do projeto italiano Norme In Rete Parser no texto em tela gerando de forma
automática as URNs plugin frame
clique em “analisar”
NiR toolbar
resultado do parser
Parsing a partir de resultado de busca no Portal NiR
1. copia
2. cola
3. analisa
Quadro do Parser
Parsing a partir de resultado de busca no Portal NiR
4. Hipertexto com links URN
5. clique em um link
Resultado do parser
Coleta de Metadados
OAI PMH Data Providers (órgãos) Service Providers (serviço lexml)
Data Providers, opções Integração do protocolo OAI-PMH aos
sistemas existentes Inclusão (e atualização) de dados em uma
tabela no cliente padrão que será distribuído
Gerência da Coleta de Metadados
Estado das coletas de metadados por data providerEstatísticas
Exemplo do IBICT Biblioteca Digital de Teses e Dissertações