Data Warehouse Janeiro/2013 Ceça Moraes [email protected].

39
Data Warehouse Janeiro/2013 Ceça Moraes [email protected]

Transcript of Data Warehouse Janeiro/2013 Ceça Moraes [email protected].

Page 1: Data Warehouse Janeiro/2013 Ceça Moraes cecafac@gmail.com.

Data Warehouse

Janeiro/2013Ceça Moraes

[email protected]

Page 2: Data Warehouse Janeiro/2013 Ceça Moraes cecafac@gmail.com.

2

Material da Professora Valéria Cesário Times, do Cin-UFPE

Page 3: Data Warehouse Janeiro/2013 Ceça Moraes cecafac@gmail.com.

3

Conteúdo

• Introdução• Conceitos básicos• Modelos e modelagem dimensional• Arquitetura de DW• Processamento OLAP x OLTP• Cubo Multidimensional• Arquitetutas OLAP• Exemplos de Relatórios OLAP

Page 4: Data Warehouse Janeiro/2013 Ceça Moraes cecafac@gmail.com.

4

Hierarquia da Informação

Page 5: Data Warehouse Janeiro/2013 Ceça Moraes cecafac@gmail.com.

5

CONCEITOS BÁSICOS

Page 6: Data Warehouse Janeiro/2013 Ceça Moraes cecafac@gmail.com.

6

Conceitos e Terminologia de SDW

• O que é Banco de Dados Multidimensional?• O que é Data Warehouse (DW)?• O que é Data Mart (DM)?• O que são ETL e ODS?• O que é Data Warehousing(DWing)?• O que são Sistemas de DW e OLAP?

Page 7: Data Warehouse Janeiro/2013 Ceça Moraes cecafac@gmail.com.

7

Conceitos e Terminologia de SDW

• O que é Banco de Dados Multidimensional?• O que é Data Warehouse (DW)?• O que é Data Mart (DM)?• O que são ETL e ODS?• O que é Data Warehousing(DWing)?• O que são Sistemas de DW e OLAP?

Page 8: Data Warehouse Janeiro/2013 Ceça Moraes cecafac@gmail.com.

8

Banco de Dados Multidimensional

• Podemos pensar (conceitualmente) em um Banco de Dados Multidimensional (BDMD) como um ARRAY gigantesco:–BDM D(i ,j ,l ,m ,n,o ,p ,r,s ,t, . .. , )– Tamanho Máximo do BDMD = imax * jmax *

kmax * lmax * mmax * ...

Page 9: Data Warehouse Janeiro/2013 Ceça Moraes cecafac@gmail.com.

9

Banco de Dados Multidimensional Consulta

Page 10: Data Warehouse Janeiro/2013 Ceça Moraes cecafac@gmail.com.

10

Banco de Dados Multidimensional Consulta - Tridimensional

Page 11: Data Warehouse Janeiro/2013 Ceça Moraes cecafac@gmail.com.

11

Conceitos e Terminologia de SDW

• O que é Banco de Dados Multidimensional?• O que é Data Warehouse (DW)?• O que é Data Mart (DM)?• O que são ETL e ODS?• O que é Data Warehousing(DWing)?• O que são Sistemas de DW e OLAP?

Page 12: Data Warehouse Janeiro/2013 Ceça Moraes cecafac@gmail.com.

12

O que é o Data Warehouse?

• “Coleção de dados orientada a assunto, integrada, não-volátil e variante no tempo, utilizada para tomada de decisões”.–W. H. Inmon

• "a copy of transaction data specifically structured for query and analysis"–R. Kimball

Page 13: Data Warehouse Janeiro/2013 Ceça Moraes cecafac@gmail.com.

13

O que é o Data Warehouse?

• “Repositório estruturado e corporativo de dados orientados a assunto, variantes no tempo e históricos, usados para recuperação de informações e suporte à decisão. O DW armazena dados atômicos e sumarizados”.– Definição de DW da Oracle

• Nossa: DW é uma base de dados que facilita a execução de consultas de apoio à decisão

Page 14: Data Warehouse Janeiro/2013 Ceça Moraes cecafac@gmail.com.

14

Propriedades de um DW

Page 15: Data Warehouse Janeiro/2013 Ceça Moraes cecafac@gmail.com.

15

Alterações no DW

Page 16: Data Warehouse Janeiro/2013 Ceça Moraes cecafac@gmail.com.

16

Conceitos e Terminologia de SDW

• O que é Banco de Dados Multidimensional?• O que é Data Warehouse (DW)?• O que é Data Mart (DM)?• O que são ETL e ODS?• O que é Data Warehousing(DWing)?• O que são Sistemas de DW e OLAP?

Page 17: Data Warehouse Janeiro/2013 Ceça Moraes cecafac@gmail.com.

17

O que é Data Mart (DM)?

• DM é um subconjunto de um DW– Subconjunto do DW que satisfaz os requisitos de

um certo tema ou atividade de negócio– Projetado para um dado grupo de usuários

• Pode ser construído antes ou depois do DW• Antes fragmentos de dados⇒• Depois produzem juntos uma visão ⇒

integrada dos dados

Page 18: Data Warehouse Janeiro/2013 Ceça Moraes cecafac@gmail.com.

18

Movendo Dados de um DW para DM

• Vantagens– Dados totalmente

integrados antes

• Desvantagens– Pode ser mais complexo,

custoso e demorado

Page 19: Data Warehouse Janeiro/2013 Ceça Moraes cecafac@gmail.com.

19

Movendo Dados dos DM para o DW

• Vantagens– Mais simples e rápido– Integração de dados

específicos de cada departamento

• Desvantagens– Duplicação de dados– Data Marts podem ter

dados incompatíveis

Page 20: Data Warehouse Janeiro/2013 Ceça Moraes cecafac@gmail.com.

20

Data Mart

• Benefícios– Tempo e dificuldade de implantação minimizados– São mais facilmente entendidos– Consultas mais rápidas e com menor número de

usuários e menor volume de dados• Importante– Garantir a consistência dos dados

• Mudanças nos dados das fontes podem gerar necessidade de atualização dos DM

Page 21: Data Warehouse Janeiro/2013 Ceça Moraes cecafac@gmail.com.

21

Data Mart

• Razões Adicionais para Criação de DM– Permitir aos usuários, acesso aos dados que eles

analisam mais frequentemente– Menor tempo de resposta por causa da redução

do volume de dados acessados– DM são mais facilmente extraídos,

transformados,carregados e integrados• Implementação de DM é mais simples do que de um

DW inteiro• Custo de implementação de DM é também menor

Page 22: Data Warehouse Janeiro/2013 Ceça Moraes cecafac@gmail.com.

22

DW x DM

Page 23: Data Warehouse Janeiro/2013 Ceça Moraes cecafac@gmail.com.

23

Conceitos e Terminologia de SDW

• O que é Banco de Dados Multidimensional?• O que é Data Warehouse (DW)?• O que é Data Mart (DM)?• O que são ETL e ODS?• O que é Data Warehousing(DWing)?• O que são Sistemas de DW e OLAP?

Page 24: Data Warehouse Janeiro/2013 Ceça Moraes cecafac@gmail.com.

24

ETL e ODS (Staging)

• ETL = Extraction, Transformation and Load

• Ferramentas de ETL– Responsáveis pela conversão dos dados do

ambiente operacional para o de suporte à decisão– Realizam Acesso, Extração, Limpeza,

Transformação, Validação e Carga dos dados

Page 25: Data Warehouse Janeiro/2013 Ceça Moraes cecafac@gmail.com.

25

ETL e ODS (Staging)

• Operational Datastore (ODS) ou Staging• Repositório de dados operacionais integrados– Intermediário entre as fontes de dados e o DW

• Benefícios– Otimiza a criação do DW– Possibilita a realização de consultas relacionais

sobre todos dados históricos

Page 26: Data Warehouse Janeiro/2013 Ceça Moraes cecafac@gmail.com.

26

ETL e ODS• Abordagem Top-Down (DW DMs)⇒• Visão DW corporativo– Grande abrangência

Page 27: Data Warehouse Janeiro/2013 Ceça Moraes cecafac@gmail.com.

27

ETL e ODS• Abordagem Botton-Up (DMs DW)⇒• Visão DW departamental– Probabilidade de ilhas de dados• Pode acontecer dos DM não se integrarem

Page 28: Data Warehouse Janeiro/2013 Ceça Moraes cecafac@gmail.com.

28

Conceitos e Terminologia de SDW

• O que é Banco de Dados Multidimensional?• O que é Data Warehouse (DW)?• O que é Data Mart (DM)?• O que são ETL e ODS?• O que é Data Warehousing (DWing)?• O que são Sistemas de DW e OLAP?

Page 29: Data Warehouse Janeiro/2013 Ceça Moraes cecafac@gmail.com.

29

Data Warehousing

• Processo de criação e manutenção do DW

Page 30: Data Warehouse Janeiro/2013 Ceça Moraes cecafac@gmail.com.

30

Data Warehousing• Processo de construção do DW como uma base de dados

dimensional

Page 31: Data Warehouse Janeiro/2013 Ceça Moraes cecafac@gmail.com.

31

Data Warehousing

Page 32: Data Warehouse Janeiro/2013 Ceça Moraes cecafac@gmail.com.

32

Conceitos e Terminologia de SDW

• O que é Banco de Dados Multidimensional?• O que é Data Warehouse (DW)?• O que é Data Mart (DM)?• O que são ETL e ODS?• O que é Data Warehousing(DWing)?• O que são sistemas de DW e OLAP?

Page 33: Data Warehouse Janeiro/2013 Ceça Moraes cecafac@gmail.com.

33

Sistemas de DW/OLAP• Possuem Front end• Permitem que usuários naveguem nos

diferentes níveis de detalhes sobre os dados– Dados são organizados no DW por meio de

modelagem dimensionais– Resultados de consultas são interpretados em

uma variedade de visões multidimensionais• Consultas são providas pelas ferramentas OLAP (On-

Line Analytical Processing)

Page 34: Data Warehouse Janeiro/2013 Ceça Moraes cecafac@gmail.com.

34

Consultas no DW

Page 35: Data Warehouse Janeiro/2013 Ceça Moraes cecafac@gmail.com.

35

Consultas no DW

Page 36: Data Warehouse Janeiro/2013 Ceça Moraes cecafac@gmail.com.

36

Sistemas de DW

• Principais objetivos dos Sistemas de DW– Tornar a informação da organização facilmente

acessível– Exibir a informação de forma consistente– Ser adaptativo e acomodar facilmente mudanças– Servir de base para a tomada de decisão– Satisfazer as necessidades de análise dos usuários– Garantir a segurança das informações mantidas no

DW

Page 37: Data Warehouse Janeiro/2013 Ceça Moraes cecafac@gmail.com.

37

Sistemas de DW

• Responsabilidades do administrador do Sistema de DW– Identificar que decisões seus usuários desejam

tomar– Escolher o subconjunto de dados a ser mantido

pelo DM– Monitorar a precisão dos dados e dos relatórios

gerados– Garantir interfaces e aplicações sejam simples de

usar

Page 38: Data Warehouse Janeiro/2013 Ceça Moraes cecafac@gmail.com.

38

Sopa de Letrinhas

Page 39: Data Warehouse Janeiro/2013 Ceça Moraes cecafac@gmail.com.

39

Bibliografia

• Data Warehousing, Data Mining & OLAP, Alex Berson, Stephen J. Smith. McGraw-Hill

• The Data Warehouse Toolkit. Ralph Kimball, Margy Ross. John Wiley & Sons, Inc.

• Data Warehouse Brasil (http://www.dwbrasil.com.br/)• Artigos de Kimball (

http://www.ralphkimball.com/html/articles.html)• Data Warehousing Institute (

http://www.dw-institute.com/)• OLAP Report - (http://www.olapreport.com/)