1 Star Schema Benchmark SSB Samara Martins do Nascimento.

Post on 17-Apr-2015

126 views 5 download

Transcript of 1 Star Schema Benchmark SSB Samara Martins do Nascimento.

1

Star Schema BenchmarkSSB

Samara Martins do Nascimento <smn@cin.ufpe.br>

Roteiro TPC

TPC-H SSB Esquema do SSB

Detalhes do Esquema SSBConsultas do Benchmark

Medição de Desempenho Configuração do SSB

2

TPCTransaction Processing Performance

CouncilOrganização fundada em 1985. Define benchmarks de Bancos de Dados.

3

TPC-HUsado para avaliar o desempenho de

consultas em Data Warehouse. Benchmark que define uma aplicação

que armazena dados históricos relativos a pedidos e vendas de uma empresa.

4

5

SSB Usado para avaliar o desempenho de um DW.

Baseado no TPC-H.

Esquema do SSB

Formado a partir do esquema TPC-HLineitem + Order = Lineorder

Excluímos alguns atributos de Lineitem e Order.

Excluímos PartsuppPor causa da granularidade.

Adicionamos a tabela de dimensão Date.

6

Esquema do SSBProposta do SSB

Tabela de Fatos: LineorderTabelas de Dimensão:

Customer, Part, Supplier e Date.

7

8

Esquema do SSBReduzir o número de acesso ao disco.Liberando o buffer.Tenta minimizar a sobreposição de

consultas.

9

Detalhes do Esquema SSBExcluímos a Tabela Partsupp

Devido a granularidadeLineorder = Temporal.Partsupp = Periodica.Transações que adicionam novas linhas

a Lineorder não modificarão Partsupp.

10

Detalhes do Esquema SSBTabela de Fatos Lineorder

CombinamosLineitem e Order do esquema TPC-H.

Excluímos O_Comment, L_CommentConsultas a DW não analisam

comentários.

11

Tabela de Dimensão Part Diminuimos o tamanho de P_Name

55 bytes para 22 bytes.Excluímos P_Comment, com O_Comment

Não usando comentários no DW.

12

Detalhes do Esquema SSB

Tabela de Dimensão SupplierReduzimos o numero de Fornecedores

Não deve haver muitos fornecedores por Cliente

13

Detalhes do Esquema SSB

Tabela de Dimensão DateFoi mantida por se tratar de DW de vendas.

14

Detalhes do Esquema SSB

Consultas do BenchmarkBaseados no conjunto de consultas do

TPC-H.Mas, muitas consultas não podem ser

consideradas dentro do esquema do SSB.

15

Q1Baseada na consulta TPCQ6 do TPC-H.Quantifica a renda a partir da eliminação

de certos descontos da empresa, dada uma porcentagem de produtos enviados em um determinado ano.

16

Consultas do Benchmark

17

Medição do Desempenho

Pode resultar num relatórioQualquer objeto que seja criado para

acelerar o desempenho seja claramente explicado.

18

Os relatórios devem conter:Os planos de consulta;O número de linhas acessadas;O tempo execução da consulta;O tempo da CPU utilizadaE a utilização de entrada e saída

19

Medição do Desempenho

Configuração do SSBO arquivo de configuração do SSB é

chamado dbgen.O dbgen é um robusto gerador de

populações de banco de dados. A linguagem de programação utilizada

é C/C++.

20

Para gerar os arquivos do SSB é necessário utilizar alguns parâmetros.

De acordo com a tabela requisitada, os parâmetros variam.

O dbgen é acessado pelo prompt de comando do sistema operacional.

21

Configuração do SSB

22

É necessário preparar a Base de Dados com antecedência.

Todas as tabelas deverão existir antes de importar os dados que o arquivo gerou para a base.

23

Configuração do SSB

Uma coluna a mais deve ser criada em todas as tabelas do SSB.O arquivo .tbl gerado considera o delimitador

como um campo.

24

Configuração do SSB

25

Para povoar a tabela deve-se executar o comando COPY part FROM 'c://part.tbl' USING

DELIMITERS '|';

26

Configuração do SSB

27

ReferênciasArtigo 2009:

http://www.cs.umb.edu/~poneil/StarSchemaB.pdf

28

29

Samara Martins do Nascimento <smn@cin.ufpe.br>

Star Schema BenchmarkSSB