Implantação de um Data Warehouse para Acompanhamento de...

23
Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014 Implantação de um Data Warehouse para Acompanhamento de Desempenho dos Cursos em uma Instituição de Ensino Superior Deploying a Data Warehouse for Performance Monitoring Course in an Institution of Higher Education Implementación de un Data Warehouse para la Supervisióndel Rendimiento de los Cursos en una Institución de EducaciónSuperior Edgar Luiz de Lima Júnior 1 Fabrício Pires Vasconcellos 2 Rodrigo Vitorino Moravia 3 Resumo: Este artigo tem como objetivo apresentar a implantação um Data Warehouse em uma Instituição de Ensino Superior de Belo Horizonte para o auxílio em seu planejamento estratégico. Foi desenvolvido um modelo dimensional com uma base intermediária, rotinas de tratamento de extração, transformação e limpeza dos dados extraído do Excel, além da ferramenta Web, onde os usuários podem gerar relatórios on-line conforme a necessidade. Palavras-chave: Data Warehouse (DW). Extração, Transformação e Carga (ETL). On-Line Analytical Processing (OLAP). Abstract: This article aims to present a Data Warehouse deployment in an Institution of Higher Education in Belo Horizonte to aid in their strategic planning. A dimensional model was developed with an intermediate base handlers extraction, processing and cleaning of extracted data from Excel, plus web tool where users can generate on-line reports as needed. Keywords: Data Warehouse (DW). Extract, Transform, Load (ETL). On-Line Analytical Processing (OLAP). Resumen: Este artículo tiene como objetivo presentar undespliegue de Data Warehouseen una Institución de Educación Superior en Belo Horizonte para ayudaren suplanificación estratégica. Un modelo tridimensional se hadesarrolladocon una extracción manejadores de bases intermedias, elprocesamiento y lalimpieza de losdatos extraídos de Excel, además de laherramienta web donde losusuariospuedengenerar informes on-line, segúnseanecesario. Palabras clave: Data Warehouse (DW). Extracción, Transformación y Carga (ETL). On-Line Analytical Processing (OLAP). 1 - INTRODUÇÃO Constitui-se tema deste artigo a implantação de um Data Warehouse em uma Instituição de Ensino Superior no qual os diretores e coordenadores não possuem informações históricas sobre o desempenho dos cursos. Devido à expansão e popularização da tecnologia em geral, a sociedade ficou conhecida como a sociedade da informação e, ao elencar características a ela pertinentes, mencionam o fenômeno do caos informacional. Nunca havia se observado um contexto no qual as informações surgem e são disseminadas de modo 1 Graduando do curso Bacharelado em Sistemas de Informação pela Faculdade Infórium de Tecnologia. [email protected] 2 Mestre em Sistemas de Informação e Gestão do conhecimento pela Fundação Mineira de Educação e Cultura. Professor da Faculdade Infórium de Tecnologia. [email protected] 3 Especialista em Gestão da Informação pelo Instituto de Educação Continuada da Pontifícia Universidade Católica de Minas Gerais. Professor da Faculdade Infórium de Tecnologia. [email protected]

Transcript of Implantação de um Data Warehouse para Acompanhamento de...

Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014

Implantação de um Data Warehouse para Acompanhamento de Desempenhodos Cursos em uma Instituição de Ensino Superior

Deploying a Data Warehouse for Performance Monitoring Course in an Institution ofHigher Education

Implementación de un Data Warehouse para la Supervisióndel Rendimiento delos Cursos en una Institución de EducaciónSuperior

Edgar Luiz de Lima Júnior1

Fabrício Pires Vasconcellos2

Rodrigo Vitorino Moravia3

Resumo: Este artigo tem como objetivo apresentar a implantação um Data Warehouse em umaInstituição de Ensino Superior de Belo Horizonte para o auxílio em seu planejamento estratégico. Foidesenvolvido um modelo dimensional com uma base intermediária, rotinas de tratamento de extração,transformação e limpeza dos dados extraído do Excel, além da ferramenta Web, onde os usuáriospodem gerar relatórios on-line conforme a necessidade.Palavras-chave: Data Warehouse (DW). Extração, Transformação e Carga (ETL). On-Line AnalyticalProcessing (OLAP).

Abstract: This article aims to present a Data Warehouse deployment in an Institution of HigherEducation in Belo Horizonte to aid in their strategic planning. A dimensional model was developed withan intermediate base handlers extraction, processing and cleaning of extracted data from Excel, plusweb tool where users can generate on-line reports as needed.Keywords: Data Warehouse (DW). Extract, Transform, Load (ETL). On-Line Analytical Processing(OLAP).

Resumen: Este artículo tiene como objetivo presentar undespliegue de Data Warehouseen unaInstitución de Educación Superior en Belo Horizonte para ayudaren suplanificación estratégica. Unmodelo tridimensional se hadesarrolladocon una extracción manejadores de bases intermedias,elprocesamiento y lalimpieza de losdatos extraídos de Excel, además de laherramienta web dondelosusuariospuedengenerar informes on-line, segúnseanecesario.Palabras clave: Data Warehouse (DW). Extracción, Transformación y Carga (ETL). On-Line AnalyticalProcessing (OLAP).

1 - INTRODUÇÃO

Constitui-se tema deste artigo a implantação de um Data Warehouse em uma

Instituição de Ensino Superior no qual os diretores e coordenadores não possueminformações históricas sobre o desempenho dos cursos.

Devido à expansão e popularização da tecnologia em geral, a sociedade ficou

conhecida como a sociedade da informação e, ao elencar características a elapertinentes, mencionam o fenômeno do caos informacional. Nunca havia se

observado um contexto no qual as informações surgem e são disseminadas de modo

1 Graduando do curso Bacharelado em Sistemas de Informação pela Faculdade Infórium de [email protected] Mestre em Sistemas de Informação e Gestão do conhecimento pela Fundação Mineira de Educação e Cultura.Professor da Faculdade Infórium de Tecnologia. [email protected] Especialista em Gestão da Informação pelo Instituto de Educação Continuada da Pontifícia Universidade Católicade Minas Gerais. Professor da Faculdade Infórium de Tecnologia. [email protected]

Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014

tão rápido entre seus usuários, ainda que haja grandes distâncias entre eles. Os

indivíduos podem buscar e acessar informações dos mais variados tipos, porém, porexistir tantas informações oriundas de múltiplas fontes, os usuários se veem diante do

desafio de se manter atualizados em meio a esse caos informacional, em uma

sociedade cujo ritmo de vida é acelerado.

Quando se tem informações antes dos concorrentes, é possível inovar e

surpreender as expectativas dos clientes, desta forma, aumenta a probabilidade de

fazer com que a empresa se torne referência de mercado no segmento em questão,tendo assim um diferencial de sucesso (BARBIERI, 2001).

A informação por si só não é um diferencial competitivo para as organizações,

depende da forma como é utilizada. Uma empresa pode ser diferenciada em relaçãoaos seus concorrentes quando consegue obter algum tipo de diferença ou vantagem

que possa ser comparada e sustentada. Uma das formas de obter essa vantagem é

através do rastreamento de informações disponíveis que auxilie a empresa a alcançarum percentual maior de mercado no seu ramo de atuação.

Com tantas informações e observando-se que estas mudam constantemente,

um dos problemas que as organizações enfrentam na era da informação é a forma deorganizar tantos dados para, enfim, transformá-los em informações úteis, relevantes

e estratégicas para o negócio. Dentre as possíveis opções de tecnologias para auxiliar

o gerenciamento e organização destas informações, o Data Warehouse, tambémconhecido como DW, está na listagem como um dos candidatos, por se tratar de uma

cópia dos dados transacionais, estruturado para relatórios de análise de nível

gerencial.

Com um recurso de permitir que seus usuários unifiquem dados obtidos

externamente à organização com os dados internos da empresa, para a mesma base

de análises, o Data Warehouse vem se destacando no mercado e sendo utilizado emdiversas organizações.

O Data Warehouse visa automatizar e melhorar os processos relacionados à

tomada de decisão, o uso desta ferramenta nas organizações de pequeno, médio ougrande porte, possibilita a realização de diversas análises e projeções, podendo

estimar as previsões de crescimento da empresa e contribuir para a elaboração de

estratégias (PRIMAK, 2008).

Assim, delimitou-se o tema deste artigo a criação de um Data Warehouse para

o acompanhamento de desempenho de cursos em uma instituição de ensino superior.

Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014

A pergunta norteadora deste estudo é no sentido de investigar como a

implantação de um Data Warehouse pode influenciar uma Instituição de EnsinoSuperior no seu planejamento estratégico.

O objetivo geral é apresentar como se realizou a implantação de um Data

Warehouse em uma Instituição de Ensino Superior de Belo Horizonte para o auxílioem seu planejamento estratégico. São objetivos específicos: definir e conceituar Data

Warehouse; implantar uma solução para o auxílio ao planejamento estratégico da

Instituição de Ensino Superior.

A relevância deste estudo trabalho consiste em mostrar como o Data

Warehouse na instituição auxiliará os tomadores de decisão, além dos coordenadores

de cursos com informações históricas sobre o desempenho dos cursos dentro dainstituição, facilitará o planejamento estratégico da mesma.

A pesquisa bibliográfica, fontes secundárias, tem como base em autores tais

como Barbieri, (2001); Primak (2008), e pesquisa documental é baseado naMicrostrategy e Microsoft.

Para compreensão deste tema dividiu-se este artigo em nove seções. A seção

1, esta introdução, e indicativa do estudo; a seção 2 apresenta o Data Warehouse; aseção 3 aborda a modelagem de dados para Data Warehouse; a seção 4 trata

extração, transformação e carga dos dados; a seção 5 apresenta a On-Line Analytical

Processing; a seção 6 aborda o Data Warehouse como estratégia competitiva; aseção 7 apresenta a implantação prática de um Data Warehouse em uma instituição

de ensino superior de Belo Horizonte; a seção 8 elabora a discussão referente a

implantação do Data Warehouse; a seção 9, tece as conclusões do artigo.

2 - DATA WAREHOUSE

O termo Data Warehouse (DW) foi criado por Willian H. Inmon, no início da

década de 1990 e é definido por uma série de autores conforme quadro 1:

O conceito de DW objetiva a definição de uma base de dados preparada em

vários níveis de granularidade. A ideia via DW é armazenar os dados em vários graus

de relacionamento e sumarização, de forma a facilitar e agilizar os processos de

tomada de decisão por diferentes níveis gerenciais.

Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014

Quadro 1 - Definições de Data Warehouse.

Autor: Definição:

Peterson, (2001, p.

65)

“Um Data Warehouse é organizado em áreas funcionais e fornece uma

perspectiva histórica sobre operações corporativas.O Data Warehouse

também é uma origem de dados. Como seus dados já foram unificados,

homogeneizados e limpos, eles frequentemente são a melhor origem de

dados para análise de negócio.“

Barbieri, (2001, p. 49) “Pode ser definido como um banco de dados, destinado a sistemas de apoio

à decisão. “

Gomes e Ribeiro,

(2004, p. 191)

“[...] é um repositório central para todos os tipos significativos de dados que

vários sistemas de negócios de uma empresa coletam.“

Primak, (2008, p. 5) “[...] é uma grande base de dados, ou seja, um repositório único de dados

(os quais foram consolidados e organizados) considerado pelos

especialistas da área da informática como a "peça" essencial para a

execução prática de um projeto de Business Intelligence.“

Fonte: elaboração do autor

O ambiente de um DW tem como objetivo produzir informações que deverão

atender às necessidades de seus usuários. (ROSINI:PALMISANO, 2003). Observa-

se que o DW é definido pelos autores como um repositório de dados estratégicos para

o auxílio da tomada de decisão.

3 - MODELAGEM DE DADOS PARA DATA WAREHOUSE

O DW é orientado por assunto, integrado, variante no tempo e não volátil, para

modelagem de dados quando utiliza-se o modelo dimensional.

O modelo dimensional, conforme Barbieri (2001), é formado por tabelas Fato e

tabelas de Dimensão. Esse modelo modifica alguns conceitos que estavam

cristalizados nos projetos tradicionais de Banco de Dados, como por exemplo, a

ordem de distribuição de campos por entre as tabelas, permitindo assim que a

estrutura seja mais voltada para os muitos pontos de entradas específicos, conhecidos

como Dimensão, e menos para os dados granulares em si, conhecidos como Fatos.

Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014

Na figura 1, está representado no modelo dimensional um sistema de vendas

a varejo. Neste modelo tem-se uma tabela Fato chamada Vendas, que tem como

métrica os campos quantidade vendida e o valor em reais. Outra tabela Fato chamada

Estoque que tem como métrica a quantidade em estoque. E ainda seis tabelas de

Dimensão: Tempo, Produto, Loja, Promoção, Atendente e Nota Fiscal.

Figura 1 - Exemplo de um modelo Dimensional.

Fonte: BARBIERI, Carlos. B. Business intelligence:modelagem e tecnologia. Rio de Janeiro: AxcelBooks, 2001

Esse é o conceito de modelo Dimensional, que possui as entradas de acesso,

as tabelas de Dimensão, e as tabelas Fatos contendo os fatos que são relevantes.

Dessa forma é possível acessar as métricas desejadas, combinando atributos das

diversas dimensões, de uma forma objetiva e direta (BARBIERI, 2001).

O Esquema Estrela ”[...] é o formato mais eficiente para armazenar dados

utilizados para análise do negócio.” (PETERSON, 2001, p. 71) O Esquema Estrela

recebe este nome, pela sua aparência e é composto por uma tabela Fato central e um

conjunto de tabelas de Dimensão. Nas Tabelas Fatos, são armazenados os fatos que

serão analisados, e nas tabelas de Dimensão estão contidas todas as perspectivas

pelas quais os fatos serão analisados.

Para Peterson (2001, p.78) “a tabela de Fato é o coração do esquema em

estrela”, o autor acrescenta, que corresponde à tabela central que armazena um

conjunto de medidas numéricas, que estão associadas a eventos de negócio.

Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014

Nesse sentido Barbieri (2001, p.81), assinala que “[...] uma tabela Fato contém

vários fatos, correspondentes a cada uma de suas linhas.” Em cada fato pode ser

armazenado uma ou mais medidas numéricas, que representa os valores objetos da

análise dimensional.

A tabela de Fatos não possui um campo separado para uma chave primária,

ela é formada pela composição de todas as chaves estrangeiras das tabelas

Dimensão. Nas tabelas de Fatos, os registros nunca são atualizados a menos que

seja necessário corrigir um erro, ou fazer uma alteração. Os registros da tabela de

fatos nunca são excluídos exceto quando registros antigos estão sendo arquivados.

Exemplificando os valores de medidas que podem ser colocadas em uma

tabela de Fato: o número total de itens vendidos; a quantidade monetária da venda; o

lucro sobre o item vendido (BARBIERI, 2001). Na figura 2 foram utilizadas como

valores de medidas: Vendas, Comissão e Desconto.

Figura 2 - Valores de medidas da tabela de fatos

.Fonte: ROCHA, Reydeval. Introdução ao

Analysis Services 2005. Disponívelem <http://www.devmedia.com.br/introducao-ao-analysis-services-2005-parte-2/5730> Acesso em: 08 abr. 2014

As tabelas Dimensão, para Barbieri (2001, p.81), representam as entidades de

negócios e constituem as estruturas de entrada que servem para armazenar

informações como tempo, geografia, produto, cliente, etc.” As tabelas de Dimensão

são quase sempre muito pequenas, e armazenam um número significativamente

menor de linhas do que as tabelas Fato. Comparado à tabela Fatos que sempre tem

mais registros sendo adicionados a ela, as tabelas de Dimensão são relativamente

Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014

estáveis. Algumas delas como a dimensão de tempo raramente são alteradas após a

sua criação.

Em uma tabela de Dimensão, a chave primária deve ser um campo único com

um tipo de dados inteiro, afirma Peterson (2001). O autor também enfatiza que em um

esquema em estrela quase sempre há uma dimensão de tempo.

A dimensão de Tempo, para Barbieri (2001), é necessária em projetos de DW

onde a evolução dos dados históricos é fundamental. Em um DW, segundo Barbieri

(2001, p. 94), as informações são reunidas com relação a períodos particulares de

tempo. Cada dado vai refletir o seu próprio estado em diferentes momentos no tempo.

Em uma dimensão de tempo, a hierarquia pode ser agregada de diversas

maneiras. O nível mais baixo da hierarquia de tempo pode ser definido de diferentes

formas, variando, por exemplo, de ano, trimestre, mês e dia, conforme exemplificado

na figura 3.

Figura 3 - Dimensão Tempo.

Fonte: BARBIERI, Carlos. B. Business intelligence:modelagem e tecnologia. Rio de Janeiro: AxcelBooks, 2001

4 - EXTRAÇÃO, TRANSFORMAÇÃO E CARGA

A etapa de Extração, Transformação e Carga, do inglês Extract, Transform,

Load (ETL) é uma das mais críticas de um projeto de DW, pois envolve a fase de

movimentação dos dados.

Os sistemas chamados de ETL, conforme Primak (2008), são fundamentais

para preparar os dados que serão armazenados no DW. Embora atualmente já

Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014

existam produtos que facilitem esse trabalho, este ainda é um processo trabalhoso,

detalhado e complexo, e que requer expertise para ser executado de forma adequada

e correta.

Os dados, afirma Rezende (2003), podem apresentar problemas advindos do

processo de coleta, estes problemas podem ser erros de digitação ou erro na leitura

dos dados pelos sensores. O uso de técnicas de limpeza deve ser aplicado aos dados

para garantir a qualidade. A qualidade dos dados é um fator essencial, pois,

possivelmente o resultado do processo de extração será utilizado em um processo de

tomada de decisão.

O Structured Query Language (SQL) Server Integration Services (SSIS), de

acordo com Ramalho (2005), é uma plataforma utilizada para construir aplicações de

integração de dados, que inclui as tarefas conhecidas do pacote ETL para projetos em

DW. Além de conectar-se a diversas fontes de dados, com o SSIS é possível fazer a

extração dos dados e misturar os diversos formatos de dados em um único formato.

A figura 4 mostra como normalmente o SSIS é utilizado. Os dados de vários

bancos de dados, incluindo o SQL Server 2008, podem ser combinados com dados

de outras fontes (RAMALHO, 2005).

Figura 4 - Descrevendo o Server Integration Services(SSIS)

Fonte: Adaptado de:MICROSOFT. Entendendo as tecnologias deIntegração Microsoft. [Redmond], 2005.Disponível em <http://msdn.microsoft.com/pt-br/library/ms864809%28v=bts.10%29.aspx#XSLTsection128121120120> Acesso em: 3 out.2013

Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014

Em alguns casos, faz-se necessário a limpeza dos dados, para garantir a

padronização dos dados. Como exemplo, formatos de datas. Em uma fonte de dados

pode-se ter o formato da data dd/mm/yyyy, em outras fontes de dados pode-se ter o

formato da data como 2 de maio de 2014 (RAMALHO, 2005).

Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014

5 - ON-LINE ANALYTICAL PROCESSING (OLAP)

O termo On-Line Analytical Processing (OLAP) foi citado pela primeira vez em

um artigo escrito por Edgar Frank Codd em 1992. Refere-se a um conjunto de

ferramentas voltadas para acesso e análise ad-hocde dados, com o objetivo de

possibilitar que analistas, gerentes e executivos consigam transformar dados em

informações de forma rápida, consistente, amigável e flexível, em tempo hábil,

capazes de dar suporte às decisões gerenciais.

Além disso, do ponto de vista de Peterson (2001), o OLAP, é uma ferramenta

de software interativa de geração de relatórios, que apresenta, para os analistas,

diversas visualizações distintas de uma planilha.

A característica principal das ferramentas OLAP, conforme Primak (2008), é

permitir realizar diversas análises dinâmicas e multidimensionais dos dados, apoiando

o usuário final nas suas atividades. Elas possuem uma série de visões, como por

exemplo, as consultas ad-hoc, onde o próprio usuário consegue gerar consultas de

acordo com suas necessidades de cruzamento dos dados e de uma forma diferente

da usual, que o leva a obter as respostas desejadas. Considerada para Inmon (1999)

como consultas casuais únicas, onde os dados são tratados com parâmetros nunca

antes utilizados. Umas das técnicas possibilitadas pelo OLAP é o Drill Down e Drill

UP, que consiste em fazer uma exploração em diferentes níveis de detalhe das

informações. Com essa técnica, o usuário pode “subir ou descer na hierarquia” dentro

do detalhamento do dado conforme figura 5.

Figura 5 - Representação Drill Down e Drill UP

Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014

Fonte: BARBIERI, Carlos. B. Businessintelligence: modelagem e tecnologia.Rio de Janeiro: Axcel Books, 2001. p. 42.

6 - DATA WAREHOUSE COMO ESTRATÉGIA COMPETITIVA

A ideia básica de Inteligência Competitiva conforme Barbieri (2001) é obter

informações detalhadas sobre o mercado e os concorrentes. A Inteligência

Competitiva é também um Business Intelligence (BI) aplicado ao mundo fora da

fronteira empresarial, que tem o foco em informações e fatos. As empresas hoje

sentem cada vez ma is a necessidade de aperfeiçoar o processo de análise de dados

que possuem armazenados.

Este crescente número de informações pode ser interpretada como um

mal no universo empresarial e dificulta o processo de tomada de decisão, uma vez

que os gestores se sentem impotentes no processo de busca e recuperação dos

dados, que podem ser definido a como um conjunto de registros qualitativos ou

quantitativos que estão organizados e agrupados. Os dados em si não possuem um

significado nem relevância, porém, aplicados ao contexto correto são importantes, pois

é possível obter informação.

Há de se destacar que para Primak (2008), organizações de pequeno, médio

ou grande porte, precisam de ferramentas que as auxilie nas mais diferentes situações

para tomada de decisão, além de propiciar otimização do trabalho, redução de custos,

eliminação de tarefas duplicadas, e permitir previsões de crescimento da empresa e

dessa forma contribuir para a elaboração de estratégias. O que está em foco é a

necessidade do mercado e não o porte da empresa.

Enfatizam no entanto Leonard e Swap (2003), Inteligência Analítica é a

capacidade de analisar ideias e tomar decisões com base na análise feita. Mesmo

com ferramentas disponíveis que são consideradas decisivas, alguns autores

consideram até mais importante que a tecnologia, como afirmam Davenport e Prusak

(1998), são as pessoas que fazem com que a inteligência analítica funcione.

Isso porque, conforme Primak (2008), tomar uma decisão em uma organização

requer muito mais que saber utilizar um software. Por mais que uma organização

disponha de uma ferramenta com diversas funções, de nada adiantará se as pessoas

continuarem a tomar decisões ou simplesmente chegarem a conclusões baseadas em

suas experiências e no seu próprio conhecimento. Prossegue o autor afirmando que ,

para a implementação efetiva de uma solução de BI, a condição considerada por

Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014

grande parte dos analistas de mercado como essencial é a de existir um repositório

único de dados que seja sólido e confiável, ou seja, o DW. Isso porque com o DW é

possível obter uma visão única, além de poder tomar decisões com base em

informações precisas e consistentes em uma única base.

O mercado de Ensino Superior está ficando cada vez mais difícil e competitivo

e, hoje em dia, ter a informação correta no menor tempo possível, tomar decisões

eficazes, adequar-se às oscilações financeiras e antecipar-se às necessidades dos

seus clientes, é o grande diferencial para as empresas que querem se manter à frente

no mundo dos negócios.

7 - IMPLANTAÇÃO PRÁTICA DE UM DATA WAREHOUSE EM UMAINSTITUIÇÃO DE ENSINO SUPERIOR DE BELO HORIZONTE

A implantação do Data Warehouse iniciou-se no mês de abril de 2013 com o

levantamento dos dados junto a Instituição de Ensino Superior (IES) de Belo

Horizonte que possui quatro cursos superiores, concretizando os acessos aos dados

no mês de agosto de 2013.

Verifica-se que os tomadores de decisão, além dos coordenadores de cursos

desta Instituição de Ensino Superior não possuem informações históricas sobre o

desempenho dos cursos dentro da instituição, o que dificulta o planejamento

estratégco da mesma.

Constata-se que a tecnologia de Business Intelligence tem apresentado forte

adesão pelas organizações que desejam obter um suporte à tomada de decisão e,

cada vez mais, querem estas informações em tempo real, a qualquer hora e lugar.

A seguir, descreve-se os passos para criação, desenvolvimento, testes e

implantação de um Data Warehouse em uma Instituição de Ensino Superior (IES).

1º) PASSO

Com base no levantamento realizado em abril de 2013 foi proposto e aprovado

o modelo dimensional Estrela como metodologia de modelagem, formado por uma

tabela Fato no centro chamada acompanhamento_cursos, e por um conjunto de 6

Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014

tabelas de Dimensão, como aluno, curso, período, semestre e situação que estão

ligadas à tabela Fato conforme pode ser visto na figura 6.

Figura 6 - Esquema do modelo dimensional Estrela

Fonte: dados da pesquisa

Na tabela Fato acompanhamento_cursos, foram definidas as chaves das

dimensões que fazem parte da composição do seu layout (cod_aluno, cod_curso,

num_semestre_ano, cod_periodo, cod_situacao, cod_turno e f_qtd_aluno). A chave da

tabela Fato acompanhamento_cursos é uma composição de todas as chaves primárias

das tabelas de Dimensão que se relacionam com a tabela Fato, o que garante a

integridade referencial entre a tabela Fato acompanhamento_cursos e cada uma das

tabelas de Dimensão como apresentado por Peterson (2001, p.78).

As métricas foram definidas através da análise do levantamento realizado junto

aos coordenadores, onde foi identificado a necessidade de verificar a quantidade de

alunos matriculados, por curso, por sexo e por período.

Baseado nisso, verificou-se a necessidade de controlar os seguintes

indicadores que foram utilizados como métricas na tabela

Fatoacompanhamento_cursos:Curso;Período;Turno;Aluno;Tipo de aluno;Situação do

aluno no curso;Quantidade de alunos.

Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014

No modelo proposto, as tabelas de Dimensão definidas foram: aluno, curso,

periodo, semestre e situação.

Acrescenta-se que esta é a parte onde mais gasta tempo para fazer e definir

essa modelagem. A esse respeito Barbieri (2001) enfatiza que é uma parte crítica do

projeto, uma vez que alterações nas estruturas das tabelas principalmente as tabelas

Fato que comparadas às tabelas de Dimensão possuem um volume maior de dados,

pode representar problemas de manutenção no projeto.

2º) PASSO

Com o auxílio de um funcionário da IES, as informações foram exportadas do

sistema acadêmico da IES, através de relatórios interno do sistema acadêmico para

arquivos com valores separadores por vírgulas.(fig.7).

Figura 7 - Tela de arquivos do tipo Arquivos Separados por Vírgula

Fonte: dados da pesquisa

Na figura 8 é apresentada a planilha Excel com todos os dados disponibilizados

pela IES que possuíam informações concentradas em uma única coluna, como por

exemplo, o semestre, turno e período, estavam na mesma coluna.

Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014

Figura 8 - Tela de conteúdo dos dados disponibilizados pela IES

Fonte: dados da pesquisa

Estes arquivos, não apresentam um dicionário de dados para ajudar na

extração dos dados. Algumas colunas foram identificadas, conforme o conhecimento

do funcionário da IES, e várias colunas, as informações não aparentam ter nenhum

sentido, não foi possível decifrar o que cada coluna representava, conforme pode ser

visto na figura 8.

Apresenta- se na figura 9 todos os dados após o processo de limpeza dos

dados, como por exemplo, o semestre, turno e período, foram separados em colunas

distintas.

Figura 9 - Tela de conteúdo dos dados disponibilizados pelaIES após a limpeza dos dados.

Fonte: dados da pesquisa

Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014

A carga dos dados foi feita somente uma vez para as tabelas de Dimensão.

Como os dados que foram obtidos estavam no formato separado por virgulas,

utilizou-se o SSIS para uma simples leitura destes arquivos, definindo quais colunas

deveriam ser carregadas destes arquivos e para qual coluna das respectivas tabelas

deveriam ser destinadas, (fig. 10). Os dados, como em todo projeto de DW, não

sofrem alterações.

Figura 10 - Tela de rotina de leitura dos dados ferramenta SSIS

Fonte: dados da pesquisa

O processo de ETL foi bastante complexo e os problemas que ocorreram foram,

a falta de um dicionário de dados para identificação das colunas que seriam

carregadas. Algumas colunas foram identificadas, conforme o conhecimento do

funcionário da IES, e várias colunas, as informações não aparentam ter nenhum

sentido, não foi possível decifrar o que cada coluna representava.

3º) PASSO

A ferramenta OLAP escolhida foi a MicroStrategy, fundada em 1989 por

Michael J. Saylor. AMicroStrategy é uma empresa de consultoria focada em soluções

para suporte à decisão, desenvolvedora da ferramenta OLAP utilizada no projeto. Isto

por possuir uma interface similar ao Windows, tornou-se uma ferramenta de geração

Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014

de relatórios, análises e monitoramento dos negócios, altamente interativa, intuitiva e

de fácil utilização pelos usuários finais.

A figura 11 mostra a tela do administrador, onde é possível monitorar e

administrar todos os usuários.

Figura 11 - Tela do Administrador.

Fonte: dados da pesquisa

A estrutura hierárquica das pastas é apresentada na figura 12. A pasta

Relatórios Compartilhados, mostra os relatórios gerados e que são compartilhados

com os demais usuários com acesso ao respectivo DW.

Figura 12 - Tela de estrutura hierárquica da pasta Relatórios Compartilhados.

Fonte: dados da pesquisa

Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014

Os relatórios de gráficos que atigiram o objetivo para o auxílio dos tomadores

de decisão, além dos coordenadores de cursos desta Instituição de Ensino Superior

para a utilização no planejamento estratégico com informações históricas sobre o

desempenho dos cursos dentro da instituição são apresentados na figura 13 e 14.

Figura 13 - Tela de relatório de gráficos (Alunos X Curso).

Fonte: dados da pesquisa

Figura 14 - Tela do relatório de gráficos (Situação de alunos por curso).

Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014

Fonte: dados da pesquisa

Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014

8 - DISCUSSÃO SOBRE OS RESULTADOS DE IMPLANTAÇÃO DO DATAWAREHOUSE

Os passos de criação, desenvolvimento, testes e implantação foram

demorados pelo pouco tempo disponível pelos pesquisadores, mas de muita

relevância.

Para atender as necessidades de ETL do projeto, a IES utilizou a ferramenta

SSIS, pois foi considerada adequada devido a sua facilidade de desenvolvimento das

rotinas de carga e também devido ao seu pipeline de transformação de dados,

considerado apto pela facilidade apresentada de transformar o dado em uma única

operação. Estas facilidades não são encontradas nas ferramentas tradicionais.

Sobre a ferramenta OLAP, foi escolhida a ferramenta MicroStrategy, pois

dispõe do recurso de geração de relatórios padronizados e dinâmicos, que podem ser

customizados pelos usuários em momento de execução, possibilitando que possuam

visão específica, graças ao processo de drillup e drilldown. Outra facilidade que foi

levada em consideração no momento da escolha foi a facilidade de adaptação dos

usuários quanto a sua utilização, uma vez que a ferramenta segue o padrão de

usabilidade bem similar ao utilizado pelo Windows.

Os esforços que foram empenhados neste trabalho foram recompensados, já

que foi possível desenvolver todas as etapas de construção de um DW, contribuindo

para a experiência acadêmica do discente, além de prover à instituição um diferencial

competitivo de mercado com uma visão gerencial privilegiada comparando com seus

concorrentes.

9 - CONSIDERAÇÕES FINAIS

O presente trabalho apresentou o processo implantação de um Data

Warehouse em uma Instituição de Ensino Superior de Belo Horizonte para o auxílio

em seu planejamento estratégico e definiu e conceituou o Data Warehouse.

Buscou-se reunir no estudo uma base teórica que permitisse mostrar o formato

do Data Warehouse como um repositório de dados para atender diferentes níveis

gerenciais para tomada de decisão.

Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014

A realização da pesquisa aplicada para a implantação do Data Warehouse na

Instituição de Ensino Superior foi organizada em três etapas, estas denominadas

“passos”. Estas etapas foram realizadas tendo-se a base conceitual e teórica do

estudo como orientadora da implantação do Data Warehouse.

Verificou-se a pertinência teórica apresentada a um caso específico, o Data

Warehouse como ferramenta de auxílio em planejamento estratégico na Instituição de

Ensino Superior.

Como projeto futuro, sugere-se uma pesquisa junto a Instituição de Ensino

Superior dos valores efetivos dos ganhos adquiridos após a implementação e

utilização destes dados pela Instituição, da mesma forma sugere-se um estudo em

relação à ferramenta OLAP MicroStrategy Web utilizada, em relação a outras

ferramentas de software livre (open source).

Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014

REFERÊNCIAS

ANTUNES JUNIOR, Delson. Sistema de apoio a decisão baseado em DataWarehouse para uma indústria química. 2009. Trabalho de Conclusão de Curso(Bacharel) - Universidade do Planalto Catarinense, Lages, 2009. Disponível em: < >.Acesso em: 22 nov. 2013

BARBIERI, Carlos. B. Business intelligence: modelagem e tecnologia. Rio deJaneiro: Axcel Books, 2001

DAVENPORT, Thomas H. e PRUSAK, Laurence. Conhecimento empresarial 14.ed, Rio de Janeiro: Campus, 1998

GOMES, Carlos Francisco Simões; RIBEIRO, Priscilla Cristina Cabral. Gestão dacadeia de suprimentos integrada à tecnologia da informação. São Paulo: PioneiraThomson Learning, 2004.

INMON, W. H.; WELCH, J. D.; GLASSEY, K. L. Gerenciando Data Warehouse.São Paulo: Makron Books, 1999.

KIMBALL, Ralph; ROSS, Margy. The Data Warehouse Toolkit: guia completo paramodelagem dimensional. 2 ed. Rio deJaneiro: Campus, 2002.

LEONARD, Dorothy; SWAP, Walter. Centelhas Incandescentes: estimulando acriatividade em grupos. Porto Alegre: Bookman, 2003.

MICROSOFT. Entendendo as tecnologias de Integração Microsoft. [Redmond],2005. Disponível em <http://msdn.microsoft.com/pt-br/library/ms864809%28v=bts.10%29.aspx#XSLTsection128121120120> Acesso em:3 out. 2013

MICROSTRATEGY. Best in Business Intelligence. Disponível em<http://www.microstrategy.com.br/Company/> Acesso em: 03 out. 2013

PETERSON, Timothy. Microsoft Sql Server 2000 Dts. Rio de Janeiro: Campus,2001.

PRIMAK, Fábio Vinícius. Decisões com B.I Business Intelligence. Rio de Janeiro:Ciência Moderna, 2008

RAMALHO, José Antônio. Microsoft SQL Server 2005: guia prático. Rio de Janeiro:Campus, 2005.

REZENDE, Solange Oliveira. Sistemas Inteligentes: fundamentos e aplicações.Barueri: Manole, 2003.

ROCHA, Reydeval. Introdução ao Analysis Services 2005. Disponível em <http://www.devmedia.com.br/introducao-ao-analysis-services-2005-parte-2/5730>Acesso em: 08 abr. 2014.

Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014

ROSINI, Alessandro Marco; PALMISANO, Ângelo. Administração de sistemas deinformação e a gestão do conhecimento. São Paulo: Pioneira Thomson Learning,2003.