2. Conceptos de Datawarehousing
-
Upload
chris-fufy-gutierrez -
Category
Documents
-
view
18 -
download
2
description
Transcript of 2. Conceptos de Datawarehousing
-
Facultad de Ingeniera y CienciasIngeniera en Sistemas de Computacin e Informtica
Conceptos de Datawarehousing
Ing. Jonathan CarrilloQuito, Marzo 2015
BASES DE DATOS MULTIDIMENSIONALES
-
Contenido:
1. Introduccin a las bases de datos multidimensionales
2. Evolucin, beneficios y problemas de los Datawarehouse
3. Arquitectura de un Datawarehouse
4. Data Marts
5. Conclusin
Ing. Jonathan Carrillo - Marzo 2015
-
Conceptos de Datawarehousing
1. Introduccin a las bases de datos multidimensionales
DataWarehouse
> Es una base de datos corporativa en la que se
integra informacin depurada de las diversas
fuentes que hay en la organizacin. Dicha
informacin debe ser homognea y fiable, se
almacena de forma que permita su anlisis desde
muy diversas perspectivas, [y con] tiempos de
respuesta ptimos.
Ramos, 2011
Ing. Jonathan Carrillo - Marzo 2015 Ing. Jonathan Carrillo - Marzo 2015
-
Conceptos de Datawarehousing
1. Introduccin a las bases de datos multidimensionales
DataWarehouse
> Es un repositorio de datos que proporciona una
visin global, comn e integrada de los datos de
la organizacin independientemente de cmo se
vayan a utilizar posteriormente por los
consumidores o usuarios, con las propiedades
siguientes: estable, coherente, fiable y con
informacin histrica.
Curto, 2011
Ing. Jonathan Carrillo - Marzo 2015 Ing. Jonathan Carrillo - Marzo 2015
-
Conceptos de Datawarehousing
1. Introduccin a las bases de datos multidimensionales
DataWarehouse
> El almacenamiento de datos (data warehousing)
y el procesamiento analtico en lnea (on - line
analytical processing ) OLAP, son elementos
esenciales en el soporte de decisiones, de las
bases de datos
Chandhuri, S.
Ing. Jonathan Carrillo - Marzo 2015 Ing. Jonathan Carrillo - Marzo 2015
-
Conceptos de Datawarehousing
1. Introduccin a las bases de datos multidimensionales
DataWarehouse
> Por medio de los conceptos anteriores, podemos
decir entones que un dataWarehouse es:
Una Base de Datos
BDD: estable, coherente, fiable y con
informacin histrica
Almacena datos corporativos
Integra informacin depurada
Sirve como soporte para la toma de
decisiones y para el anlisis de tendencias.
Ing. Jonathan Carrillo - Marzo 2015 Ing. Jonathan Carrillo - Marzo 2015
-
Conceptos de Datawarehousing
1. Introduccin a las bases de datos multidimensionales
Caractersticas de un DataWarehouse
> Bill Inmon fue uno de los primeros autores en
escribir sobre el tema de los DataWarehouse en
los siguientes trminos:
Un Data Warehouse o Almacn de Datos es
una coleccin de datos orientado a temas,
integrado, de tiempo variante y no voltil,
que se usa para el soporte del proceso de
toma de decisiones gerenciales.
Inmon, 1993
Ing. Jonathan Carrillo - Marzo 2015 Ing. Jonathan Carrillo - Marzo 2015
-
Conceptos de Datawarehousing
1. Introduccin a las bases de datos multidimensionales
Caractersticas de un DataWarehouse
Orientado a temas: la informacin se clasifica en
base a los aspectos que son de inters para la
empresa (clientes, productos, ventas)
> Por ejemplo, para un fabricante, stos pueden ser
clientes, productos, proveedores y vendedores.
> Para una universidad pueden ser estudiantes,
clases y profesores.
> Para un hospital pueden ser pacientes, personal
mdico, medicamentos, etc.
Ing. Jonathan Carrillo - Marzo 2015 Ing. Jonathan Carrillo - Marzo 2015
-
Conceptos de Datawarehousing
1. Introduccin a las bases de datos multidimensionales
Caractersticas de un DataWarehouse
Orientado a temas:
Ing. Jonathan Carrillo - Marzo 2015 Ing. Jonathan Carrillo - Marzo 2015
-
Conceptos de Datawarehousing
1. Introduccin a las bases de datos multidimensionales
Caractersticas de un DataWarehouse
Integrado: La integracin de datos se muestra de
muchas maneras:
> en convenciones de nombres consistentes,
> en la medida uniforme de variables,
> en la codificacin de estructuras consistentes,
> en atributos fsicos de los datos consistentes,
> fuentes mltiples y otros.
Ing. Jonathan Carrillo - Marzo 2015 Ing. Jonathan Carrillo - Marzo 2015
-
Conceptos de Datawarehousing
1. Introduccin a las bases de datos multidimensionales
Caractersticas de un DataWarehouse
Integrado:
Ing. Jonathan Carrillo - Marzo 2015 Ing. Jonathan Carrillo - Marzo 2015
DataWarehouse
-
Conceptos de Datawarehousing
1. Introduccin a las bases de datos multidimensionales
Caractersticas de un DataWarehouse
Integrado:
> Para integrar, se debe tomar en cuenta las
convenciones (estandarizacin) utilizada por los
diseadores de las aplicaciones. stas se
diferencian en:
la codificacin,
en las estructuras claves,
en sus caractersticas fsicas,
en las convenciones de nombramiento y
otros. Ing. Jonathan Carrillo - Marzo 2015 Ing. Jonathan Carrillo - Marzo 2015
-
Conceptos de Datawarehousing
1. Introduccin a las bases de datos multidimensionales
Caractersticas de un DataWarehouse
Integrado:
>Codificacin. Los diseadores de aplicaciones
codifican el campo GENERO por ejemplo, en
varias formas.
> Un diseador representa GENERO como una
"M" y una "F", otros como un "1" y un "0", otros
como una "X" y una "Y" e inclusive, como
"masculino" y "femenino".
> Por lo que GENERO debe llegar al
DataWarehouse en un estado integrado uniforme.
Ing. Jonathan Carrillo - Marzo 2015 Ing. Jonathan Carrillo - Marzo 2015
-
Conceptos de Datawarehousing
1. Introduccin a las bases de datos multidimensionales
Caractersticas de un DataWarehouse
Integrado:
Ing. Jonathan Carrillo - Marzo 2015 Ing. Jonathan Carrillo - Marzo 2015
Ejemplo de Codificacin
-
Conceptos de Datawarehousing
1. Introduccin a las bases de datos multidimensionales
Caractersticas de un DataWarehouse
Integrado:
Ing. Jonathan Carrillo - Marzo 2015 Ing. Jonathan Carrillo - Marzo 2015
Ejemplo de Codificacin
-
Conceptos de Datawarehousing
1. Introduccin a las bases de datos multidimensionales
Caractersticas de un DataWarehouse
Integrado:
>Caractersticas Fsicas. Formatos de los
atributos de medida de las fuentes de datos, por
ejemplo en centmetros, otros en pulgadas, otros
en millones de pies cbicos por segundo y otros
en yardas.
> Cualquiera que sea la fuente, cuando la
informacin del atributo llegue al
DataWarehouse necesitar ser una medida que
mantenga el formato de la misma manera.
Ing. Jonathan Carrillo - Marzo 2015 Ing. Jonathan Carrillo - Marzo 2015
-
Conceptos de Datawarehousing
1. Introduccin a las bases de datos multidimensionales
Caractersticas de un DataWarehouse
Integrado:
Ing. Jonathan Carrillo - Marzo 2015 Ing. Jonathan Carrillo - Marzo 2015
Ejemplo de Caractersticas Fsicas
-
Conceptos de Datawarehousing
1. Introduccin a las bases de datos multidimensionales
Caractersticas de un DataWarehouse
Integrado:
>Convenciones de Nombramiento: El mismo
elemento es frecuentemente referido por nombres
diferentes en las diversas aplicaciones.
> Por ejemplo, bases de datos que no mantengan un
estndar de nombramiento: NombEmple; con
otra que mantenga una convencin:
NombreEmpleado.
Ing. Jonathan Carrillo - Marzo 2015 Ing. Jonathan Carrillo - Marzo 2015
-
Conceptos de Datawarehousing
1. Introduccin a las bases de datos multidimensionales
Caractersticas de un DataWarehouse
Integrado:
>Fuentes Mltiples: El mismo elemento puede
derivarse desde fuentes mltiples.
> En este caso, el proceso de transformacin debe
asegurar que la fuente apropiada sea usada,
documentada y movida al DW.
Ing. Jonathan Carrillo - Marzo 2015 Ing. Jonathan Carrillo - Marzo 2015
-
Conceptos de Datawarehousing
1. Introduccin a las bases de datos multidimensionales
Caractersticas de un DataWarehouse
Integrado:
Ing. Jonathan Carrillo - Marzo 2015 Ing. Jonathan Carrillo - Marzo 2015
Ejemplo de Fuentes Mltiples
-
Conceptos de Datawarehousing
1. Introduccin a las bases de datos multidimensionales
Caractersticas de un DataWarehouse
Integrado:
Ing. Jonathan Carrillo - Marzo 2015 Ing. Jonathan Carrillo - Marzo 2015
Ejemplo de Fuentes Mltiples
-
Conceptos de Datawarehousing
1. Introduccin a las bases de datos multidimensionales
Caractersticas de un DataWarehouse
De tiempo variante:
> Toda la informacin del DataWarehouse es
requerida en algn momento, en contraste con la
informacin en el ambiente operacional.
> Como la informacin en el DataWarehouse es
solicitada en cualquier momento (es decir, no
"ahora mismo"), los datos encontrados en el DW
se llaman de "tiempo variante".
Ing. Jonathan Carrillo - Marzo 2015 Ing. Jonathan Carrillo - Marzo 2015
-
Conceptos de Datawarehousing
1. Introduccin a las bases de datos multidimensionales
Caractersticas de un DataWarehouse
De tiempo variante: La informacin del DW debe
incluir los datos histricos para usarse en la
identificacin y evaluacin de tendencias.
Ing. Jonathan Carrillo - Marzo 2015 Ing. Jonathan Carrillo - Marzo 2015
La informacin del data warehouse es,
para todos los propsitos prcticos,
una serie larga de "snapshots" (vistas
instantneas).
-
Conceptos de Datawarehousing
1. Introduccin a las bases de datos multidimensionales
Caractersticas de un DataWarehouse
No voltil:
> La informacin en el DW no se modifica ni se
elimina, una vez almacenado un dato, ste se
convierte en informacin de slo lectura, y se
mantiene para futuras consultas. Los datos
almacenados no son actualizados, slo son
incrementados.
> Las actualizaciones de la base de datos
operacional no ocurren en el entorno del
DataWarehouse, no se requieren mecanismos de
control de la concurrencia y recuperacin.
Ing. Jonathan Carrillo - Marzo 2015 Ing. Jonathan Carrillo - Marzo 2015
-
Conceptos de Datawarehousing
1. Introduccin a las bases de datos multidimensionales
Caractersticas de un DataWarehouse
No voltil:
> En el DW se requieren dos operaciones nada
ms: Carga inicial de los datos y acceso a datos.
Ing. Jonathan Carrillo - Marzo 2015 Ing. Jonathan Carrillo - Marzo 2015
-
Conceptos de Datawarehousing
1. Introduccin a las bases de datos multidimensionales
Caractersticas de un DataWarehouse
No voltil:
> Operacional VS. DatawareHouse
Ing. Jonathan Carrillo - Marzo 2015 Ing. Jonathan Carrillo - Marzo 2015
Voltiles No voltiles
DW