Capitulo 2 introducción al business intelligence

58
División de Alta Tecnología FUNDAMENTOS DE APLICACIONES BUSINESS INTELLIGENCE

Transcript of Capitulo 2 introducción al business intelligence

Page 1: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

FUNDAMENTOS DE APLICACIONES BUSINESS INTELLIGENCE

Page 2: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

Introducción al Business Intelligence

1.¿Qué es Business Intelligence?

2.Historia y Evolución de los conceptos de BI

3.Conceptos y Terminología BI: OLTP, OLAP, Data Warehouse, Datamart, Metadata

Page 3: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

¿Qué es Business Intelligence?

Business Intelligence o Inteligencia de Negocios, consiste en el proceso de transformación de datos en información, haciendo uso de técnicas de Extracción, Transformación y Carga (ETL), proporcionando información validada para una adecuada toma de decisiones y de manera oportuna.

Page 4: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

¿El valor de la Información?

“Transformación Ascendente”

DATOS

INFORMACION

INTELIGENCIA

CONOCIMIENTO

SABIDURIA

Page 5: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

¿El valor de la Información?

Asignación de valor: Ley de oferta y demanda? Preguntas claves:

¿Qué influencia la compra y la demanda? ¿Qué productos me generan más ingresos? ¿En dónde hay oportunidades de negocio? ¿Cómo segmento mis clientes según su comportamiento comercial? ¿Qué es lo que mueve la calidad del producto y la demanda de los

clientes?

“Era de la Información”, la información tiene un valor monetario.

Page 6: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

Las Organizaciones y sus Requerimientos de S.I.

Las empresas al querer contar con una mayor automatización en sus procesos, implementan dentro de su organización una gran infraestructura tecnológica.

Sistemas de Procesamiento de Datos (SPD) Administración de Recursos Empresariales (ERP) Sistemas de Información Ejecutiva (EIS) Sistemas de Soporte a Decisiones (DSS) Manejo de Relación con Clientes (CRM)

Page 7: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

¿ Qué información se necesita?

Antiguamente: Toma de decisiones = INTUICIÓN , BASADA EN LA EXPERIENCIA

Actualmente: Más personas toman decisiones Deben tener información OPORTUNA Y DE CALIDAD

Page 8: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

Requerimientos Informativos en la Piramide Organizacional

Analistas

Consumidores de Información

Exploradores de

Información

5-10% de los usuarios

15-25% de los usuarios

65-80% de los usuarios

Nivel Estratégico

Nivel Táctico

Nivel Operacional

Page 9: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

Historia y Evolución de los conceptos de BI

Conceptos de Business Intelligence

Incas, Fenicios, persas, egipcios y otros pueblos usaban informaciones obtenidas de la naturaleza en beneficio propio

Mareas Periodos de Sequías Lluvias Posición de los astros

Page 10: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

Historia y Evolución de los conceptos de BI

Conceptos de Business Intelligence

Después de la conquista de América, se crea en España la "Casa del Oro“

Las nuevas tecnologías tales como, almacenamiento en tarjetas perforadas, Bases de Datos lineales y Lenguajes de Cuarta Generación (4GL), permitieron darle al usuario la facilidad de tener el control directo de los sistemas y de la información.

Page 11: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

Historia y Evolución de los conceptos de BI

En los 70’s se da un gran salto al aparecer :• Los dispositivos de Acceso Directo

(DASD) Acceso veloz a los datos y Búsquedas directas y No lineales

• Administración de Bases de Datos (DBMS)

permitía al desarrollador el acceso a la información, al encargarse del almacenamiento e índices.

En los 90’s las grandes empresas contaban con Centros de Información (CI).

Funcionaban como repositorio de datos, Información poco disponible

Conceptos de Business Intelligence

Page 12: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

Historia y Evolución de los conceptos de BI

Conceptos de Business Intelligence

El concepto de Data Warehouse nace entre los años 1992 y 1993 como base del desarrollo de soluciones Business Intelligence. «repositorio»«repositorio»

En 1996 el concepto de Business Intelligence empezó a difundirse como una evolución de los Executive Information Systems (EIS).

Page 13: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

Historia y Evolución de los conceptos de BI

Conceptos de Business Intelligence

El término Business Intelligence se extendió hacia otras herramientas como: EIS (sistema de información ejecutiva) DSS (sistema de soporte a las decisiones) Balanced Scorecad (indicadores de gestión) Dashboard (cuadros de mandos) ER (reporteadores empresariales) Data Marts, Data Mining, Herramientas OLAP

Resumen : Activar la capacidad de tomar decisiones, afinar estrategias de relaciones con los clientes y satisfacer las necesidades del sector empresarial.

Page 14: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

Historia y Evolución de los conceptos de BI

Conceptos de Business Intelligence

Los sistemas de Planeamiento de Recursos Empresariales o Enterprise Resource Planning (ERP), tienen como función principal dar soporte a la parte operativa de las diferentes áreas de la organización, y se encuentra muy ligada con la historia del Business Intelligence.

Actualmente los ERP se convierten en el principal origen de datos para soluciones Business Intelligence

Page 15: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

ERP

El reto es unir elementos de las áreas y proporcionarle a los usuarios una manera universal de utilizar la información almacenada en diferentes sistemas.

Utiliza la información a través de la organización de forma más proactiva en áreas claves.

Page 16: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

Conceptos y Terminología BI:

OLTP OLAP Data Warehouse Datamart Metadata

Page 17: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

On Line Transacction Processing (OLTP)

OLTP esta encargado de dar soporte a los procesos diarios de ingreso y mantenimiento de datos en tiempo real.

Características

Diseño orientado a la transacción. Volatilidad de los datos. Proporciona soporte muy limitado a la toma de decisiones.

Ejemplos:

• Cobranzas.• Sistema de control de asistencia.• Control de almacén.

Page 18: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

On Line Analytical Processing (OLAP)

OnLine Analytical Processing (OLAP) es un proceso en el que se usan herramientas netamente análiticas, que facilitan el análisis de la información del negocio. Se halla organizada en entidades y métricas, que permiten al usuario flexibilidad en la ejecución de consultas complejas.

Page 19: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

OLAP

Los servicios OLAP proveen de múltiples niveles de análisis entre los cuales podemos mencionar, además de tener la capacidad de realizar consultas complejas:

•Realizar actividades intensivas de comparación de datos•Análisis de tendencias•Reportes•Aislar un grupo de datos con características específicas

De forma amigable, rápida y confiable.

Page 20: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

OLAP

Características

Es consolidada. La data se agrupada desde todas las áres de la organización y almacenada en un repositorio central y único.

Es consistente. Todos los usuarios deben obtener la misma versión de los datos independientemente de donde provengan o cuando hallan sido procesadas.

Es orientada al objetivo. Sólo debe contener información importante que permita la toma de decisiones.

Page 21: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

OLAP

Características

Es histórica. Toda la información de la empresa es almacenada como fotografías en el repositorio único de datos.

Es de solo lectura. El sistema OLAP es exclusivamente sólo para consultas.

No es atómica. La data OLAP principalmente contiene data sumirazada y resumida.

Page 22: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

OLAP

Page 23: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

OLAP. Un ejemplo

Ejemplo:

Una cadena de tiendas de alquiler de videos muestra el siguiente cuadro mensual, con las cantidades de videos alquilados por cada una de sus sucursales.

Page 24: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

OLAP. Un ejemplo

Sin embargo, la tienda de alquiler de videos también desearía ver como se desarrollan las ventas en el tiempo.

Page 25: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

OLAP

Las mismas celdas de datos se visualizan mediante un cubo.

Tiempo

Tienda

Categoría

Page 26: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

OLAP

1. ¿Cuánto se alquila por categoría de video en cada tienda en un mes dado? Resp.: Categoría de video por tienda en un mes dado

2. ¿Qué tiendas han mejorado sus alquileres de video a través del tiempo? Resp. : Tienda por tiempo de una categoría de video dado.

Page 27: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

Modelos de Almacenamiento

OLAP Relacional (ROLAP)

OLAP Multidimensional (MOLAP)

OLAP Híbrido (HOLAP)

OLAP de Escritorio (DOLAP)

OLAP Local (LOLAP)

Page 28: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

ROLAP

OLAP Relacional (ROLAP) es un sistema en el cual los datos se encuentran almacenados en una base de datos relacional.

Típicamente, los datos son detallados, evitando las agregaciones y las tablas se encuentran normalizadas.

Los esquemas más comunes sobre los que se trabaja son estrella o copo de nieve, aunque es posible trabajar sobre cualquier base de datos relacional.

ROLAP es utilizada en DataMarts con grandes volúmenes de datos como por ejemplo : Las empresas de telecomunicaciones Banca, entre otros.

Page 29: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

ROLAP

La arquitectura ROLAP está compuesta por un servidor de base de datos Relacional y un motor OLAP en un servidor dedicado.

Esta arquitectura está diseñada para almacenar gran volumen de datos, debido a que su almacenamiento es relacional.

Page 30: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

MOLAP

En un sistema OLAP multidimensional (MOLAP) los datos se encuentran almacenados en una estructura multidimensional.

Para optimizar los tiempos de respuesta, el resumen de la información es usualmente calculado por adelantado. Estos valores precalculados o agregaciones son la base de las ganancias de desempeño de este sistema.

Algunos sistemas utilizan técnicas de compresión de datos para disminuir el espacio de almacenamiento en disco debido a los valores precalculados.

MOLAP es utilizada en DataMarts con pequeños volúmenes de datos como por ejemplo : Medianas empresas Áreas especificas de una organización

Page 31: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

La arquitectura MOLAP está compuesta por un motor OLAP en un servidor dedicado.

Esta arquitectura está diseñada para almacenar poco volumen de datos lo cual generará una limitación respecto al tamaño de BD.

Esta arquitectura permitir mejoras enormes en la performance con respecto a los tiempos de consulta logrando un análisis más fácil y rápido

Base de Datos Relacional

Vista de Usuario

Base de Datos Multidimensional

AGREGACIONES Y DATOS

Base de Datos Relacional

Vista de Usuario

Base de Datos Multidimensional

AGREGACIONES Y DATOS

MOLAP

Page 32: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

HOLAP

Un sistema OLAP Híbrido (HOLAP) mantiene los registros detallados en la base de datos relacional, mientras que los datos resumidos o agregados se almacenan en una base de datos multidimensional separada.

Este método de almacenamiento es una combinación de los dos anteriores e intenta rescatar lo mejor de cada uno.

HOLAP es utilizada en DataMarts con grandes volúmenes de datos como por ejemplo : Banca Retail Seguros Entre otros.

Page 33: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

La arquitectura HOLAP está compuesta por un servidor de base de datos Relacional y un motor OLAP en un servidor dedicado.

Esta arquitectura permite que el espacio físico, la performance de las consultas y el procesamiento sea menor que MOLAP y mayor que ROLAP.

Base de Datos Relacional

Vista de Usuario

Base de Datos Multidimensional

DATOS AGREGACIONES

Base de Datos Relacional

Vista de Usuario

Base de Datos Multidimensional

DATOS AGREGACIONES

HOLAP

Page 34: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

DOLAP y LOLAP

Las Desktop Online Analytical Processing (DOLAP) y Local Online Analytical Processing (LOLAP) se almacena en la estación de trabajo del cliente (que puede ser una PC común).

Este tipo de cubos de información envían al servidor relacional instrucciones SQL desde una estación de trabajo y reciben los datos almacenándolos como micro cubos los cuales son analizados de manera local.

Entre sus desventajas es que el cubo offline no puede ser muy grande y al estar almacenado en la pc del cliente pueden presentarse problemas de seguridad.

Page 35: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

ARQUITECTURAS OLAP

Los usuarios que requieren de un alto nivel de detalle necesitarán de una arquitectura ROLAP

Los usuarios que requieren de datos agregados y sumarizados necesitarán de una arquitectura MOLAP

Los analista que requieran ambos tipos de análisis necesitarán una arquitectura HOLAP.

Page 36: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

OLTP vs OLAP

Difieren en arquitectura y uso.

Entre los numerosos puntos de diferencias se encuentran:

Los objetivos principales La orientación de los datos La integración La historicidad El acceso de datos y manipulación Los patrones de uso La granularidad de los datos El perfil de los usuarios La metodología de desarrollo, etc.

Page 37: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

OLTP vs OLAP

Objetivos principales de construcción

Los OLTP están orientados a dar soporte a las operaciones diarias del negocio. Las aplicaciones OLAP se orientan a asistir en el análisis del negocio (consultas).

Page 38: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

OLTP vs OLAP

Alineación de datos

Los OLTP están orientados a aplicaciones o sistemas los cuales poseen distintos tipos de datos y diferentes y estructurados para registrar las trascancciones diarias del negocio.

Los sistemas OLAP están alineados por área o tema y están orientados a la consulta del analista de negocio. Se orientan totalmente a las consultas.

Page 39: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

OLTP vs. OLAP

OLTPOLAP

Por ejemplo :

En las financieras existen numerosas aplicaciones de cuentas y colocaciones a nivel operacional mientras que en un Data Warehouse la información estaría organizada por cliente, funcionario, tipo de cuenta y tiempo.

En las comercializadoras existen aplicaciones sobre registro de ventas, registro de compras, manejo de inventario o stock y presupuesto. En un Data Warehousing hablaríamos de productos, sucursales, proveedores, tiempo y las diferentes métricas propias de negocio (unidades vendidas, monto neto, etc)

Page 40: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

OLTP vs. OLAP

Integración de datos

En los OLTP, los datos se encuentran dispersos, son calificados como datos base o datos operacionales. Estos datos son estructurados en forma aislada uno de otros, pudiendo tener diferentes estructuras de llaves y nombres.

En los ambientes OLAP, los datos deben estar integrados, consolidados y orientados a un tema o área de análisis.

Page 41: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

OLTP vs. OLAP

Acceso y manipulación de los datos

Los sistemas operacionales realizan operaciones con los datos fila por fila usando genaralmente sentencias inserts, updates y deletes. Además requieren de rutinas de validación como son el commit y el rollback, los bloqueos de registros, etc.

Los sistemas OLAP tienen una carga y acceso masivo de datos, haciendo uso principalmente de sentencias select. Es por esta razón que la estructura de la BD analítica es desnormalizada rompiendo los esquemas clásicos operacionales para beneficiar el tiempo de consulta y proceso.

Page 42: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

OLTP vs. OLAP

Granularidad de los datos

Los sistemas OLTP se encuentran los datos a nivel atómico (transacción por transacción).

Los sistemas OLAP tienen adicionalmente de data detallada, datos

sumarizados y agregados.

Page 43: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

Sistemas OLTP vs OLAP

Page 44: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

Data Warehouse

Ralph Kimball: “un data warehouse es una ‘copia’ de los datos transaccionales específicamente estructurados para consultas y análisis”.

Page 45: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

Data Warehousing

“A Warehouse is a place, Warehousing is a process” [R.Hackathorn]

Existe una gran cantidad de procesos detrás de una arquitectura de Data Warehouse de suma importancia para el mismo. Estos comprenden desde procesos de extracción que estudian y seleccionan los datos fuente adecuados para el Data Warehouse hasta procesos de consulta y análisis de datos que despliegan la información de una forma fácil de interpretar y analizar.

A continuación pasaremos a explicar los procesos básicos de una Data Warehouse: Extracción, Transformación, Carga e Indices, Chequeo de Calidad, Liberación/Publicación, Consulta, Feedback, Auditoria, Seguridad, Respaldo y Recuperación.

Page 46: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

Extracción

El proceso de extracción consiste en estudiar y entender los datos fuente, tomando aquellos que son de utilidad para el Data Warehouse.

Transformación Una vez que los datos son extraídos, éstos se transforman. Este proceso incluye

corrección de errores, resolución de problemas de dominio, borrado de campos que no son de interés, generación de claves, aumento de información, etc.

  Carga e Índices Al terminar el proceso de transformación, se cargan los datos en el Data

Warehouse.  Chequeo de Calidad Una vez ingresada la información al Data Warehouse, se realizan controles de

calidad para asegurar que la misma sea correcta. 

 

Data Warehousing

Page 47: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

Consulta El usuario final debe disponer de herramientas de consulta y procesamiento de

datos. Este proceso incluye consultas ad hoc, reportes, aplicaciones DSS, Data Mining, etc.

  Feedback Muchas veces es aconsejable seguir el camino inverso de carga. Por ejemplo,

puede alimentarse los sistemas legales con información depurada del Data Warehouse o almacenar en el mismo alguna consulta generada por el usuario que sea de interés.

  Auditoria Los procesos de auditoría permiten conocer de donde proviene la información

así como también qué cálculos la generaron. 

Data Warehousing

Page 48: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

Seguridad Una vez construido el Data Warehouse, es de interés para la organización

que la información llegue a la mayor cantidad de usuarios pero, por otro lado, se tiene sumo cuidado de protegerla contra posibles 'hackers', 'snoopers' o espías. El desarrollo de Internet a incrementado este dilema.

  Respaldo y Recuperación Se deben realizar actividades de backup y restore de la información, tanto la

almacenada en el Data Warehouse como la que circula desde los sistemas fuente al Data Warehouse.

Data Warehousing

Page 49: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

Datamart

Un Datamart es un Data Warehouse mas pequeño.Normalmente la información contenida en un

datamart es un subconjunto de un datawarehouse.

Page 50: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

Datamart

Características 

Orientado a un departamento dentro de la organización Puede ser implementado como una solución para problemas

inmediatos No es necesario para construir un Data Warehouse.

 Beneficios

Implementación rápida y sencilla Menor costo de implementación Cubre necesidades especificas del Negocio Respuestas rápidas por el menor volumen de información Asegura la consistencia de los datos

 

Page 51: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

Datamart

Desventajas 

Inadvertidamente se puede usar datos no compatibles con otros Datamarts que luego alarguen el tiempo de unificación

Si el Data Warehouse es construido primero, se requiere de hardware adicional para soportar Datamarts individuales.

Datos descentralizados debido a que cada Datamart corresponde a una base de datos individual por tema o por área.

 

Page 52: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

Metadata

Es un componente muy valioso para el Data Warehouse; los datos provenientes de la metadata se sitúa en una dimensión diferente al de otros datos del data warehouse, debido a que su contenido no es tomado directamente desde el ambiente operacional.

Page 53: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

La Metadata abarca todos los procesos de Data Warehousing y contiene: 

Nombres de campos y definiciones Mapeo de los datos Tablas Índices Cronogramas de extracción y carga Criterios de selección Cálculos de los datos derivados Transformación de los datos

Metadata

Page 54: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

Existen 3 tipos de Metadatos: 

• Metadata del Negocio: Contiene los modelos lógicos y las reglas de negocio.

• Metadata Técnica: Contiene los nombres físicos de las tablas, ubicación de almacenamiento, relaciones, llaves, etc.

 • Metadata Operacional: Contiene la programación de cargas,

fechas de actualización de datos, seguridad.

Metadata

Page 55: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

Page 56: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

1. ¿Qué beneficios puede brindarle a una empresa el Business Intelligence?

Habilidad de tomar las decisiones correctas en el momento correctoPor medio de las herramientas necesarias para poder comparar y analizar tendenciasEl tiempo invertido en la realización de presentaciones ejecutivas se ve reducido de forma significativa

2. El término Business Intelligence fue adoptado:  

a. Por los principales consultores europeos porque comprobaron que la historia del Viejo Continente traía consigo este concepto en diversos episodios.

b. Para que los conceptos que surgieron con las siglas EIS, DSS y SIG puedan abarcar cada vez más, dentro de un proceso natural de evolución de tecnologías y metodologías.

 a. Para sustituir la nomenclatura ofrecida a los proyectos de Data Warehouse y

Datamart cuando se los diseña por separado.

Preguntas

Page 57: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

3. Según la pirámide organizacional, cuáles son los 3 niveles de información que se necesitan.

Nivel EstratégicoNivel TácticoNivel Operacional

3. Nombre tres (3) diferencias entre OLTP vs OLAP.

La integraciónLa historicidadLa granularidad de los datos

4. La tecnología OLAP creció y se multiplicó originando las herramientas:

ROLAPMOLAPHOLAPDOLAP y LOLAP

Preguntas

Page 58: Capitulo 2   introducción al business intelligence

División de Alta Tecnología

3. Un vistazo a un cubo OLAP

Preguntas