Capitulo 2 introducción al business intelligence
-
Upload
segundo-elias-navarrete-saldana -
Category
Documents
-
view
1.323 -
download
2
Transcript of Capitulo 2 introducción al business intelligence
División de Alta Tecnología
FUNDAMENTOS DE APLICACIONES BUSINESS INTELLIGENCE
División de Alta Tecnología
Introducción al Business Intelligence
1.¿Qué es Business Intelligence?
2.Historia y Evolución de los conceptos de BI
3.Conceptos y Terminología BI: OLTP, OLAP, Data Warehouse, Datamart, Metadata
División de Alta Tecnología
¿Qué es Business Intelligence?
Business Intelligence o Inteligencia de Negocios, consiste en el proceso de transformación de datos en información, haciendo uso de técnicas de Extracción, Transformación y Carga (ETL), proporcionando información validada para una adecuada toma de decisiones y de manera oportuna.
División de Alta Tecnología
¿El valor de la Información?
“Transformación Ascendente”
DATOS
INFORMACION
INTELIGENCIA
CONOCIMIENTO
SABIDURIA
División de Alta Tecnología
¿El valor de la Información?
Asignación de valor: Ley de oferta y demanda? Preguntas claves:
¿Qué influencia la compra y la demanda? ¿Qué productos me generan más ingresos? ¿En dónde hay oportunidades de negocio? ¿Cómo segmento mis clientes según su comportamiento comercial? ¿Qué es lo que mueve la calidad del producto y la demanda de los
clientes?
“Era de la Información”, la información tiene un valor monetario.
División de Alta Tecnología
Las Organizaciones y sus Requerimientos de S.I.
Las empresas al querer contar con una mayor automatización en sus procesos, implementan dentro de su organización una gran infraestructura tecnológica.
Sistemas de Procesamiento de Datos (SPD) Administración de Recursos Empresariales (ERP) Sistemas de Información Ejecutiva (EIS) Sistemas de Soporte a Decisiones (DSS) Manejo de Relación con Clientes (CRM)
División de Alta Tecnología
¿ Qué información se necesita?
Antiguamente: Toma de decisiones = INTUICIÓN , BASADA EN LA EXPERIENCIA
Actualmente: Más personas toman decisiones Deben tener información OPORTUNA Y DE CALIDAD
División de Alta Tecnología
Requerimientos Informativos en la Piramide Organizacional
Analistas
Consumidores de Información
Exploradores de
Información
5-10% de los usuarios
15-25% de los usuarios
65-80% de los usuarios
Nivel Estratégico
Nivel Táctico
Nivel Operacional
División de Alta Tecnología
Historia y Evolución de los conceptos de BI
Conceptos de Business Intelligence
Incas, Fenicios, persas, egipcios y otros pueblos usaban informaciones obtenidas de la naturaleza en beneficio propio
Mareas Periodos de Sequías Lluvias Posición de los astros
División de Alta Tecnología
Historia y Evolución de los conceptos de BI
Conceptos de Business Intelligence
Después de la conquista de América, se crea en España la "Casa del Oro“
Las nuevas tecnologías tales como, almacenamiento en tarjetas perforadas, Bases de Datos lineales y Lenguajes de Cuarta Generación (4GL), permitieron darle al usuario la facilidad de tener el control directo de los sistemas y de la información.
División de Alta Tecnología
Historia y Evolución de los conceptos de BI
En los 70’s se da un gran salto al aparecer :• Los dispositivos de Acceso Directo
(DASD) Acceso veloz a los datos y Búsquedas directas y No lineales
• Administración de Bases de Datos (DBMS)
permitía al desarrollador el acceso a la información, al encargarse del almacenamiento e índices.
En los 90’s las grandes empresas contaban con Centros de Información (CI).
Funcionaban como repositorio de datos, Información poco disponible
Conceptos de Business Intelligence
División de Alta Tecnología
Historia y Evolución de los conceptos de BI
Conceptos de Business Intelligence
El concepto de Data Warehouse nace entre los años 1992 y 1993 como base del desarrollo de soluciones Business Intelligence. «repositorio»«repositorio»
En 1996 el concepto de Business Intelligence empezó a difundirse como una evolución de los Executive Information Systems (EIS).
División de Alta Tecnología
Historia y Evolución de los conceptos de BI
Conceptos de Business Intelligence
El término Business Intelligence se extendió hacia otras herramientas como: EIS (sistema de información ejecutiva) DSS (sistema de soporte a las decisiones) Balanced Scorecad (indicadores de gestión) Dashboard (cuadros de mandos) ER (reporteadores empresariales) Data Marts, Data Mining, Herramientas OLAP
Resumen : Activar la capacidad de tomar decisiones, afinar estrategias de relaciones con los clientes y satisfacer las necesidades del sector empresarial.
División de Alta Tecnología
Historia y Evolución de los conceptos de BI
Conceptos de Business Intelligence
Los sistemas de Planeamiento de Recursos Empresariales o Enterprise Resource Planning (ERP), tienen como función principal dar soporte a la parte operativa de las diferentes áreas de la organización, y se encuentra muy ligada con la historia del Business Intelligence.
Actualmente los ERP se convierten en el principal origen de datos para soluciones Business Intelligence
División de Alta Tecnología
ERP
El reto es unir elementos de las áreas y proporcionarle a los usuarios una manera universal de utilizar la información almacenada en diferentes sistemas.
Utiliza la información a través de la organización de forma más proactiva en áreas claves.
División de Alta Tecnología
Conceptos y Terminología BI:
OLTP OLAP Data Warehouse Datamart Metadata
División de Alta Tecnología
On Line Transacction Processing (OLTP)
OLTP esta encargado de dar soporte a los procesos diarios de ingreso y mantenimiento de datos en tiempo real.
Características
Diseño orientado a la transacción. Volatilidad de los datos. Proporciona soporte muy limitado a la toma de decisiones.
Ejemplos:
• Cobranzas.• Sistema de control de asistencia.• Control de almacén.
División de Alta Tecnología
On Line Analytical Processing (OLAP)
OnLine Analytical Processing (OLAP) es un proceso en el que se usan herramientas netamente análiticas, que facilitan el análisis de la información del negocio. Se halla organizada en entidades y métricas, que permiten al usuario flexibilidad en la ejecución de consultas complejas.
División de Alta Tecnología
OLAP
Los servicios OLAP proveen de múltiples niveles de análisis entre los cuales podemos mencionar, además de tener la capacidad de realizar consultas complejas:
•Realizar actividades intensivas de comparación de datos•Análisis de tendencias•Reportes•Aislar un grupo de datos con características específicas
De forma amigable, rápida y confiable.
División de Alta Tecnología
OLAP
Características
Es consolidada. La data se agrupada desde todas las áres de la organización y almacenada en un repositorio central y único.
Es consistente. Todos los usuarios deben obtener la misma versión de los datos independientemente de donde provengan o cuando hallan sido procesadas.
Es orientada al objetivo. Sólo debe contener información importante que permita la toma de decisiones.
División de Alta Tecnología
OLAP
Características
Es histórica. Toda la información de la empresa es almacenada como fotografías en el repositorio único de datos.
Es de solo lectura. El sistema OLAP es exclusivamente sólo para consultas.
No es atómica. La data OLAP principalmente contiene data sumirazada y resumida.
División de Alta Tecnología
OLAP
División de Alta Tecnología
OLAP. Un ejemplo
Ejemplo:
Una cadena de tiendas de alquiler de videos muestra el siguiente cuadro mensual, con las cantidades de videos alquilados por cada una de sus sucursales.
División de Alta Tecnología
OLAP. Un ejemplo
Sin embargo, la tienda de alquiler de videos también desearía ver como se desarrollan las ventas en el tiempo.
División de Alta Tecnología
OLAP
Las mismas celdas de datos se visualizan mediante un cubo.
Tiempo
Tienda
Categoría
División de Alta Tecnología
OLAP
1. ¿Cuánto se alquila por categoría de video en cada tienda en un mes dado? Resp.: Categoría de video por tienda en un mes dado
2. ¿Qué tiendas han mejorado sus alquileres de video a través del tiempo? Resp. : Tienda por tiempo de una categoría de video dado.
División de Alta Tecnología
Modelos de Almacenamiento
OLAP Relacional (ROLAP)
OLAP Multidimensional (MOLAP)
OLAP Híbrido (HOLAP)
OLAP de Escritorio (DOLAP)
OLAP Local (LOLAP)
División de Alta Tecnología
ROLAP
OLAP Relacional (ROLAP) es un sistema en el cual los datos se encuentran almacenados en una base de datos relacional.
Típicamente, los datos son detallados, evitando las agregaciones y las tablas se encuentran normalizadas.
Los esquemas más comunes sobre los que se trabaja son estrella o copo de nieve, aunque es posible trabajar sobre cualquier base de datos relacional.
ROLAP es utilizada en DataMarts con grandes volúmenes de datos como por ejemplo : Las empresas de telecomunicaciones Banca, entre otros.
División de Alta Tecnología
ROLAP
La arquitectura ROLAP está compuesta por un servidor de base de datos Relacional y un motor OLAP en un servidor dedicado.
Esta arquitectura está diseñada para almacenar gran volumen de datos, debido a que su almacenamiento es relacional.
División de Alta Tecnología
MOLAP
En un sistema OLAP multidimensional (MOLAP) los datos se encuentran almacenados en una estructura multidimensional.
Para optimizar los tiempos de respuesta, el resumen de la información es usualmente calculado por adelantado. Estos valores precalculados o agregaciones son la base de las ganancias de desempeño de este sistema.
Algunos sistemas utilizan técnicas de compresión de datos para disminuir el espacio de almacenamiento en disco debido a los valores precalculados.
MOLAP es utilizada en DataMarts con pequeños volúmenes de datos como por ejemplo : Medianas empresas Áreas especificas de una organización
División de Alta Tecnología
La arquitectura MOLAP está compuesta por un motor OLAP en un servidor dedicado.
Esta arquitectura está diseñada para almacenar poco volumen de datos lo cual generará una limitación respecto al tamaño de BD.
Esta arquitectura permitir mejoras enormes en la performance con respecto a los tiempos de consulta logrando un análisis más fácil y rápido
Base de Datos Relacional
Vista de Usuario
Base de Datos Multidimensional
AGREGACIONES Y DATOS
Base de Datos Relacional
Vista de Usuario
Base de Datos Multidimensional
AGREGACIONES Y DATOS
MOLAP
División de Alta Tecnología
HOLAP
Un sistema OLAP Híbrido (HOLAP) mantiene los registros detallados en la base de datos relacional, mientras que los datos resumidos o agregados se almacenan en una base de datos multidimensional separada.
Este método de almacenamiento es una combinación de los dos anteriores e intenta rescatar lo mejor de cada uno.
HOLAP es utilizada en DataMarts con grandes volúmenes de datos como por ejemplo : Banca Retail Seguros Entre otros.
División de Alta Tecnología
La arquitectura HOLAP está compuesta por un servidor de base de datos Relacional y un motor OLAP en un servidor dedicado.
Esta arquitectura permite que el espacio físico, la performance de las consultas y el procesamiento sea menor que MOLAP y mayor que ROLAP.
Base de Datos Relacional
Vista de Usuario
Base de Datos Multidimensional
DATOS AGREGACIONES
Base de Datos Relacional
Vista de Usuario
Base de Datos Multidimensional
DATOS AGREGACIONES
HOLAP
División de Alta Tecnología
DOLAP y LOLAP
Las Desktop Online Analytical Processing (DOLAP) y Local Online Analytical Processing (LOLAP) se almacena en la estación de trabajo del cliente (que puede ser una PC común).
Este tipo de cubos de información envían al servidor relacional instrucciones SQL desde una estación de trabajo y reciben los datos almacenándolos como micro cubos los cuales son analizados de manera local.
Entre sus desventajas es que el cubo offline no puede ser muy grande y al estar almacenado en la pc del cliente pueden presentarse problemas de seguridad.
División de Alta Tecnología
ARQUITECTURAS OLAP
Los usuarios que requieren de un alto nivel de detalle necesitarán de una arquitectura ROLAP
Los usuarios que requieren de datos agregados y sumarizados necesitarán de una arquitectura MOLAP
Los analista que requieran ambos tipos de análisis necesitarán una arquitectura HOLAP.
División de Alta Tecnología
OLTP vs OLAP
Difieren en arquitectura y uso.
Entre los numerosos puntos de diferencias se encuentran:
Los objetivos principales La orientación de los datos La integración La historicidad El acceso de datos y manipulación Los patrones de uso La granularidad de los datos El perfil de los usuarios La metodología de desarrollo, etc.
División de Alta Tecnología
OLTP vs OLAP
Objetivos principales de construcción
Los OLTP están orientados a dar soporte a las operaciones diarias del negocio. Las aplicaciones OLAP se orientan a asistir en el análisis del negocio (consultas).
División de Alta Tecnología
OLTP vs OLAP
Alineación de datos
Los OLTP están orientados a aplicaciones o sistemas los cuales poseen distintos tipos de datos y diferentes y estructurados para registrar las trascancciones diarias del negocio.
Los sistemas OLAP están alineados por área o tema y están orientados a la consulta del analista de negocio. Se orientan totalmente a las consultas.
División de Alta Tecnología
OLTP vs. OLAP
OLTPOLAP
Por ejemplo :
En las financieras existen numerosas aplicaciones de cuentas y colocaciones a nivel operacional mientras que en un Data Warehouse la información estaría organizada por cliente, funcionario, tipo de cuenta y tiempo.
En las comercializadoras existen aplicaciones sobre registro de ventas, registro de compras, manejo de inventario o stock y presupuesto. En un Data Warehousing hablaríamos de productos, sucursales, proveedores, tiempo y las diferentes métricas propias de negocio (unidades vendidas, monto neto, etc)
División de Alta Tecnología
OLTP vs. OLAP
Integración de datos
En los OLTP, los datos se encuentran dispersos, son calificados como datos base o datos operacionales. Estos datos son estructurados en forma aislada uno de otros, pudiendo tener diferentes estructuras de llaves y nombres.
En los ambientes OLAP, los datos deben estar integrados, consolidados y orientados a un tema o área de análisis.
División de Alta Tecnología
OLTP vs. OLAP
Acceso y manipulación de los datos
Los sistemas operacionales realizan operaciones con los datos fila por fila usando genaralmente sentencias inserts, updates y deletes. Además requieren de rutinas de validación como son el commit y el rollback, los bloqueos de registros, etc.
Los sistemas OLAP tienen una carga y acceso masivo de datos, haciendo uso principalmente de sentencias select. Es por esta razón que la estructura de la BD analítica es desnormalizada rompiendo los esquemas clásicos operacionales para beneficiar el tiempo de consulta y proceso.
División de Alta Tecnología
OLTP vs. OLAP
Granularidad de los datos
Los sistemas OLTP se encuentran los datos a nivel atómico (transacción por transacción).
Los sistemas OLAP tienen adicionalmente de data detallada, datos
sumarizados y agregados.
División de Alta Tecnología
Sistemas OLTP vs OLAP
División de Alta Tecnología
Data Warehouse
Ralph Kimball: “un data warehouse es una ‘copia’ de los datos transaccionales específicamente estructurados para consultas y análisis”.
División de Alta Tecnología
Data Warehousing
“A Warehouse is a place, Warehousing is a process” [R.Hackathorn]
Existe una gran cantidad de procesos detrás de una arquitectura de Data Warehouse de suma importancia para el mismo. Estos comprenden desde procesos de extracción que estudian y seleccionan los datos fuente adecuados para el Data Warehouse hasta procesos de consulta y análisis de datos que despliegan la información de una forma fácil de interpretar y analizar.
A continuación pasaremos a explicar los procesos básicos de una Data Warehouse: Extracción, Transformación, Carga e Indices, Chequeo de Calidad, Liberación/Publicación, Consulta, Feedback, Auditoria, Seguridad, Respaldo y Recuperación.
División de Alta Tecnología
Extracción
El proceso de extracción consiste en estudiar y entender los datos fuente, tomando aquellos que son de utilidad para el Data Warehouse.
Transformación Una vez que los datos son extraídos, éstos se transforman. Este proceso incluye
corrección de errores, resolución de problemas de dominio, borrado de campos que no son de interés, generación de claves, aumento de información, etc.
Carga e Índices Al terminar el proceso de transformación, se cargan los datos en el Data
Warehouse. Chequeo de Calidad Una vez ingresada la información al Data Warehouse, se realizan controles de
calidad para asegurar que la misma sea correcta.
Data Warehousing
División de Alta Tecnología
Consulta El usuario final debe disponer de herramientas de consulta y procesamiento de
datos. Este proceso incluye consultas ad hoc, reportes, aplicaciones DSS, Data Mining, etc.
Feedback Muchas veces es aconsejable seguir el camino inverso de carga. Por ejemplo,
puede alimentarse los sistemas legales con información depurada del Data Warehouse o almacenar en el mismo alguna consulta generada por el usuario que sea de interés.
Auditoria Los procesos de auditoría permiten conocer de donde proviene la información
así como también qué cálculos la generaron.
Data Warehousing
División de Alta Tecnología
Seguridad Una vez construido el Data Warehouse, es de interés para la organización
que la información llegue a la mayor cantidad de usuarios pero, por otro lado, se tiene sumo cuidado de protegerla contra posibles 'hackers', 'snoopers' o espías. El desarrollo de Internet a incrementado este dilema.
Respaldo y Recuperación Se deben realizar actividades de backup y restore de la información, tanto la
almacenada en el Data Warehouse como la que circula desde los sistemas fuente al Data Warehouse.
Data Warehousing
División de Alta Tecnología
Datamart
Un Datamart es un Data Warehouse mas pequeño.Normalmente la información contenida en un
datamart es un subconjunto de un datawarehouse.
División de Alta Tecnología
Datamart
Características
Orientado a un departamento dentro de la organización Puede ser implementado como una solución para problemas
inmediatos No es necesario para construir un Data Warehouse.
Beneficios
Implementación rápida y sencilla Menor costo de implementación Cubre necesidades especificas del Negocio Respuestas rápidas por el menor volumen de información Asegura la consistencia de los datos
División de Alta Tecnología
Datamart
Desventajas
Inadvertidamente se puede usar datos no compatibles con otros Datamarts que luego alarguen el tiempo de unificación
Si el Data Warehouse es construido primero, se requiere de hardware adicional para soportar Datamarts individuales.
Datos descentralizados debido a que cada Datamart corresponde a una base de datos individual por tema o por área.
División de Alta Tecnología
Metadata
Es un componente muy valioso para el Data Warehouse; los datos provenientes de la metadata se sitúa en una dimensión diferente al de otros datos del data warehouse, debido a que su contenido no es tomado directamente desde el ambiente operacional.
División de Alta Tecnología
La Metadata abarca todos los procesos de Data Warehousing y contiene:
Nombres de campos y definiciones Mapeo de los datos Tablas Índices Cronogramas de extracción y carga Criterios de selección Cálculos de los datos derivados Transformación de los datos
Metadata
División de Alta Tecnología
Existen 3 tipos de Metadatos:
• Metadata del Negocio: Contiene los modelos lógicos y las reglas de negocio.
• Metadata Técnica: Contiene los nombres físicos de las tablas, ubicación de almacenamiento, relaciones, llaves, etc.
• Metadata Operacional: Contiene la programación de cargas,
fechas de actualización de datos, seguridad.
Metadata
División de Alta Tecnología
División de Alta Tecnología
1. ¿Qué beneficios puede brindarle a una empresa el Business Intelligence?
Habilidad de tomar las decisiones correctas en el momento correctoPor medio de las herramientas necesarias para poder comparar y analizar tendenciasEl tiempo invertido en la realización de presentaciones ejecutivas se ve reducido de forma significativa
2. El término Business Intelligence fue adoptado:
a. Por los principales consultores europeos porque comprobaron que la historia del Viejo Continente traía consigo este concepto en diversos episodios.
b. Para que los conceptos que surgieron con las siglas EIS, DSS y SIG puedan abarcar cada vez más, dentro de un proceso natural de evolución de tecnologías y metodologías.
a. Para sustituir la nomenclatura ofrecida a los proyectos de Data Warehouse y
Datamart cuando se los diseña por separado.
Preguntas
División de Alta Tecnología
3. Según la pirámide organizacional, cuáles son los 3 niveles de información que se necesitan.
Nivel EstratégicoNivel TácticoNivel Operacional
3. Nombre tres (3) diferencias entre OLTP vs OLAP.
La integraciónLa historicidadLa granularidad de los datos
4. La tecnología OLAP creció y se multiplicó originando las herramientas:
ROLAPMOLAPHOLAPDOLAP y LOLAP
Preguntas
División de Alta Tecnología
3. Un vistazo a un cubo OLAP
Preguntas