Introducción a Business Intelligencedocshare02.docshare.tips/files/24192/241928224.pdf · •...

19
Introducción a Business Intelligence Alberto Gabriel Garcete González, Raúl Alberto Benítez Martínez {albertogarcetepy,raulkvd}@gmail.com Ingeniería en Informática de la Facultad Politécnica, Universidad Nacional de Asunción San Lorenzo, Paraguay Abstract. El presente trabajo expone los conceptos básicos que nos permiten adentrarnos al mundo de “business intelligence”. Entender qué significa “business intelligence” como campo de la gestión empresarial, cuáles son sus objetivos, qué tipos de problemas nos permite resolver, de qué elementos está compuesto, cuáles son los pasos que se siguen para desarrollarlo, de qué herramientas disponemos para implementarlo, son algunos de los aspectos que trataremos a lo largo del material. Keywords: Business Intelligence, Datawarehouse, ETL, Data Staging, Granularidad, Silos de Información, Data Mart, Multidimensional, OLAP, Datamining, Dashboard, Scorecard. 1 Introducción Business intelligence o inteligencia de negocio abarca un conjunto de conceptos, técnicas y herramientas que se utiliza para la transformación de simples datos en información útil y significativa para el análisis de negocios. Las tecnologías de business intelligence son capaces de manejar grandes volúmenes de datos que ayudan a identificar, desarrollar y crear nuevas estrategias de negocios. El objetivo de business intelligence es permitir la fácil interpretación de grandes cantidades de información, identificar nuevas oportunidades y aplicar una estrategia eficaz que proporcione a la organización una ventaja competitiva de mercado y una estabilidad a largo plazo. Las herramientas de business intelligence ofrecen una visión histórica, actual y predictiva de las operaciones de negocio. Las funciones comunes de business intelligence incluyen el procesamiento analítico en linea, minería de datos, minería de procesos, minería de texto, procesamiento de eventos complejos, análisis del rendimiento del negocio, análisis predictivo, entre otros. Puede ser utilizado para apoyar una amplia variedad de decisiones que van desde las operativas hasta las estratégicas. Las decisiones operativas básicas incluyen la reposición de productos en stock o la fijación de precios. Las decisiones estratégicas incluyen prioridades, objetivos y dirección en todos los niveles de la organización. En todos los casos, business intelligence es más eficaz cuando se combinan datos derivados del mercado en el que opera la empresa (datos externos) con datos originados de forma interna

Transcript of Introducción a Business Intelligencedocshare02.docshare.tips/files/24192/241928224.pdf · •...

Introducción a Business Intelligence 

Alberto Gabriel Garcete González, Raúl Alberto Benítez Martínez{albertogarcetepy,raulkvd}@gmail.com

Ingeniería en Informática de la Facultad Politécnica, Universidad Nacional de AsunciónSan Lorenzo, Paraguay

Abstract. El presente trabajo expone los conceptos básicos que nos permiten adentrarnosal mundo de “business intelligence”. Entender qué significa “business intelligence” comocampo de la gestión empresarial, cuáles son sus objetivos, qué tipos de problemas nospermite resolver, de qué elementos está compuesto, cuáles son los pasos que se siguenpara desarrollarlo, de qué herramientas disponemos para implementarlo, son algunos delos aspectos que trataremos a lo largo del material.

Keywords:  Business   Intelligence,   Datawarehouse,   ETL,   Data   Staging,   Granularidad,Silos   de   Información,  Data  Mart,   Multidimensional,  OLAP,   Datamining,  Dashboard,Scorecard.

1 Introducción

Business intelligence  o  inteligencia de negocio  abarca un conjunto de conceptos, técnicas yherramientas  que se utiliza para  la   transformación de simples  datos  en  información útil  ysignificativa para el análisis de negocios. Las tecnologías de business intelligence son capacesde manejar grandes volúmenes de datos que ayudan a identificar, desarrollar y crear nuevasestrategias de negocios.

El objetivo de business intelligence es permitir la fácil interpretación de grandes cantidades deinformación, identificar nuevas oportunidades y aplicar una estrategia eficaz que proporcionea la organización una ventaja competitiva de mercado y una estabilidad a largo plazo. Lasherramientas de business intelligence ofrecen una visión histórica, actual y predictiva de lasoperaciones de negocio.

Las funciones comunes de business intelligence incluyen el procesamiento analítico en linea,minería de datos, minería de procesos, minería de texto, procesamiento de eventos complejos,análisis del rendimiento del negocio, análisis predictivo, entre otros. Puede ser utilizado paraapoyar una amplia variedad de decisiones que van desde las operativas hasta las estratégicas.Las decisiones operativas básicas incluyen la reposición de productos en stock o la fijación deprecios. Las decisiones estratégicas incluyen prioridades, objetivos y dirección en todos losniveles de la organización.

En todos los casos,  business intelligence es más eficaz cuando se combinan datos derivadosdel mercado en el que opera la empresa (datos externos) con datos originados de forma interna

en   la  propia  organización   (datos   internos).  En  efecto,   cuando   se   combinan  datosexternos con datos internos pueden proporcionar una visión más completa, esto creauna “inteligencia” que no se puede obtener de cualquier conjunto de datos. 

2 Qué es business intelligence

El primero que acuñó el término fue Howard Dresner, quién cuando era consultor deGartner  Group  lo utilizó  para  describir  un conjunto  de  conceptos  y  métodos quemejoran la toma de decisiones, partiendo de la información disponible acerca de loshechos. Entonces, partiendo de la definición del glosario de términos de Gartner[1]:

“Business   Intelligence   es   un   proceso   interactivo   para   explorar   y   analizarinformación   estructurada   sobre   un   área   (normalmente   almacenada   en   undatawarehouse), para descubrir tendencias o patrones, a partir de las cuales derivarideas y extraer  conclusiones.  Las áreas incluyen clientes,  proveedores,  productos,servicios y competidores. El proceso de business intelligence incluye la comunicaciónde los descubrimientos y efectuar los cambios.”

Indica que business intelligence es un proceso que se prolonga en el tiempo, que no essólo para un momento puntual  de la gestión empresarial,  en el  que podremos vertendencias, patrones, cambios, variables, etc. Al explorar iremos descubriendo nuevasrelaciones que hasta el momento desconocíamos. Al analizar de lo nuevo que hemosdescubierto, veremos relaciones entre variables, tendencias, patrones y cuál puede serla evolución de los mismos. 

La información estructurada está en tablas relacionadas, dichas tablas a la vez estánen un datawarehouse o almacén de datos. Nos podemos centrar en áreas específicasdel negocio y en objetivos concretos como por ejemplo: reducir costes, incrementarventas,  aumentar   la  participación  en  el  mercado,  cumplir   los  objetivos  de  ventaspresupuestados. Finalmente, lo descubierto y analizado se debe comunicar a aquellaspersonas en la organización que realizarán los cambios apropiados para mejorar lacompetitividad.

La definición[2] que propone The Datawarehouse Institute es:

“Business   Intelligence  (BI)  es  un  término paraguas que abarca  los  procesos,   lasherramientas y las tecnologías para convertir datos en información, información enconocimiento y planes para conducir de forma eficaz las actividades de los negocios.BI   abarca   las   tecnologías   de   datawarehousing,   los   procesos   en   el   'back   end',consultas, informes, análisis y las herramientas para mostrar información (estas sonlas herramientas de BI) y los procesos en el 'front end'.”

3 Objetivos de business intelligence

Según lo expuesto en la definición del término  business intelligence podemos decirque tiene los siguientes objetivos principales:

• Convertir datos en información, información en conocimiento y conocimiento enplanes operativos o estratégicos.

• Facilitar   la  disponibilidad de  información a  los  usuarios  de negocios,  que  lesayude a tomar decisiones más rápidamente.

• Apoyar de forma sostenible y continuada a las organizaciones para mejorar sucompetitividad,  ante  el   entorno  de  negocios  cambiante  de   forma  que puedanadaptarse a él.

• Ante la cantidad de información que va creciendo, disponer de más tiempo enanalizarla,   en   vez   de   gastar   mucho   tiempo   en   prepararla,   organizarla   yestructurarla.

• Permitir a las organizaciones dirigir de mejor forma, decidir, medir, gestionar yoptimizar el alcance de la eficiencia y los resultados financieros.

• Disminuir sustancialmente la incertidumbre que existe ante la toma de decisionesrespecto a un plan estratégico. 

4 Un ejemplo dónde se requiere business intelligence

Un supermercado, donde la información que disponemos son los tickets de venta. Elsistema de información está basado en la información que recogemos de las máquinasregistradoras.

Fig. 1. El formato del ticket utilizado en el supermercado.

La información que contiene el ticket de venta es: el número de ticket, la fecha, lahora,  código del cajero,  código del supermercado; por cada artículo vendido en el

ticket:  código del  artículo,  descripción del  artículo,  unidades vendidas,  precio porunidad, importe total por articulo. El importe total del ticket y la forma de pago.

A partir de esta información podemos saber:

• Número de tickets (en horario o día específico).• Número de tickets atendidos por cada cajero (en horario o día específico).• Ventas de artículos en unidades e importe (puede ser por día, semana, mes, año,

etc..).• Importe total de las ventas (puede ser por día, semana, mes, año, etc..).• Importe cobrado en efectivo o tarjetas de crédito.• Número promedio de tickets por hora, día, cajero, etc. • Importe promedio por ticket por hora, día, cajero, etc.

Esta información nos facilita la toma de decisiones tales como: reponer las existenciasde artículos, asignar turnos a los cajeros en función del número de tickets promediopor hora. Nos permite ver cuáles son los productos más vendidos, el medio de pagomás utilizado por los clientes.

Si hay una disminución en las ventas nos dirán si es un problema de afluencia alsupermercado  o  si   los  clientes  están  comprando  menos  de   lo  habitual.  El  primerproblema   debe   estar   relacionada   con   la   promoción   y   ante   el   segundo   problemadebemos intentar que nos compren más.

Al explorar la información discriminándola por día de la semana, nos damos cuentaque los sábados son los días de mayor venta y los miércoles son los de menor venta.En el caso de una anomalía de venta en un día sábado por ejemplo, se puede explicarcon variables como día festivo anterior o inclemencia del tiempo, si es el caso.

Si analizamos los tickets, capaz descubramos que hay relaciones entre productos, porejemplo   cuando   un   cliente   compra   fideos,   qué   probabilidad   hay   de   que   compretomates o extractos de tomate. Esta información es útil para las promociones.

Si   hemos   decidido   llevar   a   cabo   promociones,   queremos   saber   cuál   ha   sido   suefectividad y porqué.  Este aprendizaje es útil para futuras promociones y por endepara servir mejor a nuestro clientes.

Un supermercado  es  un negocio  que efectivamente  requiere  business   intelligence,vemos  que  se  plantean  constantes   interrogantes   a   lo   largo  del   flujo  de  negocios.Cuando vayamos desarrollando los elementos de business intelligence notaremos conclaridad cómo utilizarlo en entornos como el de un supermercado.   

5 Quién requiere business intelligence

Teniendo   en   cuenta   el   ejemplo   del   supermercado,   la   información   que   podemosgenerar a partir de  business intelligence  es útil  para todos los departamentos de laorganización:

• Responsables de compras, para saber la existencia en stock de cada artículo.• Responsables de ventas, que deciden la colocación de los productos, para ver qué

productos tienen mayor rotación.• Responsables de la negociación con las entidades financieras, para conocer los

flujos de efectivo, tarjetas de débito y crédito.• Responsables de marketing, para crear promociones o ver la efectividad de las ya

realizadas.• Responsables del personal, para asignar turnos en las cajas por ejemplo.

En definitiva, para todas aquellas personas de la organización que tengan que tomardecisiones. También vemos que las decisiones a tomar pueden ser del tipo operativo oincluso estratégico.

En un artículo[3] sobre el sector sanitario de EEUU narraba lo siguiente:“En   muchos   hospitales   los   analistas   financieros   destinan   un   80%   del   tiempo   aagregar y normalizar manualmente información en cálculo Excel, y tan sólo un 20%a analizar la información relevante”.

No es posible que pasemos el 80% del tiempo preparando información y tan sólo el20%   analizándola,   obviamente   debería   ser   al   revés.   Estas   afirmaciones   deberíandarnos ánimos suficientes para comenzar un largo camino hacia la implementación deproyectos de business intelligence en nuestras organizaciones. 

6 Componentes de business intelligence

Cinco son los componentes de  business intelligence, lo iremos desarrollando uno auno.

6.1 Fuentes de información

Fig. 2. Primer componente de business intelligence.

Las fuentes de información a las que podemos acceder son:

• Sistemas   operacionales   o   transaccionales,   que   incluyen   aplicación   hechas   amedida,   ERP   (Enterprise   Resources   Planning),   CRM   (Customer   RelationshipManagement), SCM (Supply Chain Management), etc.• Sistemas   de   información   departamentales:   hojas   de   cálculo,   informes,presupuestos, etc.• Fuentes de información externa, como contenido web, información adquirida deterceros por ejemplo: estudios de mercado, etc.• Información no estructurada como: correos electrónicos, cartas, informes, videos,etc. 

El número de fuentes de información varía de una organización a otra, en grandescorporaciones se habla de una media de 8 bases de datos, en algunos casos puedellegar hasta 50.

Cada vez más la tecnología nos permite trabajar con información no estructurada, y seespera que este tipo de información sea cada vez más importante. Una encuesta[4] haindicado que el 60% de los directores de Sistemas de Información y los de Tecnologíaconsideran   que   la   información   semi­estructurada   es   crítica   para   mejorar   lasoperaciones y para la creación de nuevas oportunidades de negocio.

Calidad de los datos

La calidad de los datos en un datawarehouse es fundamental, como afirma Bill Inmonen   su   artículo[5]   aparecido  en  “Business   Intelligence  Network”  sobre   calidad   dedatos:

“Las organizaciones  actúan bajo  la   suposición de  que  la   información de   la  quedisponen es precisa y válida. Si  la información no es válida, entonces no puedenresponder de las decisiones basadas en ella.”

Es necesario asegurar que la calidad de los datos es máxima. Si en el datawarehousehay errores, éstos se propagarán a lo largo de toda la organización y son muy difícilesde localizar. Además, pueden ocasionar que se tomen decisiones erróneas que afectenlos resultados de la organización.

Asumir que la calidad de los datos es buena puede ser un error fatal en los proyectosde business intelligence[6]. Los errores en los datos pueden provenir de los sistemastransaccionales  de   los  que   recuperamos   los  datos,   del  proceso  ETL o  del  propiodatawarehouse.

Debemos entender que la problemática de la calidad de datos no es un problema delos departamentos de tecnología, sino un problema estratégico al que debemos asignarobjetivos, recursos y planificación. No hay demasiadas organizaciones que tengan unplan   de   calidad   de   datos;   en   una   encuesta[7]   de  The   Datawarehouse   Instituterealizada en el año 2001, los resultados obtenidos fueron contundentes: el 48% de lasorganizaciones encuestadas no tenían un plan para gestionar o mejorar la calidad delos datos.

6.2 ETL – Proceso de extracción, transformación y carga

Fig. 3. Segundo componente de Business Intelligence.

El proceso trata de recuperar los datos de las fuentes de información y alimentar eldatawarehouse. El proceso de ETL[8] consume entre el 60% y el 80% del tiempo deun proyecto de  business intelligence,  por lo que es un proceso clave que requiererecursos, estrategia, habilidades y tecnologías.

El proceso ETL se divide en 5 subprocesos:

Extracción

La extracción de los datos se puede realizar bien de forma manual o bien utilizandoherramientas   de   ETL.   De   forma   manual   significa   programar   rutinas   utilizandolenguajes de programación que extraigan los datos de las fuentes. La alternativa es laque proveen   las  herramientas  especializadas  de ETL que han sido diseñadas  parallevar a cabo esta función.

Fig. 4. Principales problemas al acceder a los datos para extraerlos.

La Figura 4 se refiere a que la problemática de la extracción surge de que los datosprovienen   de   distintas   fuentes,   bases   de   datos,   plataformas,   protocolo   decomunicaciones, juego de caracteres y tipos de datos.

Hablamos de data staging o almacenes de datos intermedios mientras estamos en elproceso de limpieza de los datos. Acumulamos datos de distintas fuentes en el  datastaging, en un momento dado todos estos datos se cargarán en el datawarehouse. Losusuarios finales nunca acceden a este entorno.

Limpieza

Los sistemas transaccionales contienen datos que no han sido depurados y que debenser limpiados.  Las herramientas  ETL tienen funcionalidades de limpieza de datos.Algunas causas que provocan que los datos estén “sucios” son:

• Valores por defecto.• Ausencia de valor.• Campos que tienen distintas utilidades.• Valores contradictorios.• Uso inapropiado de los campos.• Reutilización de claves primarias.• Selección del primer valor de una lista.• Problemas de carga de antiguos sistemas o de integración entre sistemas.

La limpieza de datos se divide en distintas etapas:

• Depurar los valores (parsing): localiza e identifica los elementos individuales deinformación en las  fuentes  de datos.  Por ejemplo: separa el  nombre completo en:nombre, primer apellido, segundo apellido; o la dirección en: calle, número, etc.• Corregir (correcting):  corrige los valores individuales de los atributos usandoalgoritmos de  corrección y fuentes  de datos  externas.  Por ejemplo:  comprueba   ladirección y su código postal correspondiente.• Estandarizar   (standardizing):  aplica   rutinas   de   conversión   para   transformarvalores en formatos definidos y consistentes. Por ejemplo: trato de Sra. o Sr. cambiara sus correspondientes nombres completos.• Relacionar (matching): busca y relaciona los valores de registros, corrigiéndolosy estandarizándolos para eliminar duplicados. Por ejemplo: identificando nombres ydirecciones similares.

Transformación

Se   hace   partiendo   de   los   datos   una   vez   “limpios”.   Transformamos   los   datos   deacuerdo   a   las   reglas   de   negocio   y   los   estándares   que   han   sido   establecidos.   Latransformación incluye:

• Cambios de formato.• Sustitución de códigos.• Valores derivados y agregados.

Los   agregados   como   las   sumas   de   las   ventas   normalmente   se   pre­calculan   y   sealmacenan para conseguir mayores rendimientos. En este proceso también ajustamosel nivel de  granularidad o detalle, por ejemplo: podemos tener detalles a nivel delineas   de   factura   en   los   datos   extraídos,   pero   en   el  datawarehouse  lo   quealmacenamos son las ventas semanales o mensuales. La diferencia del nivel de detalleen el análisis es lo que denominamos granularidad.

Debemos   decidir   cuál   es   el   nivel   de  granularidad  que   nos   permita   responder   aaquellas   preguntas   que   nos   hemos   formulado,   ya   que   al   determinar   un  nivel   degranularidad podremos responder algunas preguntas pero no otras. 

Carga

Es  el  momento  en   el  que   cargamos   los  datos   en   el  datawarehouse  y   en   el   quedebemos   comprobar   por   ejemplo:   si   los   totales   de   ventas   que   hemos   cargadocoinciden con la información que residía en nuestro sistema transaccional.

Es fundamental comprobar que todo se ha llevado a cabo correctamente, ya que de locontrario puede llevar a decisiones erróneas de los usuarios.

Actualización

Este proceso determina la periodicidad con el que haremos nuevas cargas de datos aldatawarehouse.

6.3 Datawarehouse o almacén de datos

Fig. 5. Tercer componente de Business Intelligence.

La aparición de los datawarehouses son la respuesta a las necesidades de los usuariosque   necesitan   información   consistente,   integrada,   histórica   y   preparada   para   seranalizada   y   poder   tomar   decisiones.   Si   el  datawarehouse  está   construidoadecuadamente proporciona un entorno de información que nos permitirá encontrarnuevo conocimiento y generar valor.

El profesor Hugh J. Watson[9] lo define como:

“Un   datawarehouse   es   una   colección   de   información   creada   para   soportar   lasaplicaciones  de   toma de  decisiones.  Datawarehousing es  el  proceso  completo  deextraer información, transformarla y cargarla en un datawarehouse y el acceso aesta información por los usuarios finales y las aplicaciones.”

Bill   Inmon[10]   fue   el   que   definió   las   características   que   debe   cumplir   undatawarehouse:

• Orientado a un área: cada parte del datawarehouse está construida para resolverun problema de negocio. Por ejemplo: entender los hábitos de compra de nuestrosclientes, analizar la calidad de nuestros productos, analizar la productividad de unalínea de fabricación.• Integrado:  la información debe ser transformada en medidas comunes, códigoscomunes y formatos  comunes para ser  útil.  Por ejemplo:   la  moneda en que estánexpresadas los importes es común.• Indexado en el tiempo: se mantiene la información histórica. Ello nos permite porejemplo: analizar la evolución de las ventas en los periodos que queramos.• No   volátil:  los   usuarios   no   la   mantienen   como   lo   harían   en   los   entornostransaccionales. No se ve actualizado continuamente, sino periódicamente de formapreestablecida. La información se almacena para la toma de decisiones.

Ralph Kimbal[11] define los objetivos que debería cumplir un datawarehouse:

• El   alcance   de   un  datawarehouse  puede   ser   bien   un   departamento   o   biencorporativo[12].• El  datawarehouse  no   es   sólo   información   sino   también   las   herramientas   deconsulta, análisis y presentación de la información.• La información del datawarehouse es consistente.• La   calidad   de   información   en   el  datawarehouse  es   el   motor   de  businessreengineering[13].

Data Mart

Los datawarehouses se representan habitualmente como una gran base de datos, peropueden   estar   distribuidos   en   varias   bases   de   datos.   El   trabajo   de   construir   undatawarehouse   corporativo  puede   generar   inflexibilidades,   ser   costoso   o   requerirplazos de tiempo inaceptables. En parte, estas razones originaron la aparición de losdata mart.

Normalmente,   los  data   mart  son   más   pequeños   que   los  datawarehouses.   Tienenmenos cantidad de información, menos modelos de negocios y son utilizados por unnúmero menor  de  usuarios.  Los  data mart  almacenan   información  de un númerolimitado de áreas, por ejemplo: pueden ser de ventas y de marketing.

Los data mart pueden ser independientes o dependientes.

Fig. 6. Data Mart independientes.

Fig. 7. Data mart dependientes.

Los  data mart  independientes son alimentados directamente por los orígenes de lainformación,  mientras  que   los  dependientes   se  alimentan  desde el  datawarehousecorporativo.

Los  data   mart  independientes   pueden   perpetuar   el   problema   de   los  “silos   deinformación” que es el que sucede cuando entre distintos departamentos no fluye lainformación necesaria, bien para la gestión o bien para el análisis, dando lugar tanto aproblemas de operaciones como de optimización del negocio. También la evoluciónde un data mart puede llegar a generar inconsistencias con otros data mart.

Esta   estrategia   se   utiliza   a   veces   como   un   paso   previo   al   desarrollo   de   undatawarehouse corporativo.

Metadata

Un componente critico del datawarehouse es el metadata o diccionario de datos. Nosda el significado de cada uno de los componentes y sus atributos que residen en  eldatawarehouse o en el data mart. Esta información es útil para los departamentos detecnología y para los propios usuarios.

El personal  de  los  departamentos  de Tecnología necesita  saber   los  orígenes de  lainformación: bases de datos, transformaciones realizadas, criterios de filtro, nombrede las columnas y de las tablas, plazos de carga, tipos de datos, formatos, etc.

Los usuarios necesitan saber las entidades y sus atributos, cómo han sido calculados,transformados,   detalle   de   las   transformaciones,   los   informes   disponibles,   losresponsables de los datos, etc.

Obliga   a  que   se  definan   los   conceptos   de  negocio  y   se  homogeneicen   entre   losdistintos   departamentos,   sucursales,   etc.   Obliga   a   que   todos   hablen   utilizando   lamisma terminología y con el mismo significado. Por ejemplo: cuando alguien hablede “margen bruto” o “margen de contribución” deberá estar definido sin ambigüedadpara toda la organización.

6.4 Herramientas de business intelligence

Fig. 8. Herramientas para tratar y visualizar lo que reside en un datawarehouse.

Existen distintas tecnologías que nos permiten analizar la información que reside enun datawarehouse, pero la más extendida es la OLAP (Online Analytical Processing).Los usuarios[14] necesitan analizar información a distintos niveles de agregación ysobre múltiples dimensiones. Por ejemplo: ventas de productos por clientes o tipo de

cliente,  por  zona de  venta  y por   fecha.  OLAP provee de  estas   funcionalidades  yalgunas más.

A estos tipos de análisis   les  llamamos  multidimensionales,  porque nos facilitan elanálisis  de  un  hecho  desde distintas  perspectivas  o dimensiones.  Los modelos  denegocios normalmente son multidimensionales.

Fig. 9. La representación gráfica del OLAP son los cubos.

En el cubo tenemos las unidades vendidas de cada uno de los libros, para los distintosclientes y en los distintos años. Este es el concepto de multidimensionalidad. Loscontenidos de cada de los cubos individuales son los “hechos” (las unidades vendidasen nuestro ejemplo). En la actualidad las soluciones OLAP permiten que cada uno delos cubos individuales pueda contener más de un hecho.

Rotar   (en   inglés  slicing)   los   cubos,   es   decir   cambiar   el   orden   de   las   distintasdimensiones. Como vemos en la Figura 10 hemos cambiado la dimensión “clientes”por la de “libros”.

Fig. 10. Las herramientas OLAP nos permiten rotar los cubos.

También podemos seleccionar (del inglés “dicing”) sólo algunas de las celdas. En laFigura 11 las ventas al cliente 2 de los libros 1 y 2 en el año 1.

Fig. 11. Las herramientas OLAP nos permiten seleccionar algunas celdas.

El máximo nivel de agregación (del inglés  “roll­up”), en el ejemplo obtenemos eltotal de libros vendidos por cliente y por año.

 

Fig. 12. Las herramientas OLAP nos permiten obtener el máximo nivel de agregación.

En la Figura 13, los libros 1 y 2 corresponden a la materia 1, mientras que el libro 3corresponde a la materia 2. En este caso bajamos a más detalle (del inglés  “drill­down”)   a   través   de   la   jerarquía   “materias”.   Las   jerarquías   nos   permiten   haceragrupaciones.

Fig. 13. Las herramientas OLAP nos permiten obtener el mayor detalle posible.

Distintos tipos de herramientas OLAP

•  ROLAP (relational OLAP): se accede a una base de datos relacional (RDBMS).Accede habitualmente sobre  un modelo “estrella”.  La principal  ventaja  es que notiene limitaciones en cuanto a tamaño, pero es más lento que el MOLAP.• MOLAP (multidimensional OLAP):  se accede directamente  sobre una base dedatos   multidimensional   (MDDB   –   Multi   Dimensional   Data   Base).   La   principalventaja es que es muy rápida en los tiempos de respuesta y la principal desventaja esque, si queremos cambiar las dimensiones, debemos cargar de nuevo el cubo.• HOLAP (hybrid OLAP): se accede a los datos de alto nivel en una base de datosmultidimensional y a los atómicos directamente sobre la base de datos relacional.

Alternativas a OLAP

Una   alternativa   al   OLAP   son   las   herramientas   que   utilizan   consultas   de  lógicaasociativa[15].   Cuando   se   carga   la   información,   se   comprime   y   se   normaliza   almáximo para que no haya información redundante. Cada valor único para todos losdatos se almacena una sola vez y se referencia a través de punteros.

Por ejemplo: si existen muchos registros “coche rojo” y también “coche azul”, sólouna vez se almacena la palabra “coche”,  la palabra “rojo” y la palabra “azul”.  Seindexan el 100% de los datos y se eliminan los datos redundantes  y los valores nulos,lo que lleva a un menor uso de espacio en disco y menores tiempos de escritura ylectura.

El  modelo de  almacenamiento   interno  proporciona  una visión vertical   (basada  encolumnas) de los datos así como una visión horizontal ampliada (basada en filas) queva   más   allá   de   las   tecnologías   de   base   de   datos   relacionales.   Las   consultas   sonaltamente eficientes debido al nuevo modelo de almacenamiento.

Principales herramientas[16] de business intelligence

• Herramientas  OLAP:  permiten  a  los  usuarios   finales   tratar   la   información deforma multidimensional  para  explorarla  desde distintas  perspectivas  y periodos detiempo.• Herramientas de Dashboard[17] y Scorecard: permiten a los usuarios finales verinformación crítica del rendimiento con un sólo vistazo mediante íconos gráficos o laposibilidad de ver más detalles si lo desean.• Herramientas Datamining:  datamining  es el proceso de descubrir e interpretarpatrones desconocidos en la información, mediante los cuales resolver problemas denegocio. Los usos más habituales de  datamining  son: segmentación, venta cruzada,sendas de consumo, clasificación, previsiones, optimizaciones, etc.• Herramientas   de   Text   mining:  nos   permiten   trabajar   con   información   noestructurada y herramientas de visualización avanzada.• Generadores de informes: utilizadas por desarrolladores profesionales para crearinformes para grupos, departamentos, organización, etc.• Herramientas de usuario final de consultas e informes: para usuarios finales paracrear informes para ellos mismos o para otros, no requiere programación.• Herramientas de planificación, modelización y consolidación:  para elaborar laplanificación,   los   presupuestos,   las   previsiones.   Estas   herramientas   proveen   a   losdashboards y a los scorecards de los objetivos y de los umbrales de las métricas. 

7 Conclusiones

En   el   mundo   actual   de   los   negocios,   con   toda   la   información   que   disponen   lasorganizaciones,   tanto   la   que   se   genera   de   forma   interna   como   producto   de   lasoperaciones   transaccionales   cotidianas,   así   como  la   información  externa  que   estádisponible,  se presenta  el  desafío de saber qué  hacer  con ellas  para  utilizarlas  enbeneficio de la organización.

Este desafío recae sobre los empleados de la organización que deben tomar decisionesempresariales,   y   que   determinarán   en   un   futuro   no   muy   lejano   el   nivel   decompetitividad de la empresa. Estas decisiones muchas veces requieren ser tomadasen un momento determinado y sin mucha demora.

Debido a esta gran responsabilidad de guiar el rumbo competitivo de la empresa, esque deben armarse de las mejores herramientas, métodos, técnicas, conceptos, etc. Eneste entorno es donde entra en juego business intelligence o inteligencia de negocio,que   busca   transformar   toda   esa   información   en   conocimiento,   para   la   toma   dedecisiones tanto operativas como estratégicas.

Siguiendo   los   pasos   que   propone  business   intelligence  y   con   las   herramientasdisponibles para su implantación, se dota a los usuarios tomadores de decisiones, de

un entorno  completo  donde encontrar  soluciones  a   los  problemas  operacionales  oestratégicos   que   les   toca   resolver,   así   como   también   pueden   analizar,   calcular,proyectar, medir, etc.. el alcance de las decisiones que van a tomar. 

Referencias

[1]   Glosario   de   Gartner:  www.gartner.com.   Gartner   es   una   consultora   internacionalespecializada en TICs (Tecnologías de Información y Comunicación).[2]  Enterprise   Business   Intelligence:   Strategies   and   Technologies   for   Deploying  BI   on  anEnterprise Scale, Wayne W. Eckerson y Cindi Howson, TDWI Report Series, Agosto 2005.[3]  Traducido del artículo: “Business Intelligence tools can help turn out savings in core costareas” de Matthew B. Rice, publicado en Managed Healthcare Alliance, March 2004.[4]     Blumberg,   R.   y   S.   Atre   “The   Problem   with   Unstructured   Data”,   DM   Review,http://dmreview.com/master.cfm?NavID=55&EdID=6287 (12 Septiembre 2003).[5]  Disponible en http://www.b­eye­network.com/, agosto 2006.[6]  “The Basics of datawarehousing”, Mark Beyer y Donald Feinberg, Gartner, 2006.[7] TDWI, Report Series: “Data Quality and the Bottom Line”, por Wayne W. Eckerson, 2002.[8] “Evaluating ETL and Data Integration Platforms”,  por Wayne Eckerson y Colin White,TDWI Report Series, 2003.[9]   Esta definición ha sido extraídas de una presentación titulada: “Recent Developments indatawarehousing:   A   Tutorial”,   disponible   en   la   web:http://www.terry.uga.edu/~hwatson/dw_tutorial.ppt, agosto 2006.[10]  “Building the datawarehouse” (1a edición), Inmon, W.H., QED Press, New York, 1992.[11] “The datawarehouse Toolkit.” Ralph Kimball. Wiley, 1996.[12]     Los   interesados   en   los   datawarehouse   corporativos   pueden   profundizar   en   el   libro“Corporate Information Factory” de W.H. Inmon, C. Imhoff y R. Sousa, Wiley, 1997.[13]     El   Business   Reengineering   o   Business   Process   Reengineering   fue   definido   por   M.Hammer en su artículo “Rediseño del trabajo: no automatice, elimine” publicado en HarvardDeusto Business Review, 3 er trimestre de 1991. El BPR es una metodología de transformaciónde las organizaciones que se centra en los aspectos clave y no en cómo se están haciendo lascosas,  parte  de  la   tesis  de que en muchos casos se  han aplicado nuevas  tecnologías sobreprocesos   antiguos.   Dicho   de   otro   modo,   ineficiencia   más   tecnología   es   “ineficienciaautomatizada”.[14]  Building the datawarehouse, W.H. Inmon, Willey, 1996.[15]  Como se describe en: “QlikTech’s Approach to Business Intelligence: Keep It Simple andFlexible”, D. Vesset y B. McDonough IDC, julio 2006. Uno de los productos que utiliza estatecnología es Qlikview de QlikTech, que patentó el Associative Query Logic (AQL).[16] “Enterprise Business Intelligence: Strategies and Technologies for Deploying BI on anEnterprise Scale”, Wayne W. Eckerson y Cindi Howson, TDWI Report Series, Agosto 2005.[17]   “Dashboard” y “Scorecard” son traducidos del  inglés habitualmente por “Cuadros deMando”. La diferencia básica es que los primeros tan sólo muestran indicadores de áreas denegocio que no tienen por qué estar relacionados entre ellos y pueden ser de tan sólo una partede   la   organización,   son   básicamente   operativos   o   tácticos,   mientras   que   los   segundos   sedesarrollan a nivel estratégico, se establecen relaciones entre los indicadores y suelen cubrirtoda  la organización.  Los principales  precursores  de estos  últimos son Robert  S.  Kaplan yDavid P.  Norton con el Balanced Scorecard,  que publicaron en su artículo: “The BalancedScorecard  –  Measures  That  Drive  Performance”,  Harvard  Business  Review,  enero­febrero,

1992. Para aquellos lectores que quieran profundizar en la diferencia entre “Dashboards” y“Scorecards”   y   analizar   sus   principales   diferencias   pueden   utilizar   el   informe   de   Thedatawarehouse Institute, publicado en Julio de 2006 por W.W. Eckerson, titulado: “DeployingDashboards and Scorecards”.