Microsoft Business Analytics 2013

81
Microsoft Business Analytics 2013 José Redondo - @redondoj CL SQL PASS Venezuela, Caracas Chapter – DPA SolidQ – SC SynergyTPC [email protected] http://redondoj.wordpress.com

description

Breve exposición sobre la panoramica visión de Microsoft sobre Big Data, Hadoop, BI y la nube en general.

Transcript of Microsoft Business Analytics 2013

Page 1: Microsoft Business Analytics 2013

MicrosoftBusiness Analytics 2013

José Redondo - @redondoj

CL SQL PASS Venezuela, Caracas Chapter – DPA SolidQ – SC SynergyTPC

[email protected]

http://redondoj.wordpress.com

Page 2: Microsoft Business Analytics 2013

AGENDA

• Análisis Empresarial en el Nuevo Mundo de Datos• Análisis del Big Data• Demo• Plataforma Analítica On-Premise, Cloud y Híbrida• Demo• Análisis Avanzado• Demo• Conclusiones

Page 3: Microsoft Business Analytics 2013

MicrosoftBusiness Analytics 2013Poder y Simplicidad

Page 4: Microsoft Business Analytics 2013

Análisis Empresarial en el Nuevo Mundo de Datos

Page 5: Microsoft Business Analytics 2013

Propósito de BI

Ayudar a los usuarios a generar una mejor decisión empresarial

Enfocado en lo que dice & Conocimiento oculto en los datos

Page 6: Microsoft Business Analytics 2013

El mundo de los datos es cambiante

Explosión de los datosHambre de informaciónNuevas preguntas

Aumento de 10x cada 5 años

85% desde nuevos tipos de datos

Page 7: Microsoft Business Analytics 2013

Propósito del Análisis Empresarial

Apoderar a las personas a tomar decisiones de sentido común basadas en hechos probados

Extraer el conocimiento de los datos, validando, simplificándolo y visualizando

Page 8: Microsoft Business Analytics 2013

Análisis Empresarial

Almacenes de datos (DW)

Big data BI

Page 9: Microsoft Business Analytics 2013

Valores de análisis modernos

Nuevo mundo de datos

En 2015, las organizaciones han de integrar alto valor, diversificándose, generando nuevos tipos y fuentes de información en una infraestructura de gestión de información coherente, superando a sus colegas del sector financieramente por más de 20 %.

Gartner, Regina Casonato et al., “Information Management in the 21st Century”

Page 10: Microsoft Business Analytics 2013

Una buena Plataforma BI es la clave para el Análisis Empresarial

Información CorrectaContexto AdecuadoFormato Atractivo

EnfocadoFiltradoSimplificado

Page 11: Microsoft Business Analytics 2013

Implantaciones Inmersivas

Cualquier dato,cualquier tamaño,en cualquier lugar

Conectando con el mundo de los datos

Microsoft Business Analytics

Page 12: Microsoft Business Analytics 2013

Implantaciones Inmersivas

Cualquier dato,cualquier tamaño,en cualquier lugar

Conectando con el mundo de los datos

Microsoft Business Analytics

Page 13: Microsoft Business Analytics 2013

Microsoft Business Analytics

Excel: Fundación de autoservicio analítico

Compartir

Limpieza

Mash-up

Explorar

Visualizar

Reportar

Page 14: Microsoft Business Analytics 2013

Familiar, análisis poderoso

PowerPivot,DAX, Cubes, Data Mining

ColaborarEscalarAdministrar

Power ViewCharts, Slicers, Timelines

Page 15: Microsoft Business Analytics 2013

Que acontece?

Modelos preparados y probados por un analista o usuario

Interacción con el usuario de manera natural, sin embargo, es escalable y segura

Modelo Tabular desplegado desde Excel para IT, refrescando diariamente los datos desde DW

Page 16: Microsoft Business Analytics 2013

Mobilidad

Próximamente, aplicaciones BI móbiles nativas para iOS y Windows 8

Generado en SharePoint 2013, PPS optimizado ahora para táctil

Page 17: Microsoft Business Analytics 2013

Rápido, Avanzado In-Memory

xVelocity In-Memory Analytics

Data warehouse

Desktop Modelo Analítico

Mañana: OLTP Relacional

“Hekaton”

Page 18: Microsoft Business Analytics 2013

Conectandocon el mundo de los datos

Hacia

DesdeBUSQUEDA

RECOMENDACIÓN

IDENTIDADCONTEXTO DOCUMENTAL

GRAFICACIÓN SOCIAL

EXPLORADOR DE DATOSDATA HUB

Page 19: Microsoft Business Analytics 2013

Data Quality, EUC, End-User Computing (Spreadmart)

MDM – Administrador Maestro de Datos

AutoservicioCalidad del origen de datos

DQS – Servicios de Calidad de Datos

Calidad de ETL’s

Office Audit and Control Management Server 2013

Page 20: Microsoft Business Analytics 2013

Cualquier dato, cualquier tamaño,en cualquier lugar

Relacional

No relacional

Streaming 010101010101010101

101010101010101001010101010101

101010101010

Page 21: Microsoft Business Analytics 2013

Cualquier dato, cualquier tamaño,en cualquier lugar

Parallel Data Warehouse

Business Data Appliance

Fast Trackfor

Arquitectura de referencia DW

Aplicando DWAlmacén de Datos Relacionales

Relacional, Estructurado

Page 22: Microsoft Business Analytics 2013

Cualquier dato, cualquier tamaño,en cualquier lugarComplejidad, No Relacional, No Estructurado

Seguridad Empresarial, DisponibilidadIntegración con herramientas Microsoft BIProvisión en minutos con Windows Azure

Microsoft HDInsightHadoop

Page 23: Microsoft Business Analytics 2013

Análisis del Big Data

Page 24: Microsoft Business Analytics 2013

Big data, o sólo datos complejos?

Velocidad

Variedad Complejidad

volume

Data

InterpretandoPreparando

Page 25: Microsoft Business Analytics 2013

Big data de hoy, pocos datos del mañanaComplejidad vs. Capacidades actuales

Page 26: Microsoft Business Analytics 2013

Dominio Escenarios comunes de Big DataServicios Financieros Modelando riesgos reales

Detección de fraude y análisis de amenazasVigilancia del comercioCredit scoring y análisis

Medios & Entretenimientos Motores de recomendaciónAd targeting

Calidad de búsquedaAbuso y haga clic en detección de fraude

Ventas Punto de análisis de transacciones de ventasAnálisis de abandono de clientes

Sentimiento analítico

Telecomunicaciones Prevención de abandono de clientesOptimización de rendimiento de la red

Análisis Call Detail Record (CDR)Predicción de fallas de redes

Gobierno Seguridad cibernética (botnets, fraudes)Congestión de tráfico y desvíos

Monitoreo ambientalMonitorización antisocial a través de los medios de comunicación social

Salud Investigación genómicaInvestigación del cáncer

Detección temprana de las pandemias de saludMonitoreo de la calidad del aire

Page 27: Microsoft Business Analytics 2013

Big Data + BI Tradicional = Power & Simplicidad

Grandes, rápido, o datos complejos

Microsoft HDInsightSQL Server tabular,

multidimensional, DW relacional, o PDW

0101010101010101011010101010101010

01010101010101101010101010

Interacción, exploración, visualización

Page 28: Microsoft Business Analytics 2013

Microsoft HDInsight

Distribución de Apache Hadoop

Desarrollado por Hortonworks & Microsoft

Integrado con Microsoft BI

Page 29: Microsoft Business Analytics 2013

Principios de Hadoop

Método práctico para paralelización masiva de procesamiento de datos analítico

dataDistribuidaprocesamientoDistribuido

Motor analítico de Microsoft, Yahoo, Google, Facebook, Netflix, Klout…

Page 30: Microsoft Business Analytics 2013

Principios de Hadoop: Datos

HDFS (Hadoop File System)Rack de red consistente para reducir al mínimo las transferencias

Acceso como archivos normalesConsulta como almacén (Hive) usando HiveQL

Page 31: Microsoft Business Analytics 2013

Principios de Hadoop: MapReduce

Su lógica de procesamiento se divide entre mapeo y reducir las funciones

Mapear el problema en más pequeño (dividir)

Reducir resultados en agregados de alto nivel (conquistar)

MapReduce es como dividir-y-conquistar

Page 32: Microsoft Business Analytics 2013

Hadoop Clúster

dataDistribuidaprocesamientoDistribuido

Yahoo! Hadoop cluster, about 2007.

Page 33: Microsoft Business Analytics 2013

Hadoop Clúster

dataDistribuidaprocesamientoDistribuido

Buster Cluster, es un proyecto de investigación temprana creado por Miles Osborne, University of Edinburgh, School of Informatics.

Page 34: Microsoft Business Analytics 2013

Hadoop Clúster

dataDistribuidaprocesamientoDistribuido Cloud

rent-a-Hadoop-cluster, o:“Supercomputer for cents”Windows Azure HD Insight

Page 35: Microsoft Business Analytics 2013

Procesamiento lógico en HDInsight

Escribe Jobs de MapReduce en Java o cualquier lenguaje de Windows (.NET), mediante la entrada-salida estándar

Pig Latin con Funciones Definidas por el Usuario (UDFs) en Python, JS, C#, Java, and .NET

Bajo nivel, rápido, complejo Sencillo, Paralelismo masivo

Page 36: Microsoft Business Analytics 2013

Contador de Palabras en JSMapReduce• var map = function (key, value, context)

{

• var words = value.split(/[^a-zA-Z]/);

• for (var i = 0; i < words.length; i++) {

• if (words[i] !== "") {

•context.write(words[i].toLowerCase(), 1);

• }

• }

• };

• var reduce = function (key, values, context) {

• var sum = 0;

• while (values.hasNext()) {

• sum += parseInt(values.next());

• }

• context.write(key, sum);

• };

Page 37: Microsoft Business Analytics 2013

Ejemplo de Pig LatinEsto es Paralelismo!!!raw = LOAD ’search.log' USING PigStorage('\t') AS (user, time, query);

houred = FOREACH raw GENERATE user, org.apache.pig.tutorial.ExtractHour(time) as hour, query;

ngramed1 = FOREACH houred GENERATE user, hour, flatten(org.apache.pig.tutorial.NGramGenerator(query)) as ngram;

ngramed2 = DISTINCT ngramed1;

hour_frequency1 = GROUP ngramed2 BY (ngram, hour);

… [see http://pig.apache.org/docs/r0.7.0/tutorial.html]

STORE ordered_uniq_frequency INTO '/tmp/tutorial-results' USING PigStorage();

Page 38: Microsoft Business Analytics 2013

Procesamiento lógico reutilizable - Librerías

Aprendizaje automáticoMinería de datos escalable

Filtrado colaborativo, Recomendadores, Clustering, La descomposición en valores simple, Parallel frequent pattern mining, Naive Bayes, Árbol de decisión

Page 39: Microsoft Business Analytics 2013

Desde HDInsight haciendo mas atractivo Microsoft BI

Conector para Hadoop de SQL Server & PDWDriver ODBC para HivePanel Excel Hive

Prontamente: SQL Server PolyBase:Unificando las consultas relacionales de SQL y Hive, no es necesario para HiveQL

Page 40: Microsoft Business Analytics 2013

Operacionalizando Hadoop

Microsoft HDInsight para:

Aprovisionamiento y gestión de clústeresAsignación de JobsSeguridadEscalabilidad

Page 41: Microsoft Business Analytics 2013

DEMO

Page 42: Microsoft Business Analytics 2013

Plataforma AnalíticaOn-Premise, Cloud y Híbrida

Page 43: Microsoft Business Analytics 2013

Evolución de la Infraestructura IT

Nube Privada: VMs + Admin Cloud

Nube Pública con VMs

Nube Pública sin VMs: Cloud OS

Centro de Datos no virtualizados

Centro de datos virtualizados

IT Hibrido

Page 44: Microsoft Business Analytics 2013

Seis infraestructuras encuatro categorías

PrivadaNUBE

TradicionalNO-VIRTUALIZADO

PublicaNUBE

IT Híbrida

AplicacionesNo-Virtualizadas

Agrupado (Virtualizado)ElásticoAutoservicioBasada en el uso

Servicios GestionadosAgrupado (Virtualizado)ElásticoAutoservicioBasada en el uso

Aplicaciones HíbridasMódulos de aplicaciones y datos en-prem y off-prem

Page 45: Microsoft Business Analytics 2013

Tradicional Centro de Datos

No-Virtualizado

Tradicional, Full Control, Costoso para gestionar, actualizar, migrar

Page 46: Microsoft Business Analytics 2013

Centro de Datos Virtualizados

Hyper-V Primer paso hacia la nube privadaMás baratoNo hay beneficios palpables en la nube todavía

Page 47: Microsoft Business Analytics 2013

Nube Privada

Administrando VMs +System Center

Nube privadaBasado en PlantillasAprovisionamiento,Gestión de acciones y métricas

Page 48: Microsoft Business Analytics 2013

Nube Pública con VMs

Nube AdministradaVMs Administradas

Fácil administración desde la Nube PrivadaTodos los beneficios de la Nube PrivadaTCO eficiente

Page 49: Microsoft Business Analytics 2013

Nube Pública es un nuevo OS,no VMs

Servicios en la Nube para nuevas aplicaciones de software

Moderno & orientado al futuroMejor escalabilidad y agilidadNo incrementa el costo capital, Usualmente es más económica

Page 50: Microsoft Business Analytics 2013

IT Híbrido: Privada + Publica

Muchas combinaciones de arquitecturas

Privada no-VM—publica VMPrivada VM—publica VMPrivada VM—publica non-VMPrivada no-VM—publica non-VM

Page 51: Microsoft Business Analytics 2013

Opciones para una Plataforma Análitica

Granjas PrivadasGranjas Públicas VMSharePoint Online

Servidores PrivadoPublicas en VMAzure:SQL Database,SQL Reporting,Datamarket, HDInsight

Localmente instaladoOffice 365SkyDrive

Page 52: Microsoft Business Analytics 2013

IT Hibrido

Page 53: Microsoft Business Analytics 2013

Todas las caractéristicasAnalisis moderno

Granjas Privadas en la Nube+Granjas Públicas VM

Servidores Privados,Windows HDInsight+Publicas en VMHDInsight Azure

Localmente instalado+Office 365

Page 54: Microsoft Business Analytics 2013

Porqué Microsoft para IT Híbridos

PrivateCLOUD

TraditionalNON-VIRTUALIZED

PublicCLOUD

Recursos Comunes

IT Híbrido

Identidad Herramientas de Desarrollo Herramientas de Adm

Page 55: Microsoft Business Analytics 2013

Nube en nuestros términos

Page 56: Microsoft Business Analytics 2013

Nube Pública: Dos opciones

Nube Pública

Page 57: Microsoft Business Analytics 2013

Aplicaciones Híbridas (VM)

Business App

Connect

SQL Server

ON-PREM

WINDOWS AZURE

Windows Azure Virtual Network

Exte

nd

Flexibility & Control

Low TCO for Existing Apps

Full SQL Server Capability

Managed Infrastructure

SQL Server in VM

Page 58: Microsoft Business Analytics 2013

Nuevos diseños de Appsen la Nube

SQL Database

Mobile Web

Managed Platform & Infra.

Low TCO for New Apps

Dynamic Scalability

Based on SQL Server Technology

Page 59: Microsoft Business Analytics 2013

Apps Híbridos (no VM)

On-Prem Business App

SQL Database

On-Prem SQL Server

Data Sy

nc

Connect

Conn

ect

Managed Platform & Infra.

Low TCO for New Apps

Dynamic Scalability

Based on SQL Server Technology

Page 60: Microsoft Business Analytics 2013

Nube Privada

Page 61: Microsoft Business Analytics 2013

Todas las característicasNube Privada Analítica

Granjas de Nubes Privadas

Nube Privada, HDInsight para Windows Server

Instalado localmente

System Center para la administración y aprovisionamiento de la nube privada

Page 62: Microsoft Business Analytics 2013

SQL Server para la Nube Privada

Page 63: Microsoft Business Analytics 2013

Soluciones para la Nube Privada

Rápido Tiempo de solución

Bueno Muy bueno Excelente

Ejecución a escala

Flexible en componentes

Rápido Tiempo de solución

Bueno Muy bueno Excelente

Ejecución a escala

Flexible en componentes

Rápido Tiempo de solución

Bueno Muy bueno Excelente

Ejecución a escala

Flexible en componentes

Construido sobre DW relacional

Arquitectura de Referencia Fast Track DW

Infraestructura PDW & BDW

Page 64: Microsoft Business Analytics 2013

DEMO

Page 65: Microsoft Business Analytics 2013

ANALÍSIS AVANZADO

Page 66: Microsoft Business Analytics 2013

DAXMicrosoft Analytics Lenguaje

Estilo Excel, Expresiones tabularesCampos calculados & KPI’sContextos & filtros consistentes

Forma parte de Excel 2013 Modelo de datos (PowerPivot)Lenguaje para proyectos SSAS tabular

Data Analysis Expressions

Page 67: Microsoft Business Analytics 2013

Expresiones DAX

= [First Name] & " " & [Last Name] Concatenación de cadenas, como en Excel

= SUM (Sales[Amount]) Creación de SUM en contextos de agregaciones

= RELATED (Product[Cost]) Sigue relaciones entre tablas, como las uniones

No se hace referencia a celdas o rangos individuales

Las funciones siempre se refieren a las columnas o tablas

Page 68: Microsoft Business Analytics 2013

Modelo Semántico BI

Data Model

Business Logic & Queries

Data Access ROLAP MOLAP xVelocity

MDX, soon: “DAXMD” DAX

Multidimensional Tabular

Applications Power View Excel PowerPivot

Databases Applications Files OData feeds Cloud services

SharePoint

Direct query

Page 69: Microsoft Business Analytics 2013

Entregando Power View y PowerPivot a los usuarios

Archivos Standalone Excel

Excel en SharePoint, SharePoint Online, SkyDrive

Power View, PowerPivot directamente en SSAS ModoSharePoint

Modelo tabular SSAS nativo + Archivo de conexión SharePoint BISM

Page 70: Microsoft Business Analytics 2013

SQL Server 2012 Analysis ServicesTabular Mode

Escalabilidad empresarial y seguridad para el modelo de datos

Accesible desde SharePoint y sus aplicaciones

Construido en Excel PowerPivot, desplegado en SSAS

Seguridad dinámica, Particiones, >2 billones de registros, imagenes

Page 71: Microsoft Business Analytics 2013

Power View

Exploración de datos interactivos y presentación visual Experiencia de usuario

Excel 2013 SharePoint 2013 SQL 2012 SP1 Reporting Service

Page 72: Microsoft Business Analytics 2013

Visualización de datos Power View

Tablas, matrices, small multiples, cards, tiles, filters, slicers

Chart, scatter plot, bubble animation

Interacción Geoespacial y Mapas con Bing

Page 73: Microsoft Business Analytics 2013

Qué hace la Minería de Datos?

Buscar objetivos

Explorar sus datos

Predecir

Page 74: Microsoft Business Analytics 2013

Qué es la Minería de Datos?

Estadística, probabilidad y aprendizaje automático

Visualización de patrones

Tecnología para el descubrimiento de patrones de conocimiento ocultos, correlaciones

Page 75: Microsoft Business Analytics 2013

Minería de

Datos

Análisis de rentabilidad

Entender las necesidades del cliente

Anticipar acciones

Predecir ventas &

inventario

Construir efectivamente campañas

de mercadeo

Detectar y prevenir fraudes

Corregir datos

durante procesos

ETL

Page 76: Microsoft Business Analytics 2013

SQL ServerAnalysisServicesServer

Tus modelos de mineria de datos

Algoritmos de mineria de datos Origendatos

Excel, Visio, SSRSTu aplicación

Despliegue

ExcelVisioSSDTSSMS

AppData

Arquitectura de la Minería de Datos

Page 77: Microsoft Business Analytics 2013

Data Mining Add-Ins paraOffice 2013

Gratis!Conecta a Excel y Visio hacia SSAS

Tab Data Mining

Full Power

Tab de AnálisisSencillo de usar

Page 78: Microsoft Business Analytics 2013

Decision Trees

Finds the odds of an outcome, great for visualising relationships between values

Association Rules

Identifies causal relationships between cases, good for market basket analysis and recommendation engines

Clustering Classifies cases into distinctive groups based on any attribute sets

Naïve Bayes Shows the differences in a particular variable for various data elements

Sequence Clustering

Groups or clusters data based on a sequence of previous events

Time Series Analyzes and forecasts time-based data combining the powerof ARTXP for accurate short-term predictions with ARIMA

Neural Nets Uncovers non-intuitive relationships

Linear Regression

Determines mathematical linear relationship between inputs and an outcome

Logistic Regression

Determines the relationship between columns in order to evaluate the probability that a column will contain a specific state

Page 79: Microsoft Business Analytics 2013

DEMO

Page 80: Microsoft Business Analytics 2013

CONCLUSIONES• Análisis de negocios en el nuevo mundo de los datos: Conectados,

inmersivo, de cualquier tamaño• Plataforma Microsoft más poderosa y sencilla• Big data = Datos demasiado complejos para los métodos tradicionales• Microsoft HDInsight + Sencillez de BI tradicional = Potentes herramientas

de análisis• Desde el centro de datos tradicional a la nube OS: Su opción flexible para

el análisis• Nube en sus propios términos: Está bien cambiar de opinión• Advanced Analytics no es complejo hoy día

• Microsoft Business Analytics: Potencia y simplicidad

Page 81: Microsoft Business Analytics 2013

Muchas gracias por su participación