tema 1 pdf 2017-18 - usc.es · ANÁLISIS MULTIVARIANTE Área de Metodología de las Ciencias del...
Transcript of tema 1 pdf 2017-18 - usc.es · ANÁLISIS MULTIVARIANTE Área de Metodología de las Ciencias del...
Profesores: Jesús Varela MallouAntonio Rial BoubetaEduardo Picón Prado
www.usc.es/psicom
1
ANÁLISIS MULTIVARIANTE
Área de Metodología de las Ciencias del Comportamiento
Facultad de Psicología
Universidad de Santiago de Compostela
Curso 2017-2018
Análisis Multivariante 2
1. Contextualización y Revisión General de las Técnicas Multivariantes
2. El Análisis Preliminar de los Datos 3. Análisis de Regresión Lineal Múltiple
TEMARIO ASIGNATURA
4. Análisis de Regresión Logística5. Análisis Conjunto6. Análisis Clúster
TEMA 1
CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS
MULTIVARIANTES
Análisis Multivariante
Análisis Multivariantes 4
1. Introducción2. El método científico
• Definición y características• Tres supuestos o principios• Marco conceptual para la investigación empírica
3. Importancia de lo Multivariante/ble• Qué es un Modelo
– Modelos Teóricos– Modelos Estadísticos
• Modelo Lineal4. Etapas de una investigación5. REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES
• Qué son?• Razones de su expansión• Clasificación
6. Algunos ejemplos de Técnicas Multivariantes
Guión tema 1
5
LIBRO DE TEXTO
ü Rial, A. y Varela, J. (2008). Algunas cuestiones previas. Estadística Prácticapara la Investigación en Ciencias de la Salud. Coruña: Netbiblo. Páginas 3-11.
ü Rial, A. y Varela, J. (2008). Introducción al Análisis Multivariante. EstadísticaPráctica para la Investigación en Ciencias de la Salud. Coruña: Netbiblo.Páginas 189-199.
MATERIAL DE APOYO
ü Ato, M., López, J. y Benavente, A. (2013). Un sistema de clasificación de losdiseños de investigación en psicología. Anales de Psicología, vol. 29, nº3,1038-1059.
ü Varela, J. y Rial, A. y Braña, T. (2015). Comprendiendo al Consumidor.Modelos Multivariantes. Unidad de Psicología del Consumidor y Usuario. USC.
http://www.divestadistica.es/es/predicciones.html (video)
LECTURAS COMPLEMENTARIAS para el Tema 1
Análisis Multivariante 6
v El psicólogo es un CIENTÍFICO SOCIAL, debe desligarse de lomeramente especulativo
vLa labor del científico social no es fácil!! Debe transformar lasespeculaciones, cábalas e hipótesis en verdades, eso sí, enverdades probables ….. (uso de la estadística)
v Para ello hay que proveerse de un MÉTODO o procedimiento deadquisición e incorporación de conocimientos
v Lo que define el territorio científico y lo distingue del no-científico noes el qué tipo de conocimiento, sino el cómo se obtiene
1. INTRODUCCIÓN
Análisis Multivariante 7
2.1. Definición y Características
Ø Método Científico es el procedimiento mediante el cual podemosalcanzar un conocimiento riguroso y objetivo de la realidad (conjuntode reglas para investigar)
2. EL MÉTODO CIENTÍFICO
v DOS CARACTERÍSTICAS
Ø Carácter empírico: tiene como primer y último referente laexperiencia, la observación y el control
Ø Carácter replicable: todos los pasos seguidos hasta llegar a él sonsusceptibles de ser repetidos de forma idéntica (variables y escalas demedida utilizadas, diseño y análisis e interpretación)
8
PUNTOS BÁSICOS
Lo que define a una disciplina (conocimiento) como científica o no, essi utiliza el MÉTODO CIENTÍFICO para responder a sus problemasobjeto de estudio.
Los objetivos de la ciencia son:
DESCRIBIR, EXPLICAR, PREDECIR Y CONTROLAR
PLANTEAMIENTO DEL PROBLEMA
FORMULACIÓN DE HIPÓTESIS
CONTRASTACIÓN EMPÍRICA DE HIPÓTESIS
9
2.2. Supuestos o principios
� La naturaleza es comprensible. Se estructura u organiza siguiendo algúntipo de leyes. Es posible detectar ciertas regularidades
� La naturaleza es universal y uniforme. Las regularidades tienen carácteruniversal pero en ciencias sociales existe una variabilidad intrínseca alcomportamiento humano que hace necesario el uso de la estadística paraelaborar modelos del comportamiento (variables aleatorias vs. deterministas)
� La naturaleza tiene una causalidad finita. Los agentes que pueden estaroriginando un determinado fenómeno son limitados, finitos. El principio deparsimonia nos lleva a elegir siempre la explicación más simple para darcuenta del problema
Análisis Multivariante
10
v Tres pilares Metodológicos integran todos los elementos de una Investigación, yque están íntimamente relacionados con las 4 formas de validez.
2.3. Marco conceptual para la investigación empírica
DISEÑO
ANÁLISISMEDIDA
Validez Interna
Validez conclusión Estadística
Validez Constructo
Validez Externa
11
Un plan para integrar todos los elementos del estudio empírico, de manera que seanCREÍBLES, LIBRES DE SESGO Y GENERALIZABLESA partir de un problema, el DISEÑO se encarga de:
– Selección y asignación de los participantes (muestreo)– Control de las variables extrañas potenciales (procedimiento de control)
La calidad de un DISEÑO:– Validez Interna: La confianza a tener en la relación causa efecto de un estudio. Capacidad de
controlar el efecto de terceras variables que pueden ser causas alternativas a la causainvestigada.
– Validez Externa: Capacidad de generalizar los resultados a otros participantes, a otroscontextos y a otros momentos temporales. Por ejemplo, enviar cuestionarios a estudiantes elegidosal azar muestra más validez externa que uno donde se reparten a los asistentes a un curso.
El equilibrio óptimo entre “ambas” es uno de los objetivos más deseables de un buen diseñode investigación
– Los estudios manipulativos o experimentales priman la interna– Los descriptivos o correlacionales priman la externa
El primer pilar es el DISEÑO
Análisis Multivariante
Análisis Multivariante 12
La identificación, definición y medida de las variables– Medición: asignar números a objetos de acuerdo con unas
reglas o escalas, y que sirven de entrada para losprocedimientos del Análisis Estadístico
La validez relacionada con la medida es la Validez de Constructo o lacapacidad de definir y operativizar apropiadamente el constructo quedice medir
¿Cómo medir la fiabilidad del constructo?. Ej.: Correlación entre las puntuacionesobtenidas por los sujetos en dos formas paralelas, pasando el test dos veces (test-retest) o pasando dos mitades equivalentes. El alfa de Crombach mide el grado deconsistencia interna
El segundo pilar es la MEDIDA
13
Consiste en la estimación de parámetros y prueba de hipótesisacerca del objetivo de investigación, con los procedimientosestadísticos más apropiados• Valorando aspectos como el tamaño del efecto y la significación práctica y clínica
de los resultados
El tipo de validez relacionada con el ANÁLISIS es la Validez de laConclusión Estadística o Potencia del Constraste (si el valor de laestimación se aproxima al de la población)
Validez Predictiva: a partir de las puntuaciones de un test se puedepredecir o pronosticar una variable de interés. Ej. En RRHH seintenta pronosticar el rendimiento laboral, el absentismo laboral, etc.
El tercer pilar es el ANÁLISIS
Análisis Multivariante
14
Una investigación puede ser perfecta en su concepción, pero seráinadecuada si no se utilizan adecuadamente los 3 pilares de la investigación(Diseño, Medida y Análisis)
El uso de técnicas estadísticas sofisticadas no mejoran los resultados si eldiseño es incorrecto o no se utilizaron medidas apropiadas
DISEÑO
ANÁLISISMEDIDA
Validez Interna
Validez conclusión Estadística
Fiabilidad y Validez
Constructo
Validez Externa
Análisis Multivariante
Análisis Multivariante 15
Los investigadores del Comportamiento humano deben dotarse deherramientas estadísticas para analizar cómo distintas variables (Xi e Y)se combinan para explicar dicho comportamiento: Análisis Multivariante
Para su comprensión y análisis, la mejor forma de representar el conocimientoque poseemos de la realidad es la ELABORACIÓN de MODELOS
Su “relativa” uniformidad hace que dichos modelos, cuando se trata deexplicar el comportamiento humano, tengan que ser Modelos Estadísticos
Además, dado el carácter finito de la causalidad, el científico debeesforzarse siempre en proponer Modelos lo más parsimoniosos posibles
3. Importancia de lo MULTIVARIANTE
Análisis Multivariante 16
Una representación formal, estructurada y concisa de la realidad, quepermite conocer sus propiedades y las leyes que la rigen, posibilitandola realización de predicciones. TIPOS:
�Modelos icónicos. Son imágenes físicas, normalmentetridimensionales de algún objeto material (Ej: las maquetas)
�Modelos analógicos. Procesos pictóricos destinados a reproduciren otro medio la estructura del objeto o situación original (Ej.gráficas de los polímetros, del sueño…)
�Modelos teoréticos (informático y matemáticos). Una organizaciónde ideas que ayuda a explicar los fenómenos investigados. Sebasan en lenguajes especializados como el lenguaje matemáticoo la lógica de programación
3.1. ¿Qué es un MODELO?
Análisis Multivariante 17
Los Modelos Teoréticos…
1. Modelos Informáticos. Son modelos expresados en unlenguaje de programación
2. Modelos Matemáticos. Son formulaciones matemáticasque permiten hacer predicciones en torno a ladistribución de los acontecimientos
Ø Los MODELOS ESTADÍSTICOS son un tipoconcreto de Modelos Matemáticos
Análisis Multivariante 18
Los MODELOS ESTADÍSTICOS…
§ Los MODELOS ESTADÍSTICOS contienen una partesistemática (S) y una parte aleatoria (A)
§Aunque existen multitud de formas de vincular estos doselementos del Modelo Estadístico, la más recurrida parareproducir el objeto de interés científico (Y), por susimplicidad, es la FORMA LINEAL, sumando amboscomponentes
Y S A= +
Análisis Multivariante 19
3.2. MODELO LINEAL GENERAL
Y S A= +§ La parte aleatoria (A) se suele denominar término de
error y acostumbra a representarse por la letra E
§ La parte sistemática (S) se desglosa en varioscomponentes sistemáticos f(Xi), que representen elefecto simultáneo de diversas variables
( )Y f X E= +i
http://www.divestadistica.es/es/laboratorio_estadistico.html
Análisis Multivariante 20
Y = f (Xi )+ Ei
f(Xi) representa una combinación lineal de las variablesexplicativas:
f(Xi) = b1 X1 + b2 X2 + bi Xi
siendo b1, b2 y bi coeficientes que representan el peso, efecto oimportancia relativa de cada variable explicativa de Y
Y =β0 +β1X1 +β2X 2 +…+ E
Análisis Multivariante 21
El investigador debe optar siempre por el modelomás simple y parsimonioso
El mayor reto en el desarrollo de unaINVESTIGACIÓN: con cuántas Xi nos quedamos?
En definitiva...
Yi =β0 +β1X1 +β2X 2 +…+ Ei
V.D V.I.s
http://www.divestadistica.es/es/predicciones.html
Análisis Multivariante 22
4. Etapas de una INVESTIGACIÓN1. Planteamiento del Problema2. Formulación de Objetivos y/o Hipótesis3. Diseño de investigación4. Elaboración de Cuestionario y procedimiento de
administración5. Diseño de la Muestra6. Selección de los Entrevistadores 7. Trabajo de Campo y Supervisión8. Codificación de preguntas y depuración de la
información
9. Análisis de los Datos (contraste de hipótesis, modelización, ….Análisis Multivariante)
10. Interpretación de resultados y Redacción del Informe de Resultados
23
Etapa 1: Planteamiento del Problema
v Es una pregunta para la cual no tenemos respuesta, el punto departida de toda investigación científica
v Dejar de tratar problemas es dejar de investigarRequisitos:
• Resoluble• Contrastable empíricamente• Expresar una relación entre variables
Ø El problema condiciona los Métodos concretos y las técnicas particulares aemplear para llegar a una respuesta válida
Problema: Necesito incrementar las ventas de mi cartera de bebidas y refrescos en el canal HORECA
Etapa 2: Formulación de Objetivos y Planteamiento de Hipótesis• Proponer una posible explicación del problema exige pensar qué variables
pueden estar interviniendo. De ahí surgen los OBJETIVOS de lainvestigación
Para la formulación de los Objetivos hay que:
1. Establecer una relación entre dos o más variables2. Contrastable empíricamente mediante la estadística
Hipótesis nula e Hipótesis alternativaH0 : rXY = 0 H1 : rXY ≠ 0H0 : bi = 0 H1 : bi ≠ 0
Ventas (Yi ) = b1 oferta variada + b2 activación merchandising + b3 equipamiento frío
Objetivo: Yi : Entender el por qué de la variabilidad de las Ventas de refrescos
Identificación de Variables: stock variado de productos, comunicación de miMarca y Productos en el punto de venta y visibilidad de las bebidas en unexpositor en el punto de ventaHipótesis:
Ej.: Delimitar los objetivos nos ayuda a identificar lasvariables relevantes para el problema…
vProblema. Estudiar las Actitudes, Creencias y hábitos de uso de losjóvenes gallegos hacia internet
vObjetivos:§ Nivel de conocimiento y fuentes de información§ Actitudes y hábitos de uso de internet§ Brecha digital en el territorio gallego y posibles barreras o frenos§ Uso de diferentes herramientas en internet§ Uso y conocimiento de redes sociales y motivaciones§ Uso peligroso internet: webs apuestas, juegos…§ Papel de los padres en relación a internet
vPropuesta de Cuestionario (ver documento adjunto en moodle)
v INFORME de resultados
http://www.valedordopobo.gal/wp-content/uploads/2016/05/Adolescentes-e-Internet.-GAL.pdf
Trabajo voluntario sobre Objetivos, Variables y Técnicas de Análisis de los Datos
v Seleccionar un artículo o publicación de cualquier especialidad
ü describir el problema teórico que pretende resolverü Identificar el objetivo u objetivos de investigaciónü identificar las variables que utiliza para dar respuesta al problemaü Identificar qué técnica/s estadísticas utilizaü Incluir la cita según APA del artículo trabajado
ENTREGARLO EN UN PLAZO MÁXIMO DE 15 DÍAS, A PARTIR DE HOY
Modelos Multivariantes 27
El Diseño es un plan estructurado de acción. El plan a seguir por el investigador paraabordar los objetivos planteados, recoger lo datos y someter a contraste las hipótesis
� Aspectos a tener en cuenta: objetivos, naturaleza del problema y de las hipótesis,variables, unidades de muestreo, recogida de datos, etc.
� Debe especificar la estrategia científica de partida:
i Experimental (manipulación activa, control de variables, asignación aleatoria a grupos)i Cuasiexperimental (grupos naturales, ya existen por lo que no es posible aleatorizar el
tratamiento. Existe tratamiento, respuesta y una hipótesis, pero no asignación aleatoria de sujetos agrupos (tratamiento y control)
iSelectivo o de Encuesta (no experimental y correlacional. Muestreo)iObservacional (datos son situaciones naturales. Registro)iCualitativa (orientada al significado más que a su frecuencia. No busca representatividad)
Etapa 3: Diseño de la Investigación
Máximo control Mínimo control
Mínima naturalidad Máxima naturalidad
28
ü ¿Qué características se maximizan con cada una de lasestrategias o metodologías de investigación?
Experimento
Observación Realismo
Encuesta Representatividad
Cuasiexperimento Control
Cualitativa
Máximo control Mínimo control
Mínima naturalidad Máxima naturalidad
29
üEmpareje las técnicas metodológicas de la columna de la izquierda conlas características de la derecha
Experimento Significado
Observación Situaciones naturales
Encuesta Control de variables extrañas yasignación aleatoria
Cuasiexperimento No asignación aleatoria grupos y sujetos
Cualitativa Muestra numerosa y representativa
30
üIndique qué características definen a la tradición experimental ycuáles a la tradición correlacional
Tradición experimental
Tradición correlacional
Diferencias entre grupos
Hipótesis de covariación
Búsqueda de leyes generales
Hipótesis causales
Descripción de la realidad
31
ü Las variables elegidas deben permitirnos responder, como mínimo, a tresobjetivos:
• Estimar magnitudes• Describir a la población• Verificar las hipótesis planteadas
ü Formas de Administración: personal (hogar, centro trabajo, en la calle,comercios…), telefónico (con operador, CATI…), postal, internet, etc.
ü Utilizar diferentes tipos de preguntas (de escala, categóricas, abiertas, cerradas,múltiples, etc.) que permitan responder a diferentes tipos de objetivos con suscorrespondientes escalas de medida, y usar diferentes técnicas de análisis dedatos
Etapa 4: Elaboración del Cuestionario y procedimiento deadministración. Encuesta!
“Recomendaciones de toda la vida para diseñar una buena encuesta”
https://www.netquest.com/blog/es/blog/es/recomendaciones-de-toda-la-vida-para-disenar-una-buena-encuesta
§ ¿Por qué estudiar una Muestra, en lugar de toda la Población?– Coste y ahorro de Tiempo. Una muestra pequeña, cuidadosamente
seleccionada, puede darnos una información suficientemente próxima a larealidad
– Accesibilidad. Algunos elementos de la población pueden ser totalmenteinaccesibles. Ej. En algunas zonas rurales puede no haber datospluviométricos
§ Fases del Muestreo Estadístico:1. Definición e Identificación de la Población (target): determina quién puede o
no ser incluido en la muestra2. Determinación del error del marco de muestreo: Si queremos analizar las
pautas de consumo de una población de 10.000 habitantes y utilizamos laguía telefónica que incluye a 9.600 personas, nuestro error de marco demuestreo será del 4%; 1 - (N marco muestral / N población total);(9.600/10.000= 0.96; 1-0.96= 0,04). (qué sucede con las encuestas on-line??)
Etapa 5: Diseño de la Muestra
3. Selección de las Técnicas de Muestreo: Si sabemos o no cuál es la probabilidad de cada elemento de la población de ser seleccionado para la muestra:
§ Probabilísticas: Muestreo Aleatorio Simple, M. Sistemático, Estratificado, Conglomerados
§ No probabilísticas: de conveniencia, de juicio, bola de nieve, por cuotas
4. Selección de número de informantes: Muestra representativa
§ Tamaño del Universo o Población: N=1000§ Margen de error: 5§ Nivel de Confianza 95
n=278Si encuestas a 278 personas, el 95% de las veces el dato que quieres saber en la población (parámetro), estará en el intervalo más menos 5% respecto al dato que observes en la encuesta muestral (estadístico).
§Fases del Muestreo Estadístico:1. Definición e Identificación de la Población (target)2. Determinación del error del marco de muestreo
§ Evitaremos sesgos en la administración del cuestionario si losentrevistadores trabajan de acuerdo con un protocolo que garantice lamáxima homogeneidad inter-entrevistadores
§ La importancia de un buen briefing o instrucciones
Etapa 6: Selección de los Entrevistadores y Pilotaje del Cuestionario
ü PRE-TEST DEL CUESTIONARIO o prueba piloto§ Si el orden es lógico, el lenguaje apropiado al target§ Probar con diferentes versiones de cuestionarios§ Estimar el porcentaje de no-respuesta§ Duración, etc.
3 tareas clave:
1. Incidencias en la recogida de los datos: hablar con los jefes dezona y equipo para posibles incidencias
2. Comprobación de las rutas aleatorias: comprobación de lasunidades últimas del muestreo (completar cuotas)
3. Revisión de los cuestionarios: datos de identificación, %respuestas, codificación preguntas, omisión preguntas, calidadrespuestas, seguimiento preguntas filtro, amabilidad de laentrevista, etc.
Etapa 7: Trabajo de campo y supervisión
§ Categorización y codificación de preguntas abiertas y considerarposibles re-clasificaciones (ej. preguntas métricas en no métricas)
§ Creación fichero de datos y grabación: buscar inconsistencias,valores fuera de rango, respuestas de las preguntas filtro,transformación de variables, cuantificar la no-respuesta, etc……
tema 2: “Análisis preliminar o exploratorio de los datos”
Etapa 8: Codificación de preguntas y depuración de la información
a) Conocer la distribución individual de cada una de las variablesü Variables nominales: frecuencias y % de cada categoríaü Variables ordinales: mediana, moda e histogramasü Variables métricas: la media o mediana si hay valores extremos, desviación
típica o varianza, simetría y curtosis
b) Análisis de las relaciones bivariantes o relaciones entre 2 variables.ü Pruebas paramétricas: comparación de medias (prueba t), correlación pearson
(r) y análisis de varianza (anova)ü Pruebas no paramétricas: comparación medias (Mann-Whitney), Correlación
Spearman (Tau Kendall), análisis de varianza (Kruskal Wallis) y Tablas decontingencia (Chi-cuadrado)
c) El Análisis Multivariante o Modelización. Analizar conjuntamente “n” o más de 2variables
à ver asesor estadístico del SPSS (en menú de ayuda)
Etapa 9: Análisis de Datos o uso de la Estadística
Modelos Multivariantes 38
En otras palabras…
La ESTADÍSTICA como un cuadro de herramientas o 3 niveles de análisis:
§ Nivel 1: DESCRIPTIVO-UNIVARIADO. Resumir e ilustrar lainformación contenida en una matriz de datos
§ Nivel 2: INFERENCIAL-BIVARIADO. Estimar parámetros, contrastarhipótesis, comparar el comportamiento de dos o más grupos o analizarla relación entre pares de variables
§ Nivel 3: MODELIZACIÓN-MULTIVARIANTE. Elaborar modelos,ecuaciones o funciones que permitan explicar unas variables a partirde otras o identificar variables latentes para resumir la información
§ Presentación de los hallazgos de la investigación: Título, Resumen,Antecedentes y Objetivos, Metodología y Procedimiento (el proceso de lainvestigación, métodos y técnicas utilizadas…) así como la Discusión oConclusiones. Sin olvidarse de las referencias bibliográficas (oportunidadde replicación)
§ Los resultados deben integrarse en un marco teórico. Existe unatendencia a comunicar sólo los resultados que confirman la hipótesis
§ Código deontológico ESOMAR:. Antecedentes, Muestra (descripción universo, tamañomuestral, sustitución y distribución geográfica proyectada y conseguida, método deponderación, tasas de respuesta y posibles sesgos de la no respuesta, etc.), Recogida delos Datos (procedimiento del campo, personal, instrucciones, control de calidad,reclutamiento e incentivos, fecha, etc.) y Presentación de los Resultados (bases deporcentajes, margen error estadístico, medias significación de las diferencias, etc.)
Etapa 10: Redacción del Informe
Resumen etapas de una investigación mediante encuesta
Modelos Multivariantes 41
MATRICES
v Conjunto de números reales ordenados en filas y columnasv El lugar donde se recoge la información de una investigación
1......m
(Xij)
x11 x1n
xm1 xmn
Sujetos
Variables1 . . . . . . . . . . . . . . . .n
Alternativas de análisis bivariante según la naturaleza de las variables:
Ayuda o Guía para la toma de decisiones durante Análisis de los Datos (o uso de la Estadística)
NOMINAL ORDINAL MÉTRICA
NOMINAL Chi-cuadradoFisher (tablas 2x2)
Pruebas no -paramétricas Pruebas no-paramétricas
ORDINAL Chi-cuadradoFisher (tablas 2x2)
Existencia de Relación:Chi-cuadrado
Análisis de Correlación: Coeficiente de Spearman Coeficiente Tau de Kendall
Pruebas no-paramétricas
MÉTRICA Nominal dicotómica, la comparación de medias: la prueba t o Mann-Whitney
Nominal categórica: ANOVA o Kruskall-Wallis
Nominal como ficticia:Regresión
Análisis de Correlación:Pearson,
Si la métrica se transforma en Ordinal:Spearman, Tau de Kendall
Análisis de Correlación:Pearson
Pruebas paramétricas con muestras mayores de 50
Análisis Multivariantes 43
1. Introducción2. El método científico
• Definición y características• Tres supuestos o principios• Marco conceptual para la investigación empírica
3. Importancia de lo Multivariante/ble• Qué es un Modelo
– Modelos Teóricos– Modelos Estadísticos
• Modelo Lineal4. Etapas de una investigación5. REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES
• Qué son?• Razones de su expansión• Clasificación
6. Algunos ejemplos de Técnicas Multivariantes
Guión tema 1
Al finalizar este tema deberías de saber:
ü Qué técnica de análisis es la adecuada para responder a unadeterminada pregunta o hipótesis que te permita alcanzar losobjetivos de la investigación?
ü Dicho de otra manera, de QUÉ naturaleza deben ser lasvariables registradas para poder aplicar la Técnica Multivarianteelegida?
Análisis Multivariante 4444
La Complejidad de la conducta y de los fenómenos sociales en generalobliga a recoger gran cantidad de medidas. Se necesita una herramientaque ofrezca una visión conjunta e integrada de la realidad: El AnálisisMultivariante
– Surge como una forma de hacer comprensible una gran cantidad dedatos o MATRIZ que represente la realidad
– Útil porque permite descubrir estructuras, establecer relaciones entrevariables o contrastar hipótesis, reflejando los mecanismos que actúanpara determinar la conducta humana o el objeto de estudio
KENDALL en 1975: “una extensión del análisis univariable y bivariable alanálisis simultáneo de más de dos variables en un muestreo deobservaciones”
5. ANÁLISIS MULTIVARIANTE
Análisis Multivariante 45
Sheth, 1968. Métodos estadísticos que se preocupan del análisis delas múltiples medidas que se han hecho sobre un cierto número deobjetos
Cuadras, 1991. Una rama de la estadística que estudia, interpreta yelabora el material estadístico sobre la base de un conjunto de n>2variables, que pueden ser de tipo cuantitativo, cualitativo o una mezclade ambos
Hair, 1998. Todos los métodos estadísticos que analizansimultáneamente medidas múltiples de cada individuo u objetosometido a investigación
5.1. DEFINICIÓN: Qué es?
Técnicas estadísticas que nos permiten analizar un conjuntode variables, así como poner a prueba distintos modelospara explicar las relaciones entre ellas
Análisis Multivariante 46
§ Necesidades de investigación. La complejidad de los fenómenos socialesrequiere un tratamiento de datos multidimensional
§ Desarrollo de la informática y los ordenadores. Posibilidad de realizar cálculoscomplejos en pocos segundos
§ Utilidad en numerosos campos: Marketing, Comportamiento, Economía,Meteorología, Biología, etc.
§ Proliferación de la investigación de mercados y los estudios de opinión. Elinternet de las cosas (Big Data)
§ Abundante bibliografía aplicada (artículos, manuales y series monográficas)
5.2. RAZONES DE LA EXPANSIÓN
47
En función de los objetivos de la investigación:
a. Descriptivos: Acercamiento a la realidad sin hipótesis previas. Todas lasvariables tienen el mismo status, unas no dependen de las otras
§ Su objetivo puede ser REDUCIR la dimensionalidad de la matriz obteniendo unnúmero menor de VARIABLES no observables o factores (ej. Análisis Factorial)
§ Se usa para CLASIFICAR los SUJETOS en grupos homogéneos (ej. An.Cluster)
b. Explicativos o Predictivos. Su fin es explicar la realidad. Ayudan a comprendery explicar un fenómeno. Se parte de una situación a predecir (VD) y de un grupode variables intervinientes o criterio (VI), cuya influencia se desea mantener bajocontrol y observar su efecto (ej. Regresión Múltiple)
Técnicas de Independencia y Dependencia (Sheth, 1971)
5.3. CLASIFICACIÓN
48
§ Se acercan a la realidad sin hipótesisespecíficas y tratan de describir la realidadagrupando la información relevante: TécnicasDescriptivas o Reductivas
§ Análisis Factorial, Análisis deConglomerados, EscalamientoMultidimensional
§ Detectan las relaciones de dependenciaentre una (o varias) V.D y una (o varias) V.I.elaborando una hipótesis que se intentavalidar empíricamente: Técnicas Explicativaso Predictivas
§ Análisis de Regresión, Medición Conjunta,Análisis Discriminante, Análisis deVarianza
Clasificación de las técnicas Multivariantes según la relación entre las variables (Sheth, 1971)
¿Algunas de las variables son
dependientes de otras?
NO SÍ
Reciben el nombre de Técnicas de
Interdependencia
Reciben el nombre de Técnicas de Dependencia
… Una u otra técnica en función de la escala de medida de cada variable. Variables cuantitativas(métricas) y cualitativos (no-métricas). ¿Cuáles son las propiedades de los datos?
Modelos Multivariantes 49
4. Análisis Conjunto
Modelos Multivariantes 50
Hay que ser capaz de reproducirlo sin mirar !!!
Modelos Multivariantes 51
6. Algunos ejemplos de Técnicas Multivariantes….
- Análisis Factorial de Componentes Principales
- Análisis de Correspondencias
- Regresión Lineal Múltiple
- Análisis Discriminante
- Regresión No Lineal o Logística
- Análisis Conjunto
53
§ Análisis Factorial de Componentes Principales
§ Análisis de Correspondencias§ Análisis de Conglomerados
§ Escalamiento Multidimensional
§ Análisis de Regresión Lineal Múltiple
§ Análisis Discriminante§ Regresión No Lineal o Logística
§ Análisis Conjunto
¿Algunas de las variables son dependientes de
otras?
NO SÍ
Reciben el nombre de Técnicas de
Interdependencia
Reciben el nombre de Técnicas de Dependencia
6. Algunos ejemplos de Técnicas Multivariantes….
Análisis Multivariante 54
OBJETIVO: Reducción de variables (métricas). A partir de la relación entrevariables observadas identificar un número menor de variables latentes oFACTORES que resultan después de eliminar las redundancias existentes entreel conjunto inicial de variables observadas
EJEMPLO: Agrupar ítems de una escala y etiquetarlos bajo una mismadimensión o factor de evaluación
CONDICIÓN: Variables cuantitativas
§ Exploratorio (AFE): Componentes Principales§ Confirmatorio (AFC): LISREL, AMOS
ANÁLISIS FACTORIAL DE COMPONENTES PRINCIPALES
55
Ejemplo de cómo desarrollar un Producto: “una espuma de afeitar”
§ Conocemos la formulación química del Producto pero NO las características que valora elconsumidor, ni tampoco cómo las estructura o agrupa (Mapa Perceptual).
§ Este tipo de estudios empíricos son fundamental para orientar, con un briefring, el trabajo de lostécnicos de laboratorio de manera que hagan corresponder su fórmula o características físicas conlas necesidades del consumidor
§ A partir de un cualitativo identificamos 20 VARIABLES a tener en cuenta (Cuestionario de 20 ítems)
Le rogamos indique sus preferencias marcando el valor 1 si no está NADA DE ACUERDO y 5 si está TOTALMENTE DE ACUERDO, con las siguientes afirmaciones:
1. La espuma debe de crecer en la mano al salir del bote2. La espuma debe adherirse a la piel de la cara al ponerla con la mano3. La espuma debe salir toda del bote4. La espuma no debe irse sola de la cara5. La cuchilla debe deslizarse con facilidad6. Al aclarar la cuchilla la espuma debe de salir bien y tb. del lavabo7. La piel debe quedar suave al limpiarse la espuma después del afeitado8. La espuma me gusta de color blanco9. La espuma me gusta de color blanco azulado10. La espuma me gusta de color blanca con sombras verdes11. La espuma me gusta cremosa12. La espuma me gusta ligera13. La espuma me gusta hueca14. La espuma me gusta fluida15. La espuma me gusta que sea seca16. La espuma me gusta que moje la piel17. La espuma me gusta que deje perfume al aclararme la cara18. La espuma me gusta que quede sin olor19. La espuma me gusta que refresque20. No me importaría pagar un porcentaje más del precio actual si la espuma fuese cicatrizante
MATRIZ Xn20
Sujeto X1 X2 X3 ….................X201 2 4 5 42 1 3 5 33 …..........
n 2 4 3 5
Análisis Multivariante 56
MATRIZ DE CORRELACIONES ENTRE VARIABLES (20 X 20)
ANÁLISIS FACTORIAL DE COMPONENTES PRINCIPALES, APLICADO AL DESARROLLO DE COSMÉTICOS
Matriz de Correlaciones entre Variables X20 x X20
X1 X2 X3 X4……….. ……………….. X20X1 1.0000X2 .23 1.0000X3X45678910111213141516171819X20 -.43 1.0000
Kaiser-Meyer-Olkin Measure of Sampling Adequacy: 0.123
Bartlet Test Sphericity: 265,931, Significance: 0.00023
Análisis Multivariante 57
EXTRACCIÓN DE FACTORES (13 VARIABLES X 5 FACTORES)
Perfumado y seco
Comportamiento: espuma fluida y hueca con limpieza lavabo
Cosmético: piel suave y cremosidad
Aspecto físico espuma: color blanco y crecimiento
ESTOS 5 FACTORES, TAMBIÉN PODRÍAN SER INTERPRETADOS COMO “MOTIVADORES”. Se trata de ejes o atributos que estructuran la percepción del mercado y, por lo tanto, que el producto debería de poseer para aproximarnos a la espuma de afeitar ideal, desde el punto de vista del mercado.
Uso: adherencia piel, permanencia
Análisis Multivariante 58
ANÁLISIS DE CORRESPONDENCIASOBJETIVO: Reducción de variables (no métricas). A partir de la relación entrevariables observadas identificar DIMENSIONES o variables latentes. Profundizaen las relaciones que se establecen entre dos o más variables categóricas
EJEMPLO: A partir de un conjunto de características identificar las dimensionessubyacentes y representarlas en un Mapa Perceptual de Imagen yPosicionamiento
CONDICIÓN: Variables cualitativas. SIMPLE (entre las categorías de dosvariables) o MÚLTIPLE (más de dos variables)
§ Un subtipo de Análisis Factorial, ideal para datos de asociación (recogida dedatos muy fácil y rápida) (ver siguiente ejemplo)
§ Muy utilizado en Ciencias Sociales y de la Salud
Análisis Multivariante 59
Ejemplo de Datos de Asociación para conocer con qué características se asocian las diferentes Marcas. Estudios para conocer la Personalidad de las Marcas
Mo-derna
Ami-gable
Soli-daria
Juvenil Interna-cional
Ele-gante
Con-Fiable
Crea-Tiva
Econó-Mica
Diver-Tida
Clásica Dife-rente
Levi´s
Lois
Benetton
Zara
Opel
Volkswagen
Seat
Audi
Coca-Cola
Kas
Pepsi Cola
La Casera
Mo-derna
Ami-gable
Soli-daria
Juvenil Interna-cional
Ele-gante
Con-Fiable
Crea-Tiva
Econó-Mica
Diver-Tida
Clásica Dife-rente
Yo
A continuación, ¿Qué principales características asocias a tu persona ? Dando lugar a una Matriz de orden: (13 Marcas x 12 Características)
60
MATRIZ DE ENTRADA: Datos de Asociación entre Marcas x Adjetivos
TABLA DE CONTINGENCIA. NÚMERO DE ASOCIACIONES REGISTRADAS ENTRE LAS DIFERENTES MARCAS i Y LOS ATRIBUTOS j (Matriz orden 13x12)
---Análisis Factorial de Correspondencias---
Mo-derna
Ami-gable
Soli-daria
Juvenil Interna-cional
Ele-gante
Con-Fiable
Crea-Tiva
Econó-Mica
Diver-Tida
Clásica Dife-rente
Levi´s 56 13 4 51 74 8 31 26 0 10 20 13
Lois 31 9 5 58 17 4 11 17 18 21 13 21
Benetton 35 25 59 31 61 21 9 38 10 17 13 25
Zara 52 23 6 45 29 30 16 18 65 12 15 5
Opel 12 4 3 14 40 23 23 8 29 2 25 3
Volkswagen 27 1 5 15 56 29 47 21 9 4 24 9
Seat 18 19 4 27 22 8 19 16 50 12 22 6
Audi 35 0 2 6 56 64 55 16 3 1 44 12
Coca-Cola 32 41 23 50 81 7 19 35 19 31 35 16
Kas 19 25 12 36 10 1 9 16 32 23 13 14
Pepsi Cola 31 19 25 38 49 3 11 13 26 21 13 22
La Casera 3 19 7 5 3 1 16 9 37 9 53 28
Yo 44 59 28 55 20 24 37 30 33 49 19 28
61
Análisis Factorial de Correspondencias.REPRESENTACIÓN CONJUNTA DE MARCAS Y CARACTERÍSTICAS
62
MAPAS DE POSICIONAMIENTO: para conocer la posición que ocupan en la mente del consumidor
• Marquemos el lugar donde estamos: Posicionamiento actual
• Marquemos el lugar donde nos gustaría estar: Posicionamiento deseado
• ¿Qué tenemos que hacer para llegar hasta el lugar deseado?: Una Estrategia de Marketing
• Modificar las características del producto (product)
• Cambiar la comunicación (promotion)
• Cambiar la distribución (place)
• Tocar el precio (price)
63
MAPAS DE POSICIONAMIENTO: para conocer la posición que ocupan en la mente del consumidor
• Dónde colocarías a…..
Análisis Multivariante 64
OBJETIVO: Identificar grupos homogéneos de sujetos u objetos a partir de supuntuación en una serie de variables. Estos grupos, a su vez, deben de ser muydiferentes entre sí. Alta homogeneidad interna y elevada heterogeneidad entrelos grupos
EJEMPLO: identificar segmentos de jóvenes en función de sus hábitos deconsumo. Es decir, permite clasificar una población en el menor número posiblede grupos mutuamente exclusivos y exhaustivos, basándose en la similitudentre los casos
CONDICIÓN: Variables medidas en la misma escala
§ También llamado Cluster Analysis§ Técnica de Clasificación§ Los grupos no son conocidos a priori
ANÁLISIS DE CONGLOMERADOS (cluster)
Análisis Multivariante 65
OBJETIVO: Utilizar las proximidades entre objetos para realizar unarepresentación espacial de los mismos, identificando las dimensionessubyacentes
EJEMPLO: Representación espacial de las similitudes entre las distintasmarcas de cerveza en Galicia, con el fin de conocer el posicionamientorelativo de cada una de ellas
CONDICIÓN: Gran versatilidad en la recogida de datos (distintos tipos detareas)
§ Gran Utilidad en MKT e investigación social§ Transforma los juicios de los consumidores, respecto a similitudes o
preferencias, en distancias representadas en un espaciomultidimensional
ESCALAMIENTO MULTIDIMENSIONAL
66
§ Análisis Factorial de Componentes Principales
§ Análisis de Correspondencias§ Análisis de Conglomerados
§ Escalamiento Multidimensional
§ Análisis de Regresión Lineal Múltiple
§ Análisis Discriminante§ Regresión No Lineal o Logística
§ Análisis Conjunto
¿Algunas de las variables son dependientes de
otras?
NO SÍ
Reciben el nombre de Técnicas de
Interdependencia
Reciben el nombre de Técnicas de Dependencia
Algunos ejemplos de Técnicas Multivariantes….
67
OBJETIVO: Explicar o predecir una Variable Criterio (VD) a partir deuna o varias Variables Predictoras (VI)
Y’ = a + b1X1 + b2X2+…+ bnXn
(métrica) (…..métricas….)EJEMPLO:§ Predecir la audiencia de un canal de T.V. (Y) en función de la inversión en
publicidad en Euros (X1), minutos de emisión deportiva (X2), minutos deinformativos (X3), etc.
§ Si para 20 pizzerías conocemos varias VI, tales como el precio de la “pizzafamiliar” y el esfuerzo de publicidad mediante “reparto de buzoneo durante lasemana”, queremos explicar y conocer la VD o su “posible influencia en elincremento de las ventas”
CONDICIÓN: Predictores y Criterio cuantitativos§ Simple o Múltiple§ Caso especial: predictores categóricos (Regresión con variables
ficticias: DUMMY)
REGRESIÓN LINEAL MÚLTIPLE
Análisis Multivariante 68
Las relaciones entre un conjunto de variables con el objeto deentender su covariación
• Tratando de conocer la influencia que una serie de V.I. ejercensobre la V.D.
Busca predecir los cambios en la V.D. cuantitativa en función delos cambios en varias V.I. Cuantitativas
• Esta relación no implica que una sea causa de otras. Loscoeficientes calculados sólo aportan información sobre elgrado en que varias variables covarían o están asociadas.
En el Análisis de Regresión se estudian…
Análisis Multivariante 69
1. Comprender los determinantes de la esperanza de vida de las mujeres endiferentes países:
a. Qué variables influyen en la esperanza de vida, cuáles no y, de las que influyencuáles son importantes estimando su peso diferencialPor ejemplo:
ü V.D. : Esperanza de vida de la mujerü V.I.:
§Porcentaje de población que vive en áreas urbanas§Número de médicos por cada 10.000 habitantes§Número de camas hospitalarias por cada 10.000 habitantes§Producto interior bruto per cápita en euros§Aparatos de radio por cada 100 habitantes
2. Predecir el gasto en cine de una persona a partir de sus ingresos, numero de hijos,años de estudios, etc.
Otros ejemplos …
70
OBJETIVO: Identificar funciones discriminantes capaces de separar dos o másgrupos de individuos según sus puntuaciones en una serie de variables.
v Qué V.I. discriminan a los sujetos de los diferentes grupos establecidos apriori en la V.D. Es una Técnica de clasificación.
Regresión Lineal: métrica … ___________ métricas__________________
Y = X1 + X2 + X3 + ... + Xk
(no métrica) (…métricas…)categórica cuantitativa
Obtener una función discriminante del tipo:Zjk = a + W1X1+ W2X2 + ... + WkXk
EJEMPLO de Variables Dependientes no-métricas:§ Predecir el voto (partido) a partir de los ingresos económicos, la edad…§ Comprender si un niño puede desarrollar un cuadro depresivo o no§ Estimar si un nuevo producto tendrá éxito en el mercado considerando la inversión
en publicidad, precio, ….
ANÁLISIS DISCRIMINANTE
Análisis Multivariante 71
EJEMPLO: Analizar la morosidad en las entidades bancarias determinandoel nivel de riesgo en el comportamiento de pago de los clientes,identificando clientes solventes de aquellos otros que pueden sermorosos
V.D.: ser solvente o ser moroso Yi
V.I.:§ Variables relativas a la operación: X1 importe solicitado, X2 duración o plazo, X3
cantidad adelantada a final de año, X4 número de operaciones activas, X5 impagosprevios en otros productos
§ Variables del perfil del solicitante: X6 edad, X7 cuotas mensuales, X8 antigüedad enel trabajo
ANÁLISIS DISCRIMINANTE
1. La V.D. si tiene dos categorías es Simple, más de dos: Múltiple2. Las V.Is. o Predictoras deben ser cuantitativas o métricas
Análisis Multivariante 72
OBJETIVO: Pronosticar la pertenencia de los sujetos a un grupo de la VD nométrica o categórica, a partir de sus puntuaciones en una serie de variablespredictoras o VI (métricas o no métricas). Estimar la probabilidad de que seproduzca un evento.
EJEMPLO: Predecir si un alumno va a aprobar o no, en función de las horasde estudio X1, frecuencia de asistencia a clase X2, estatus socioeconómico X3
Y = X1 + X2 + X3 + ... + Xn(no-métrica) (…métricas o no-métricas…)
CONDICIÓN:§ VD categórica. Debe poseer dos categorías (0,1)§ VI o explicativas no tienen restricción. Pueden ser cuantitativas
(continuas o discretas) y categóricas (con 2 o más modalidades)
REGRESIÓN LOGÍSTICA
Análisis Multivariante 7373
Caso particular de la Regresión Múltiple en el que la V.D. es cualitativa(no-métrica), y las V.I. pueden ser cuantitativas o cualitativas (no-métricas)
Ventaja de esta técnica: tiene pocas restricciones sobre la distribución delas V.I., estando más libre de supuestos restrictivos que la RegresiónMúltiple y el Análisis Discriminante
El principal objetivo es la predicción… pero ahora la V.D. es discreta (0,1).Y la interpretación es en términos de probabilidad
Es útil cuando queremos saber si ciertas características psico-sociodemográficas (estado civil, ingresos, nacionalismo, creenciasreligiosas, nivel de estudios, etc.) contribuyen a que sea más probableque un individuo compre un determinado coche, sea diagnosticado conuna depresión, tenga fracaso escolar, etc.
Análisis Multivariante 74
OBJETIVO: Entender cómo conforman los individuos sus preferencias hacia losobjetos o estímulos, estimando la importancia relativa que le conceden a cada unode los atributos o características de éste
Y = X1 + X2 + X3 + ... + Xn(no métrica) (…Categóricas. Atributos con niveles…)
ordinal - preferencias
Ø CONDICIÓN: VD ordinal y VI categórica (atributos)
§ Muy utilizado en Ciencias Sociales (diseño de nuevos productos, test de envases,elasticidad del precio, Identificación del producto ideal, segmentación de mercados,simulaciones, investigar el triaje en un Servicios de Urgencias)
§ EJEMPLO:ü Explicar las preferencias de las amas de casa hacia las diferentes
opciones de LECHE envasada (envase, marca, tapón, precio,procedencia….)
ANÁLISIS CONJUNTO
Análisis Multivariante 7575
EJEMPLO desarrollo de un nuevo modelo de automóvil:
§ Dudamos entre tres niveles de potencia (60cv, 100cv, 125cv)… (3 niveles)§ Una carrocería de tres o cinco puertas… (2 niveles)§ Instalación de una serie de extras en el modelo más bajo de gama.. (2)§ Tipo de motor (eléctrico, híbrido) (2)§ Tres precios distintos…(3)
TAREA EXPERIMENTAL: Se solicita la opinión de un grupo de consumidores quedeberán de valorar 72 productos resultantes de la combinación de suscaracterísticas objeto de análisis (3x2x2x2x3)
RESULTADOS: El investigador es capaz de descubrir y estimar la importancia detodos los atributos y sus respectivos niveles, a pesar de que en la tareaexperimental, los usuarios valoran únicamente los perfiles completos de unospocos productos globalmente percibidos
7676
El principio básico consiste en descomponer PREFERENCIAS manifestadas sobre losProductos Globales o perfiles completos, en UTILIDADES o IMPORTANCIAS poratributo (y nivel)
Ø Las Fases para llevar a cabo un Análisis Conjunto son:
1) Identificación y Selección de los atributos relevantes para esa categoría deproducto o servicio (Focus group). Ej. Para una botella de agua podemos definirel diseño y color del envase, el tapón, el precio, la marca, el material…
2) Definición de niveles u opciones para cada atributo. Para el atributo tapónpodemos pensar en rosca, click, ….
3) Construcción de los Perfiles Completos a partir de la combinación óptima deniveles de atributos para que puedan ser valorados empíricamente (preferencias)
4) Estimación de las utilidades e importancias mediante el algoritmo CONJOINT delSPSS, y así conocer el producto ideal que maximiza la preferencia de losconsumidores. También previsión de la demanda
Y CÓMO SE HACE…?
Análisis Multivariante 77
OBJETIVO: Predecir o modelizar el tiempo que transcurre hasta que ocurre unevento, el RIESGO de…
EJEMPLO: Conocer la probabilidad de supervivencia de un grupo de pacientesde una determinada patología en función del tratamiento recibido, edad, etc.
CONDICIÓN (3 variables diferentes):
üDE RESPUESTA: Tiempo de registro o seguimiento (cuantitativa)üDE CENSURA: Si ha ocurrido o no el evento (dicotómica)üEXPLICATIVAS: cuantitativa o cualitativa (Edad, Tratamiento, …)
ANÁLISIS DE SUPERVIVENCIA
Análisis Multivariante 78
OBJETIVO: Determinar e qué medida una VD está influenciada por una o varias VI.Comprobar si existe un efecto significativo de un “Tratamiento”
EJEMPLO: Comprobar si existe un efecto significativo del consumo de alcoholsobre el rendimiento atencional
CONDICIÓN: VI categórica (factores) y VD cuantitativa
§ Ideal para los diseños experimentales y cuasiexperimentales§ Una o varias VÍAS (VI): ONEWAY ó ANOVA (Diseños de dos o más factores)
MANOVA para múltiples VD. (Análisis Multivariante de la Varianza)
ANÁLISIS DE VARIANZA
Análisis Multivariante 79
Y’= a + b1X1 + b2X2 +…+ bnXn
Regresión Lineal Múltiple V.D.: métrica-cuantitativaV.I.: métricas-cuantitativas
Análisis Discriminante V.D.: no métrica-cualitativaV.I.: métricas-cuantitativas
Regresión Logística V.D.: no métrica-cualitativa. Categórica 0, 1V.I.: sin restricciones. Cuali o Cuantitativas
Análisis Conjunto V.D.: no-métrica. Ordinal de preferenciaV.I.: métricas o no-métricas. Atributos
Análisis de Supervivencia V.D.: variable respuesta o tiempo transcurridovariable censura: si ocurrió o no el evento
V.I.: sin restricciones. Cuali o CuantitativasAnálisis de Varianza V.D.: métrica-cuantitativa
V.I.: no-métricas. Cualitativa categórica (factores)
Análisis Multivariante 80
PELIGROS:§ Fácil estimación y difícil interpretación§ Incluir demasiadas variables (vs. parsimonia)§ Olvido de la teoría (modelizar por modelizar)
PROBLEMAS:§ Incumplimiento de Supuestos§ Requiere un tamaño muestral elevado§ Casos anómalos§ Relevancia conceptual y significación estadística
ANÁLISIS MULTIVARIANTE
Análisis Multivariante 81
Modelización de datos estructurados. Gestión de Bases de datos
Todo tiende a estar interconectado proporcionando datos
82
BIG DATA, para su análisis y comprensión
83Big Data, qué es?
https://www.slideshare.net/pisitoenmadrid/introduccin-al-big-data