Análisis de Asociación y Correlación Entre Dos Variables
-
Upload
michelle-gonzales -
Category
Documents
-
view
220 -
download
0
Transcript of Análisis de Asociación y Correlación Entre Dos Variables
-
8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables
1/34
-
8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables
2/34
Transformar variables
• Si la mayoría de nuestras variablesson cualitativas, y queremosrelacionar algunas variables,tenemos que transformar la escalaen la que la variable ha sidoregistrada o medida.
• Esta transformación sólo se puederealizar desde una variable continua,para llevarla a una categórica.
-
8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables
3/34
¿Cómo?• Vamos a la tabla de datos “atos de
empleados!.
• "ransformaremos la variable Salarioactual.
• #o primero, e$plorar la distribución de lavariable, para ver el mínimo y el m%$imo&si la variable no es de razón'.
• "eniendo los límites, identi(car los puntosde corte de la distribución.
• )or e*emplo, cuatro punto de corte+ -.a /0.1 /2. a 23.1 24. a
.1 . a /5..
-
8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables
4/34
Paso 1: ir a recodicar
-
8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables
5/34
Paso 2: Crear la variable de salida e ingresarlos pntos de corte!
"arcar
"arcar
-
8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables
6/34
#$e crea la variable% pero &ay 'egenerar las categor(as)
-
8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables
7/34
*ntonces% la distribción ser(a
-
8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables
8/34
Tabla contingenciase+o,salario
¿Cómo podemos crear n tabla 'emestre la relación entre se+o% salarioseg-n pertenencia .tnica?
-
8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables
9/34
-
8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables
10/34
Análisis noparam.tricos para dosvariables categóricasnominales ordinales
C&i/cadrado
-
8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables
11/34
0C&i cadrado
• Es una prueba para evaluar la hipótesis de larelación entre dos variables categóricas a nivelnominal u ordinal.
• Se calcula por medio de una tabla decontingencia.
• )arte del supuesto de no relación de variables.
• 6naliza la diferencia de entre frecuencia
esperadas y observadas.• Si e$iste relación, la tabla obtenida tiene que ser
diferente respecto a las frecuencias esperadas.
-
8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables
12/34
ormla
3dentica
Pol(tica
Provincia
Cat(n "alleco Total
7zquierda
3 53
erecha 4 53 /2
8entro 2 5 54 "otal -/ - /
7zquierda &53'98autín &-/'
"otal &/'
/-./
:i*;
-
8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables
13/34
*4emplo de interpretación: se+o ycategor(a laboral
8hi >cuadrado es24,522#a probabilidad es de
,.Siendo la probabilidadmuy peque?a &seacepta hastainferiores a ,-', serechaza la hipótesisde independencia y seconcluye que hayrelación.
)ara interpretar la prueba, se debe cautelar que las frecuenciasesperada no sean demasiado peque?as. Si hay frecuencias menoresa -, no deben e$ceder el 5@ del total de frecuencias esperadas.=%s de un 5@ debe ser interpretado con mucho cuidado.
-
8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables
14/34
¿5. pasa con los ba4os efectivoso celdas con frecenciasesperadas menores a 6?
• 6l ser estos valores el denominador de lafórmula, valores peque?os abultan elaporte de la celda al 8hiAcuadrado.
• )ara ello podemos usar la prueba de Bates,que resta ,- a la diferencia entre fobservada y esperada para cada celda.
• )ara muestras peque?a &menos de Ccasos' en tablas de 5 $ 5, se usa la pruebade
-
8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables
15/34
7tro problema es el n o tama8o dela mestra
• 8hiAcuadrado es sensible al tama?o de la muestra&no es aconse*able para muestras mayores a 4casos', ya que tiende a aumentar el nivel designi(cancia.
• )or e*emplo+ una distribución de - casos,manteniendo la proporcionalidad entre los valores,chiAcuadrado sería de .20 con una sig. de ./-.Si la muestra fuese de .-, manteniendo las
misma proporción de valores, chiAcuadrado sube a20 y la sig..-44
-
8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables
16/34
Análisis param.tricos para na variablenominal ordinal dicotómica y na contina!
T/stdent
-
8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables
17/34
T/stdent
• E$amina si dos grupos di(eren demanera signi(cativa respecto de susmedias.
• )arte de la hipótesis de diferenciaentre grupos, es decir, los gruposdi(eren signi(cativamente entre sí
respecto de sus medias &la Dpostula la no diferencia'.
-
8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables
18/34
-
8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables
19/34
• )rueba #evene+ homogenidad o igualdad e varianza. =ayor a ,-,varianza iguales1 menor a ,-, varianza distintas. Se decide que líneade estadísticos interpretar. )ara el e*emplo, , es menor que ,-,
por lo tanto asume varianzas no iguales.• )ruba "Astudent+ indica ,03 con un nivel crítico de ,, lo que
implica la compatibilidad entre las diferencias observadas entre lasmedias muestrales de los grupos y la hipótesis nula de que las mediaspoblacionales son iguales. 6l ser la sig. menor a ,-, se rechaza lahipótesis nula, determinando que los salarios entre hombre y mu*eres
son diferentes.•
-
8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables
20/34
Correlación entre dos variablescontinas!
Coeciente r de Pearson
-
8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables
21/34
r de Pearson!
• )rueba que busca establecer la correlaciónentre variables a nivel de intervalo o de razón.
• Se obtienen correlaciones del tipo+ 6 mayor $,
mayor y1 6 mayor $, menor y1 valores altos en$ se asocian a valores altos en y1 valores altosen $ se asocian a valores ba*os en y.
• #a prueba no parte de la lógica causa efecto,
aun cuando esta se puede derivar desde lateoría.
• Varía entre A. y .
-
8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables
22/34
3nterpretación del signo
• A.; correlación negativa perfecta &a mayor$, menor y'1 esto de manera proporcional,aumentando o disminuyendo por cada unidadconstante &a menor $, mayor y'.
• A.4 &fuerte'1 A.2- &considerable'1 A.-&media'1 A.5- &dbil'1 A. &muy dbil'.
• .4 &fuerte'1 .2- &considerable'1 .-
&media'1 .5- &dbil'1 . &muy dbil'.• .; correlación positiva perfecta &a mayor
$, mayor y1 a menor $, menor y'.
-
8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables
23/34
• Es adimensional
• Sólo toma valores en FA,G• #as variables son incorreladas r;
• Helación lineal perfecta entre dos variables r;Io r;A.
• 8uanto m%s cerca est r de I o A me*or ser% elgrado de relación lineal.
– Siempre que no e$istan observaciones anómalas.
)ropiedades de r
A I
Helación
inversaperfect
a
Helación
directacasi
perfecta
Variablesincorrelad
as
-
8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables
24/34
*stdio con4nto de dosvariables
• 6 la derecha tenemos una posible manera
de recoger los datos obtenido observandodos variables en varios individuos de unamuestra.
– En cada (la tenemos los datos de un individuo
– 8ada columna representa los valores quetoma una variable sobre los mismos.
– #as individuos no se muestran en ningJnorden particular.
• ichas observaciones pueden serrepresentadas en un diagrama dedispersión &KscatterplotL'. En ellos, cadaindividuos es un punto cuyas coordenadasson los valores de las variables.
• :uestro ob*etivo ser% intentar reconocer a
Alturaen cm.
Pesoen Kg.
162 61
154 60
180 78
158 62
171 66
169 60
166 54
176 84
163 68
... ...
-
8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables
25/34
9iagramas de dispersión o nbede pntos
" i d e 1 : ; c m !
"ide 1 =g!
"enemos las alturas y los pesos de C individuos representados en
un diagrama de dispersión.
-
8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables
26/34
elación entre variables! "enemos las alturas y los pesos de C individuos representados en
un diagrama de dispersión.
) a r e c e
q u e e
l p e s o a
u m e n
t a c o n
l a
a l t u r
a
-
8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables
27/34
Predicción de na variable enfnción de la otra
6parentemente el peso aumenta Mg por cada cm dealtura... o sea,el peso aumenta en una unidad por cada unidad de altura.
1> cm!
1> =g!
-
8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables
28/34
3ncorrelación
C
3
C
3
5C
53
CC
/ - 0 2 3 4 5
Helación directa e inversa
)ara valores de N por encima de lamedia tenemos valores de B porencima y por deba*o enproporciones similares.7ncorrelación.
)ara los valores de N mayoresque la media le correspondenvalores de B menores. Esto esrelación inversa o decreciente.
•)ara los valores de N mayores que lamedia le corresponden valores de Bmayores tambin.
•)ara los valores de N menores que lamedia le corresponden valores de B
menores tambin.
•Esto se llama relación directa.
-
8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables
29/34
Entrenando el o*o+ correlaciones positivas
-
8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables
30/34
Entrenando el o*o+ correlaciones negativas
-
8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables
31/34
6nimación+ Evolución de r y diagrama de dispersión
-
8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables
32/34
E*emplo para la variable salario inicialy actual
-
8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables
33/34
Esto nos indica quer corresponde a,33, con una sig.,.
8orrelación linealpositiva fuerte, deltipo a mayor $,mayor y1 a menor
$, menor y.
-
8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables
34/34
¿5. pasa con tipo de salario ymeses de contrato?
¿5. pasa con a8os de estdio ytipo de salario?
¿5. pasa con e+periencia previa
y tipo de salario?