Estadistica Bivariada 2011
-
Upload
francisco-soto-8557 -
Category
Documents
-
view
1.375 -
download
0
Transcript of Estadistica Bivariada 2011
5/12/2018 Estadistica Bivariada 2011 - slidepdf.com
http://slidepdf.com/reader/full/estadistica-bivariada-2011 1/26
Estadística Bivariada
5/12/2018 Estadistica Bivariada 2011 - slidepdf.com
http://slidepdf.com/reader/full/estadistica-bivariada-2011 2/26
REPRESENTACIÓN DE DATOS DE DOS VARIABLES.
Cada una de las variables puede ser por su naturaleza cualitativa o cuantitativa.Como resultado, los datos bivariados pueden formarse mediante tres combinacionesde variables:
1. Ambas variables son cualitativas (de atributos).2. Una variable es cualitativa (de atributo) y otra es cuantitativa (numérica).3. Ambas variables son cuantitativas (numéricas).
Dos variables cuantitativas.Cuando los datos bivariados son resultado de dos variables cuantitativas, losdatos matemáticos suelen expresarse como pares ordenados, (X,Y), donde “X”es la variable de entrada (variable independiente) y “Y” es la variable de salida(variable dependiente).
5/12/2018 Estadistica Bivariada 2011 - slidepdf.com
http://slidepdf.com/reader/full/estadistica-bivariada-2011 3/26
Variable estadística bidimensionalUna variable bidimensional es una variable en la que cada individuo está definido por unpar de caracteres, (X, Y).Estos dos caracteres son a su vez variables estadísticas en las que sí existe relación entreellas, una de las dos variables es la variable independiente y la otra variable dependiente.
Relación funcionalDos variables x e y están relacionadas funcionalmente cuando conocida la primera sepuede saber con exactitud el valor de la segunda.
Ejemplo
Si se deja caer una piedra, existe una fórmula que nos permite calcular exactamente,la altura a la que se encuentra en función del tiempo transcurrido.
h = ½ g t².
Relación estadísticaDos variables x e y están relacionadas estadísticamente cuando conocida la primera se
puede estimar aproximadamente el valor de la segunda.
EjemplosIngresos y gastos de una familia, Producción y ventas de una fábrica, Gastos enpublicidad y beneficios de una empresa.
REPRESENTACIÓN DE DATOS DE DOS VARIABLES.
5/12/2018 Estadistica Bivariada 2011 - slidepdf.com
http://slidepdf.com/reader/full/estadistica-bivariada-2011 4/26
Distribuciones Bidimensionales
Las distribuciones bidimensionales son aquellas en las que se estudian al mismo tiempodos variables de cada elemento de la población: por ejemplo peso y altura de un grupode estudiantes; superficie y precio de las viviendas de una ciudad; potencia yvelocidad de una gama de automóviles deportivos.
Para representar los datos obtenidos se utiliza una tabla de correlación
nn,mnn,m-1xnn,2nn,1xn
nn-1,mnn-1,m-1xnn-1,2nn-1,1xn-1
xxxxx.....
n2,mn2,m-1xn2,2n2,1x2
n1,mn1,m-1xn1,2n1,1x1
ymym-1.....y2y1X / Y
En cada intersección (par (x,y)) se recoge el número de veces que dicho par devalores se ha presentado conjuntamente.
5/12/2018 Estadistica Bivariada 2011 - slidepdf.com
http://slidepdf.com/reader/full/estadistica-bivariada-2011 5/26
331,22Alumno 15
301,21Alumno 14
341,27Alumno 13
351,28Alumno 12331,25Alumno 11
351,29Alumno 10
321,27Alumno 9
321,24Alumno 8
341,3Alumno 7
351,29Alumno 6
321,22Alumno 5
301,21Alumno 4
341,27Alumno 3
331,28Alumno 2
321,25Alumno 1
PesoEstaturaAlumno
341,29Alumno 30
351,27Alumno 29
311,24Alumno 28
341,3Alumno 27
341,29Alumno 26
321,22Alumno 25
311,21Alumno 24
341,27Alumno 23
341,28Alumno 22
331,25Alumno 21
331,29Alumno 20
331,27Alumno 19
321,24Alumno 18
351,3Alumno 17
341,29Alumno 16
PesoEstaturaAlumno
Ejemplo: Medimos la estatura y el peso de los alumnos de una clase yobtenemos los siguientes resultados:
Distribuciones Bidimensionales
5/12/2018 Estadistica Bivariada 2011 - slidepdf.com
http://slidepdf.com/reader/full/estadistica-bivariada-2011 6/26
Esta información se puede representar de un modo más organizado en la
siguiente tabla de correlación:
120001,30 cm
111031,29 cm
101101,28 cm
120121,27 cm
000001,26 cm
001111,25 cm
001201,24 cm
000001,23 cm
101101,22 cm021001,21 cm
35 kg34 kg33 kg32 kg31 kgEstatura / Peso
Tal como se puede ver, en cada casilla se recoge el número de veces que sepresenta conjuntamente cada par de valores (x,y).
Distribuciones Bidimensionales
5/12/2018 Estadistica Bivariada 2011 - slidepdf.com
http://slidepdf.com/reader/full/estadistica-bivariada-2011 7/26
Distribuciones marginales
Al analizar una distribución bidimensional, uno puede centrar su estudio en elcomportamiento de una de las variables, con independencia de como se comporta laotra. Estaríamos así en el análisis de una distribución marginal.
minnm
j iji
...1; 1
==
∑=•
n jnnn
i
ij j ..1;1
==∑=
•
Suma de los valores de la fila i-ésima
de la tabla.
Suma de los valores de la columna j-
ésima de la tabla.
Distribuciones Bidimensionales
5/12/2018 Estadistica Bivariada 2011 - slidepdf.com
http://slidepdf.com/reader/full/estadistica-bivariada-2011 8/26
120001,30 cm
111031,29 cm
101101,28 cm
120121,27 cm
000001,26 cm
001111,25 cm
001201,24 cm
000001,23 cm
101101,22 cm
021001,21 cm
35 kg34 kg33 kg32 kg31 kgEstatura / Peso
A partir del ejemplo anterior (pesos y medidas de los alumnos) vamos a estudiar susdistribuciones marginales.
3
6
3
6
0
3
3
0
3
3
57666
Distribuciones Bidimensionales
Distribuciones marginales
3030
5/12/2018 Estadistica Bivariada 2011 - slidepdf.com
http://slidepdf.com/reader/full/estadistica-bivariada-2011 9/26
30Total
31,3
61,29
31,28
61,27
01,26
31,25
31,24
01,23
31,22
31,21
niEstatura
Marginal de X
30Total
535
734
633
632
631
niPeso
Marginal de Y
Distribuciones Bidimensionales
Distribuciones marginales
5/12/2018 Estadistica Bivariada 2011 - slidepdf.com
http://slidepdf.com/reader/full/estadistica-bivariada-2011 10/26
Diagrama de dispersión o nube de puntos.
Es la gráfica de todos los pares ordenados de datos de dos variables que estánen un sistema de ejes coordenados. La variable de entrada, X, se grafica en eleje horizontal y la variable de salida, Y, se gráfica en el eje vertical.
Diag. Dispersión
29
30
31
32
33
34
35
36
1,2 1,22 1,24 1,26 1,28 1,3 1,32
Estatura Peso
Correlación Lineal.
5/12/2018 Estadistica Bivariada 2011 - slidepdf.com
http://slidepdf.com/reader/full/estadistica-bivariada-2011 11/26
Correlación Lineal.
Si los pares ordenados (x, y) tienden a seguir un patrón de línea recta, se tiene unacorrelación lineal.
Esta correlación puede ser positiva o negativa (relación directa ó inversa).
TIPOS DE DEPENDENCIA A PARTIR DE LA REPRESENTACIÓN GRÁFICA
Uno de los objetivos de este tema es estudiar el tipo de dependencia que hay entrelas dos características o variables estudiadas para un fenómeno en cuestión.
" ¿ A mayor talla de una persona le corresponde mayor peso ? "
A esta pregunta parece que se responde rápidamente que sí. ¿Cómo se observa enla nube de puntos este hecho?.
Si los datos forman una línea horizontal o vertical, no hay correlación, ya que unavariable no afecta la otra.
5/12/2018 Estadistica Bivariada 2011 - slidepdf.com
http://slidepdf.com/reader/full/estadistica-bivariada-2011 12/26
Correlación Lineal.
Si los pares ordenados (x, y) tienden a seguir un patrón de línea recta, se tiene unacorrelación lineal.Esta correlación puede ser positiva o negativa (relación directa ó inversa).Si los datos forman una línea horizontal o vertical, no hay correlación, ya que unavariable no afecta la otra.
5/12/2018 Estadistica Bivariada 2011 - slidepdf.com
http://slidepdf.com/reader/full/estadistica-bivariada-2011 13/26
Correlación Lineal.
Diag. Dispersión
29
30
31
32
33
34
3536
1,2 1,22 1,24 1,26 1,28 1,3 1,32
Estatura Peso
5/12/2018 Estadistica Bivariada 2011 - slidepdf.com
http://slidepdf.com/reader/full/estadistica-bivariada-2011 14/26
∑−−= ))((
1)1 Y y X x
nCOV
ii xy
∑ −= )()(1
)2 Y X y xn
COV ii xy
Correlación Lineal.
OBS:La covarianza, sin embargo, no permite tener una noción del “grado de asociación”
ya que varía entre –infinitos y + infinito y no hay modo de saber si es grande ó
pequeña.
La covarianza entre dos variables X e Y (COVxy), nos indica si la posible relación
es directa o inversa (favorable o no).
•Si COVxy >0
Directa•Si COVxy <0indirecta•Si COVxy = 0 No hay relación ó Incorrelacionadas
Covarianza
5/12/2018 Estadistica Bivariada 2011 - slidepdf.com
http://slidepdf.com/reader/full/estadistica-bivariada-2011 15/26
∑ −= )()(1
Y X y xn
COV ii xy
Correlación Lineal.
Covarianza
83797466626761585855PESO (kg)
182180180175175171170168165160TALLA (cm)
Ejemplo
Estudiamos la talla, medida en cm. y el peso, medido en kg. de un grupo de 10personas, podemos obtener los siguientes valores:
Podemos llamar X a la talla e Y al peso con lo que se obtendría la variable
bidimensional (X, Y) que toma 10 valores, que son las 10 parejas de valores de latabla anterior: (160,55), (165,58), etc.
5/12/2018 Estadistica Bivariada 2011 - slidepdf.com
http://slidepdf.com/reader/full/estadistica-bivariada-2011 16/26
Correlación Lineal.
Covarianza
83797466626761585855PESO (kg)
182180180175175171170168165160TALLA (cm)
Ejemplo
TALLA V/S PESO
40
45
50
55
60
65
70
75
80
8590
155 160 165 170 175 180 185
5/12/2018 Estadistica Bivariada 2011 - slidepdf.com
http://slidepdf.com/reader/full/estadistica-bivariada-2011 17/26
∑ −= )()(1
Y X y xn
COV ii xy
Correlación Lineal.
Covarianza
83797466626761585855PESO (kg)
182180180175175171170168165160TALLA (cm)
Ejemplo
3,666,172
10
831827918074180661756217561170581685816555160⋅−
⋅+⋅+⋅+⋅+⋅+⋅+⋅+⋅+⋅= xyCOV
3,66
6,172
=
=
y
x
032,5538,114437,11498 >=−= xyCOV Implica dependencia directa
5/12/2018 Estadistica Bivariada 2011 - slidepdf.com
http://slidepdf.com/reader/full/estadistica-bivariada-2011 18/26
El coeficiente de correlación lineal, r, es la medida numérica de la intensidad de larelación lineal entre dos variables. El coeficiente refleja la consistencia de efectoque el cambio en una variable tiene sobre otras.
Correlación Lineal.
Coeficiente de Correlación (r).El coeficiente de correlación lineal (de Pearson) de dosvariables, r, nos indica si los puntos tienen una tendencia adisponerse alineadamente (excluyendo rectas horizontales y
verticales).
Tiene el mismo signo que COVxy por tanto de su signo obtenemos el que la posiblerelación sea directa o inversa.
r es útil para determinar si hay relación lineal entre dos variables, pero no servirápara otro tipo de relaciones (cuadrática, logarítmica,...)
5/12/2018 Estadistica Bivariada 2011 - slidepdf.com
http://slidepdf.com/reader/full/estadistica-bivariada-2011 19/26
Ej: si r=1
Coeficiente de Correlación (r).
Y x
xy
SS
COV r =)1Y x
xy
Var Var
COV r =)2
Propiedades de r:
•Es adimensional•Sólo toma valores en [-1,1]
•Las variables son incorreladas si r=0•Relación lineal perfecta entre dos variables r=+1 o r=-1•Excluimos los casos de puntos alineados horiz. o verticalmente.
•Cuanto más cerca esté r de +1 o -1 mejor será el grado de relación lineal.
5/12/2018 Estadistica Bivariada 2011 - slidepdf.com
http://slidepdf.com/reader/full/estadistica-bivariada-2011 20/26
Correlaciones Positivas
5/12/2018 Estadistica Bivariada 2011 - slidepdf.com
http://slidepdf.com/reader/full/estadistica-bivariada-2011 21/26
Correlaciones Negativas
5/12/2018 Estadistica Bivariada 2011 - slidepdf.com
http://slidepdf.com/reader/full/estadistica-bivariada-2011 22/26
Si esa relación se expresa mediante una función lineal del tipo y = ax + b, sugráfica correspondería a una recta.
Correlación Lineal.
Recta de regresiónSupongamos que en una variable bidimensional queremos precisar la relación queexiste entre las dos variables que la forman. Normalmente se elige como y la variabledependiente y como x la independiente.
En el caso que nos ocupa nos interesa la recta que mejor "se ajuste" a los puntos dela nube de la variable. Dicha recta se denomina: recta de regresión.
Por un método que se denomina de "mínimos cuadrados" y cuya concreción no
corresponde a este nivel de estudio, se deduce que la recta de regresión debe
pasar por el punto correspondiente a las medias de ambas variables.
5/12/2018 Estadistica Bivariada 2011 - slidepdf.com
http://slidepdf.com/reader/full/estadistica-bivariada-2011 23/26
Correlación Lineal.
Recta de regresiónEn la imagen siguiente se muestra la recta de regresión de y (peso) sobre x (talla) del ejemploanterior. En este caso se supone que represente cómo depende el peso de una personarespecto de su talla.
TALLA V/S PESO
40
50
60
70
80
90
155 160 165 170 175 180 185
PESO (kg) Lineal (PESO (kg))
Si recordamos que entre la talla y el peso decíamos que existía una dependencia directa, la rectade regresión lo confirma ya que su pendiente es positiva: a medida que aumenta la talla aumenta
el peso. Por tanto:
Dependencia directa
Pendiente de la rectapositiva
Función creciente
5/12/2018 Estadistica Bivariada 2011 - slidepdf.com
http://slidepdf.com/reader/full/estadistica-bivariada-2011 24/26
Correlación Lineal.
Recta de regresiónEcuación de la recta de regresión
PESO V/S TALLA
y = 1,2121x - 142,91
0
20
40
60
80
100
155 160 165 170 175 180 185
¿qué utilidad tiene la recta de regresión?
5/12/2018 Estadistica Bivariada 2011 - slidepdf.com
http://slidepdf.com/reader/full/estadistica-bivariada-2011 25/26
Correlación Lineal.
¿Qué utilidad tiene la recta de regresión?En la tabla de valores de las variables talla - peso, solamente nos dan los valores de undeterminado número de personas (10): casos conocidos. Mediante la recta de regresión podríamosobtener de manera aproximada el peso de una persona de la que sólo conociéramos la talla, enuna población semejante a aquella de la que se ha obtenido la muestra.
Si observamos la gráfica anterior, podríamos suponer por ejemplo que una persona de 185 cmpesaría algo más de 80 kg
De manera más precisa, si conocemos la expresión de la recta de regresión, se pueden calcular
valores para la variable y, conocidos los de x, como si se tratara de una función.
PESO V/S TALLA
y = 1,2121x - 142,91
0
20
40
60
80
100
155 160 165 170 175 180 185
5/12/2018 Estadistica Bivariada 2011 - slidepdf.com
http://slidepdf.com/reader/full/estadistica-bivariada-2011 26/26
Correlación Lineal.
Ejemplo anterior: para una persona de 185 cm ¿cuál sería su peso en kg
y = 1,2121x – 142,91
Función y = ax + b
y = 1,2121*185 – 142,91
y = 81,3285 Estimado
Reemplazamos el valor de x =185 (conocido) en la
función