Clase 2 De Octubre 2009
-
Upload
juan-jose-gibaja-martins -
Category
Education
-
view
306 -
download
3
Transcript of Clase 2 De Octubre 2009
![Page 1: Clase 2 De Octubre 2009](https://reader035.fdocuments.net/reader035/viewer/2022080212/5595ff441a28ab96308b4673/html5/thumbnails/1.jpg)
Clase 2 de Octubre 2009-10-05
TEMA 4 Análisis de correlación y de regresión lineales
- Diagrama de dispersión: nos sirve para saber en cierto modo si hay relación
directa entre dos variable.
- .El siguiente paso para saber si existe relación directa entre dos variables es el
cálculo de la covarianza, que es una medida de grado en que dos variables
cuantitativas evolucionan paralelamente.
N
yx yixxy
∑ −−=
))(( 1 µµσ
Esta medida tiene el problema de que las medidas en las que está
expresada son raras y además no está acotada, por ello debemos fijarnos
sólo en su signo.
Si el signo es positivo la relación es .creciente.
Si el signo es negativo la relación es decreciente.
- El siguiente paso es el cálculo de la correlación, que acota la covarianza.Esta
medida no tiene unidades( es una medida adimensional). Tiene el mismo
signo que la covarianza.
yx
xy
σσσ
ρ =
Si el coeficiente de correlación vale –1 la relación será lineal perfecta e
inversa. (OJO que la pendiente no tiene por qué ser –1)
Si el coeficiente de correlación vale +1 la relación será lineal perfecta y
directa( OJO que la pendiente no tiene que ser +1)
Si toma el valor 0 no existe relación entre las variables, y en este caso la
pendiente será 0.
Los valores extremos( 0, -1, +1) son fácilmente interpretables, pero surge
la pregunta de ¿Cómo de grande debe ser el coeficiente para poder
![Page 2: Clase 2 De Octubre 2009](https://reader035.fdocuments.net/reader035/viewer/2022080212/5595ff441a28ab96308b4673/html5/thumbnails/2.jpg)
afirmar que existe una relación lineal entre las dos variables? Depende
de:
1-de la situación explorativa o concluyente
2-del tipo de variables estudiadas.
- Análisis de regresión, es una herramienta que persigue ayudar en la
predicción de los valores de una variable cuantitativa.
Y= A+ BX
Y= variable dependiente
A= ordenada en el origen
B= pendiente(incremento de Y cuando crece X en 1 und)
X= variable independiente
y
A
x
- Recta de regresión: sobre el diagrama de dispersión vamos a trazar la recta
que “mejor” se ajusta a la nube de puntos.
La recta escogida será la que minimice la expresión:
2
^
1
)( i
N
ii yy −∑
=
![Page 3: Clase 2 De Octubre 2009](https://reader035.fdocuments.net/reader035/viewer/2022080212/5595ff441a28ab96308b4673/html5/thumbnails/3.jpg)
yi = valor real
iy^
= valor estimado = Axi + B
2^
)( ii yy − = residuo, que siempre será positivo al estar elevado al cuadrado.