Clase 2 De Octubre 2009

3
Clase 2 de Octubre 2009-10-05 TEMA 4 Análisis de correlación y de regresión lineales - Diagrama de dispersión: nos sirve para saber en cierto modo si hay relación directa entre dos variable. - .El siguiente paso para saber si existe relación directa entre dos variables es el cálculo de la covarianza, que es una medida de grado en que dos variables cuantitativas evolucionan paralelamente. N y x y i x xy - - = ) )( ( 1 μ μ σ Esta medida tiene el problema de que las medidas en las que está expresada son raras y además no está acotada, por ello debemos fijarnos sólo en su signo. Si el signo es positivo la relación es .creciente. Si el signo es negativo la relación es decreciente. - El siguiente paso es el cálculo de la correlación, que acota la covarianza.Esta medida no tiene unidades( es una medida adimensional). Tiene el mismo signo que la covarianza. y x xy σ σ σ ρ = Si el coeficiente de correlación vale –1 la relación será lineal perfecta e inversa. (OJO que la pendiente no tiene por qué ser –1) Si el coeficiente de correlación vale +1 la relación será lineal perfecta y directa( OJO que la pendiente no tiene que ser +1) Si toma el valor 0 no existe relación entre las variables, y en este caso la pendiente será 0. Los valores extremos( 0, -1, +1) son fácilmente interpretables, pero surge la pregunta de ¿Cómo de grande debe ser el coeficiente para poder

Transcript of Clase 2 De Octubre 2009

Page 1: Clase 2 De Octubre 2009

Clase 2 de Octubre 2009-10-05

TEMA 4 Análisis de correlación y de regresión lineales

- Diagrama de dispersión: nos sirve para saber en cierto modo si hay relación

directa entre dos variable.

- .El siguiente paso para saber si existe relación directa entre dos variables es el

cálculo de la covarianza, que es una medida de grado en que dos variables

cuantitativas evolucionan paralelamente.

N

yx yixxy

∑ −−=

))(( 1 µµσ

Esta medida tiene el problema de que las medidas en las que está

expresada son raras y además no está acotada, por ello debemos fijarnos

sólo en su signo.

Si el signo es positivo la relación es .creciente.

Si el signo es negativo la relación es decreciente.

- El siguiente paso es el cálculo de la correlación, que acota la covarianza.Esta

medida no tiene unidades( es una medida adimensional). Tiene el mismo

signo que la covarianza.

yx

xy

σσσ

ρ =

Si el coeficiente de correlación vale –1 la relación será lineal perfecta e

inversa. (OJO que la pendiente no tiene por qué ser –1)

Si el coeficiente de correlación vale +1 la relación será lineal perfecta y

directa( OJO que la pendiente no tiene que ser +1)

Si toma el valor 0 no existe relación entre las variables, y en este caso la

pendiente será 0.

Los valores extremos( 0, -1, +1) son fácilmente interpretables, pero surge

la pregunta de ¿Cómo de grande debe ser el coeficiente para poder

Page 2: Clase 2 De Octubre 2009

afirmar que existe una relación lineal entre las dos variables? Depende

de:

1-de la situación explorativa o concluyente

2-del tipo de variables estudiadas.

- Análisis de regresión, es una herramienta que persigue ayudar en la

predicción de los valores de una variable cuantitativa.

Y= A+ BX

Y= variable dependiente

A= ordenada en el origen

B= pendiente(incremento de Y cuando crece X en 1 und)

X= variable independiente

y

A

x

- Recta de regresión: sobre el diagrama de dispersión vamos a trazar la recta

que “mejor” se ajusta a la nube de puntos.

La recta escogida será la que minimice la expresión:

2

^

1

)( i

N

ii yy −∑

=

Page 3: Clase 2 De Octubre 2009

yi = valor real

iy^

= valor estimado = Axi + B

2^

)( ii yy − = residuo, que siempre será positivo al estar elevado al cuadrado.