13. Regresion y Correlacion.ppt

download 13. Regresion y Correlacion.ppt

of 41

Transcript of 13. Regresion y Correlacion.ppt

  • ANLISIS DE CORRELACIN Y REGRESINBIOESTADSTICABio.Est. Wilver Rodrguez Lpez. M.Sc.

  • En muchas ocasiones surge la necesidad de estudiar la relacin que existe entre dos variables cuantitativas que tienen distribucin aproximadamente normal. Por ejemplo si la dosis de cierta droga (en ml) est relacionada con el tiempo de reaccin a un estmulo en segundos.Antes de establecer un modelo que relacione a ambas variables, es necesario averiguar si estas dos variables esta correlacionadas entre s; es decir realizar una anlisis de correlacin.

    *

    Introduccin

  • ANALISIS DE CORRELACIN DE DOS VARIABLES CANTITATIVAS

    En este proceso de anlisis es de inters obtener una medida que indique la intensidad de la relacin entre dos variables. El coeficiente utilizado para indicar esta intensidad es el coeficiente de correlacin lineal de Pearson ( r ). Este coeficiente se determina por la siguiente relacin:

    *

  • *Las sumatorias en la frmula anterior se realizan sobre las n observaciones, tomadas como muestra.

    En coeficiente de correlacin de Pearson se encuentran entre 1 y 1, esto es

  • DIAGRAMA DE DISPERSIN* Correlacin positiva Correlacin negativa Ausencia de correlacin

  • *Coeficiente de correlacin lineal El Coeficiente de Correlacin (r) requiere variables medidas en escala de intervalos o de raznVara entre -1 y 1.Valores de -1 1 indican correlacin perfecta.Valor igual a 0 indica ausencia de correlacin.Valores negativos indican una relacin lineal inversa y valores positivos indican una relacin lineal directa

  • Interpretacin del Coeficiente de CorrelacinCorrelacin negativa perfecta-1 -0.5 0 0.5 1

  • Significancia Estadstica del Coeficiente de CorrelacinUna vez obtenido el coeficiente de correlacin con los datos de la muestra, interesa saber si en la poblacin muestreada: 0

  • Contraste de la Hiptesis 0Este es el contraste de hiptesis que con mas frecuencia se realiza.Las hiptesis que se plantean son las siguientes:Ho : = 0 (No hay correlacin entre las variables)H1 : 0 (Si hay correlacin entre las variables)

  • Contraste de la Hiptesis 0El estadstico de contraste es:

    t exp = r (n-2) / (1- r2)

    t exp tiene distribucin t de Student con n-2 grados de libertad

  • Contraste de la Hiptesis 0DecisinPara un determinado nivel de significancia , y un tamao de muestra especfico se rechaza Ho si el valor del t exp es menor o igual que el valor - t (n-2); /2 o si es mayor o igual al valor t (n-2); /2

  • Ejemplo: Uno de los objetivos de un estudio es analizar si existe una relacin lineal entre la presin sangunea sistlica (mmHg), (SIS), y la presin sangunea diastlica (mmHg), (DIA), en los habitantes de una ciudad. Se selecciona al azar una muestra de diez personas y se mide la SIS y la DIA. Los resultados obtenidos son los siguientes:Persona: 1 2 3 4 5 6 7 8 9 10SIS(X) : 130 125 145 150 132 133 145 160 150 140DIA(Y): 85 70 80 90 65 70 90 100 95 85

    x =1410 y = 830 xy = 17,990 x2 = 199,888 y2 = 70,100

  • Grfico de dispersin

    Grfico2

    85

    70

    80

    90

    65

    70

    90

    100

    95

    85

    y

    Tensin Arterial Sistlica

    Tensin Arterial Diastlica

    Grfico N Relacin entreTensin Arterial Sistlica(TAS) y la Tensin Arterial Diastlica(TAD) en una muestra de personas en una ciudad.

    Hoja1

    xy

    13085

    12570

    14580

    15090

    13265

    13370

    14390

    160100

    15095

    14085

    Hoja1

    y

    Tensin Arterial Sistlica

    Tensin Arterial Diastlica

    Grfico N Relacin entreTensin Arterial Sistlica(TAS) y la Tensin Arterial Diastlica(TAD) en una muestra de personas en una ciudad.

    Hoja2

    Hoja3

  • Frmula para el coeficente de correlacin (r) Pearson 10( 117,990) - (1410) (830) r = _____________________________________________ [ 10(199,888) (1410)2 ] [10(70,100 ) (830)2 ]

    r = 0.833

  • Significancia Estadstica del Coeficiente de CorrelacinPlanteamiento de hiptesis Ho : = 0H1 : 0

    Nivel de significancia = 0.05

  • Significancia Estadstica del Coeficiente de CorrelacinEl estadstico de contraste:

    t exp = r (n-2) / (1- r2)

    texp = 0.833 (10-2) / (1- 0.8332) = 4.26

  • Significancia Estadstica del Coeficiente de CorrelacinDecisin:Los puntos crticos de la t de Student con 8 grados de libertad, para un contraste bilateral con = 0.05, son -2.306 y +2.306Como el texp = 4.26 es mayor que el punto crtico +2.306, se rechaza Ho : = 0

    Conclusin: Si existe correlacin lineal entre TAS y la TAD y es fuerte y positiva, con un nivel de significancia de 0.05

  • *Anlisis de RegresinEl anlisis de regresin lineal simple es til para estudiar la forma probable de la relacin entre dos variables (Y: variable dependiente y X: variable independiente), y su objetivo final es predecir o estimar el valor de la variable dependiente, conociendo un valor especfico de la variable independiente.

  • *Proceso de estimacin de la regresin lineal simpleModelo de regresiny=0+1x+Ecuacin de regresinE(y)=0+1xParmetros desconocidos0.1Datos de la muestra b0 y b1proporcionan estimados0 y 1Ecuacin estimada de regresiny=b0+b1xEstadsticos de la muestrab0.b1

  • *Lneas posibles de regresin en la regresin lineal simplex

  • PASOS EN UN ANLISIS DE REGRESIN LINEAL SIMPLETomar una muestra de n observaciones en las que se consideran dos variables, una variable x independiente, considerada libre de error es decir una variable fijada de antemano y una variable y, variable dependiente, considerada variable aleatoria, o sea una de las posibles respuestas de la variable y a la variable x. Se tienen entonces un conjunto de n pares de la forma (x,y)

    *

  • PASOS EN UN ANLISIS DE REGRESIN LINEAL SIMPLERealizar un diagrama de dispersin de las variables (x,y) en un sistema de coordenadas cartesianas, ya visto anteriormente y calcula el coeficiente de correlacin.

    *

  • PASOS EN UN ANLISIS DE REGRESIN LINEAL SIMPLEEn base a la informacin anterior y si se considera apropiado un modelo de recta, encontrar la ecuacin de la recta que mejor ajuste (o represente) a todos los puntos del diagrama. A travs de esta ecuacin es posible predecir el valor de y para un determinado valor de x.

    *

  • PASOS EN UN ANLISIS DE REGRESIN LINEAL SIMPLEEstimar la recta de regresin:

    *

  • PASOS EN UN ANLISIS DE REGRESIN LINEAL SIMPLE*

  • PASOS EN UN ANLISIS DE REGRESIN LINEAL SIMPLE

    *

  • Estimacin de la recta de regresin por el mtodo de mnimos cuadrados

    *

  • SIGNIFICANCIA ESTADSTICA DEL COEFICIENTE DE REGRESIN

    *

  • SIGNIFICANCIA ESTADSTICA DEL COEFICIENTE DE REGRESIN

    *

  • Intervalo de confianza para el coeficiente de regresin:

    *

  • EJEMPLO*

  • *

  • Anlisis de Regresin.

    *

  • Significancia estadstica del coeficiente de regresin

    *Antes veamos algunos clculos auxiliares

    YY estimadoe =Y-Y estimado(X-media)210,6570,1176497,56250,80,974650,030502625,06251,81,29230,257759293,06251,41,609950,0440791,56252,11,92760,029721760,56251,82,245250,198247560,06252,22,56290,131696410,062532,880550,01426830,56252,753,19820,200883241,562533,515850,266101223,06254,13,83350,071022255,06254,94,151150,560776327,5625suma1,9227069935,75

  • *

  • *

  • *

  • *

  • *

  • El coeficiente de determinacin es (0.939)2 = 0.882, es decir el porcentaje de variaciones observadas en el tiempo de reaccin al estmulo que es explicado por las variaciones de la dosis de la droga es del 87.1%. El porcentaje de variacin del tiempo de reaccin al estmulo que no es explicado por la dosis de la droga es del 0.118 [1 R2 ]

    *

  • Anlisis de Regresin con el MegaStat

    *