SOLUCIN DE PRCTICA DE CORRELACIN Y REGRESIN LINEAL
1. Desarrollo:
X: consumo anual de vino (litros por habitante).Y: N de muertes por enfermedad cardiaca, por cada 100000 hab.
Vamos a trabajar con la siguiente tabla:
Qu podemos decir sobre la relacin entre las dos variables? Encuentra la correlacin de Pearson.Para calcular la relacin de Pearson debemos trabajar con la siguiente tabla:
Para calcular la correlacin de Pearson:
Dnde: Es la covarianza. Es la varianza de la variable X. Es la varianza de la variable Y.
Clculo de la varianza de X:
Pues como son datos que no estn agrupados, entonces la frecuencia fi = 1, para cada uno de los valores de X.Reemplazando:
Clculo de la varianza de Y:
De manera anloga al clculo de la varianza en X.
Pues como son datos que no estn agrupados, entonces la frecuencia fi = 1, para cada uno de los valores de Y.Reemplazando:
Clculo de Covarianza:
Finalmente ya podemos reemplazar estos resultados en la frmula de coeficiente relacin de Pearson:
Podemos hacer el siguiente anlisis en base al resultado obtenido: Como el coeficiente de correlacin de Pearson result ser un valor negativo, podemos decir que la relacin entre las variables X y Y es inversa, es decir a mayor consumo de vino (X) menor nmero de muertos por enfermedades cardiacas (Y).
Como el r tiende a -1, podemos decir que es una relacin fuerte, es decir los puntos definidos por (X, Y) estn bien cercanas a la recta generada por la regresin lineal.
Podemos afirmar que a mayor consumo de vino menor nmero de muertes por enfermedad cardiaca? Realiza la nube de puntos y determina la ecuacin de regresin lineal.Grfico de dispersin de puntos:
Para la regresin lineal nosotros utilizaremos la ecuacin general de una recta:
Dnde:
Clculo de b:
Clculo de a:
Finalmente:
Obtenindose el siguiente grfico:
Podemos predecir aproximadamente el valor de la variable Y si sabemos el valor de X? Estima el N de muertes por enfermedad cardiaca en Rusia para un promedio de consumo anual de vino de 1.8 litros por habitante.
Aplicamos la ecuacin obtenida:
2. Desarrollo:
Para el siguiente ejercicio se trabajara con las variables:
X: horas trabajadas.Y: unidades producidas.
Con los siguientes datos:
Para hacer los clculos respectivos debemos trabajar con la siguiente tabla:
Factor de Correlacin de Pearson:
Dnde: Es la covarianza. Es la varianza de la variable X. Es la varianza de la variable Y.
Clculo de la varianza de X:
Pues como son datos que no estn agrupados, entonces la frecuencia fi = 1, para cada uno de los valores de X.Reemplazando:
Clculo de la varianza de Y:
De manera anloga al clculo de la varianza en X.
Pues como son datos que no estn agrupados, entonces la frecuencia fi = 1, para cada uno de los valores de Y.Reemplazando:
Clculo de Covarianza:
Finalmente ya podemos reemplazar estos resultados en la frmula de coeficiente relacin de Pearson:
Podemos hacer el siguiente anlisis en base al resultado obtenido: Como el coeficiente de correlacin de Pearson result ser un valor positivo, podemos decir que la relacin entre las variables X y Y es directa, es decir a mayor horas de trabajo (X) mayor nmero de unidades producidas (Y).
Como el r tiende a 1, podemos decir que es una relacin fuerte, es decir los puntos definidos por (X, Y) estn bien cercanas a la recta generada por la regresin lineal.
Grfico de dispersin de puntos:
Para la regresin lineal nosotros utilizaremos la ecuacin general de una recta:
Dnde:
Clculo de b:
Clculo de a:
Finalmente:
Obtenindose el siguiente grfico:
3. Desarrollo:
Para el siguiente ejercicio se trabajara con las variables:
X: Gastos semanales en publicidad.Y: Ventas Semanales.
Con los siguientes datos:
Para hacer los clculos respectivos debemos trabajar con la siguiente tabla:
Factor de Correlacin de Pearson:
Dnde: Es la covarianza. Es la varianza de la variable X. Es la varianza de la variable Y.
Clculo de la varianza de X:
Pues como son datos que no estn agrupados, entonces la frecuencia fi = 1, para cada uno de los valores de X.Reemplazando:
Clculo de la varianza de Y:
De manera anloga al clculo de la varianza en X.
Pues como son datos que no estn agrupados, entonces la frecuencia fi = 1, para cada uno de los valores de Y.
Reemplazando:
Clculo de Covarianza:
Finalmente ya podemos reemplazar estos resultados en la frmula de coeficiente relacin de Pearson:
Podemos hacer el siguiente anlisis en base al resultado obtenido: Como el coeficiente de correlacin de Pearson result ser un valor positivo, podemos decir que la relacin entre las variables X y Y es directa, es decir a mayores gastos semanales en publicidad (X) mayores ventas semanales (Y).
Como el r tiende a 1, podemos decir que es una relacin fuerte, es decir los puntos definidos por (X, Y) estn bien cercanas a la recta generada por la regresin lineal.
Grfico de dispersin de puntos:
Para la regresin lineal nosotros utilizaremos la ecuacin general de una recta:
Dnde:
Clculo de b:
Clculo de a:
Finalmente:
La pendiente b = 10.7868, significa la razn de cambio entre las ventas semanales y los gastos semanales por publicidad.
Obtenindose el siguiente grfico:
Con estos datos podemos hacer los pronsticos:
Para el valor de 50 dlares en gastos semanales de publicidad:
Para el valor de 60 dlares en gastos semanales de publicidad:
Los errores de aproximacin:
Para el valor de 61 dlares en gastos semanales de publicidad:
Para el valor de 62 dlares en gastos semanales de publicidad:
Para el valor de 63 dlares en gastos semanales de publicidad:
Top Related