Estadistica ii correlacion y regresion

23
ESTADISTICA II Lic. MARTINEZ SANCHEZ, EDGAR EJERCICIOS DE CORRELACION Y REGRESION TRABAJO DOMICILIARIO 1 .- Una compañía desea hacer predicciones del valor anual de sus ventas totales en cierto país a partir de la relación de éstas y la renta nacional. Para investigar la relación cuenta con los siguientes datos: X 189 190 208 227 239 252 257 274 293 308 316 Y 402 404 412 425 429 436 440 447 458 469 469 X representa la renta nacional en millones de euros e Y representa las ventas de la compañía en miles de euros en el periodo que va desde 1990 hasta 2000 (ambos inclusive). Calcular: 1. La recta de regresión de Y sobre X. 2. El coeficiente de correlación lineal e interpretarlo. 3. Si en 2001 la renta nacional del país fue de 325 millones de euros. ¿Cuál será la predicción para las ventas de la compañía en este año? 2. - La información estadística obtenida de una muestra de tamaño 12 sobre la relación existente entre la inversión realizada y el rendimiento obtenido en cientos de miles de euros para explotaciones agrícolas, se muestra en el siguiente cuadro: Inversión (X) 11 14 16 15 16 18 20 21 14 20 19 11 Rendimiento (Y) 2 3 5 6 5 3 7 10 6 10 5 6 Calcular: 1. La recta de regresión del rendimiento respecto de la inversión. 2. La previsión de inversión que se obtendrá con un rendimiento de 1 250 000 €.

Transcript of Estadistica ii correlacion y regresion

Page 1: Estadistica ii    correlacion y regresion

ESTADISTICA II Lic. MARTINEZ SANCHEZ, EDGAR

EJERCICIOS DE CORRELACION Y REGRESION

TRABAJO DOMICILIARIO

1.- Una compañía desea hacer predicciones del valor anual de sus ventas totales en cierto país a

partir de la relación de éstas y la renta nacional. Para investigar la relación cuenta con los

siguientes datos:

X 189 190 208 227 239 252 257 274 293 308 316

Y 402 404 412 425 429 436 440 447 458 469 469

X representa la renta nacional en millones de euros e Y representa las ventas de la

compañía en miles de euros en el periodo que va desde 1990 hasta 2000 (ambos inclusive).

Calcular:

1. La recta de regresión de Y sobre X.

2. El coeficiente de correlación lineal e interpretarlo.

3. Si en 2001 la renta nacional del país fue de 325 millones de euros. ¿Cuál será la

predicción para las ventas de la compañía en este año?

2.- La información estadística obtenida de una muestra de tamaño 12 sobre la relación existente

entre la inversión realizada y el rendimiento obtenido en cientos de miles de euros para

explotaciones agrícolas, se muestra en el siguiente cuadro:

Inversión (X) 11 14 16 15 16 18 20 21 14 20 19 11

Rendimiento (Y) 2 3 5 6 5 3 7 10 6 10 5 6

Calcular:

1. La recta de regresión del rendimiento respecto de la inversión.

2. La previsión de inversión que se obtendrá con un rendimiento de 1 250 000 €.

Page 2: Estadistica ii    correlacion y regresion

3. El número de horas dedicadas al estudio de una asignatura y la calificación obtenida en el

examen correspondiente, de ocho personas es:

Horas (X) 20 16 34 23 27 32 18 22

Calificación (Y) 6.5 6 8.5 7 9 9.5 7.5 8

Se pide:

1. Recta de regresión de Y sobre X.

2. Calificación estimada para una persona que hubiese estudiado 28 horas.

4. En la tabla siguiente se indica la edad (en años) y la conducta agresiva (medida en una escala

de cero a 10) de 10 niños.

Edad 6 6 6.7 7 7.4 7.9 8 8.2 8.5 8.9

Conducta agresiva 9 6 7 8 7 4 2 3 3 1

1. Obtener la recta de regresión de la conducta agresiva en función de la edad.

2. A partir de dicha recta, obtener el valor de la conducta agresiva que correspondería

a un niño de 7.2 años.

5. Los valores de dos variables X e Y se distribuyen según la tabla siguiente:

Y/X 100 50 25

14 1 1 0

18 2 3 0

22 0 1 2

Se pide:

1. Calcular la covarianza.

2. Obtener e interpretar el coeficiente de correlación lineal.

3. Ecuación de la recta de regresión de Y sobre X.

Page 3: Estadistica ii    correlacion y regresion

6. Las puntuaciones obtenidas por un grupo de alumnos en una batería de test que mide la

habilidad verbal (X) y el razonamiento abstracto (Y) son las siguientes:

Y/X 20 30 40 50

(25-35) 6 4 0 0

(35-45) 3 6 1 0

(45-55) 0 2 5 3

(55-65) 0 1 2 7

Se pide:

1. ¿Existe correlación entre ambas variables?

2. Según los datos de la tabla, si uno de estos alumnos obtiene una puntuación de 70

puntos en razonamiento abstracto, ¿en cuánto se estimará su habilidad verbal?

7. Se sabe que entre el consumo de papel y el número de litros de agua por metro cuadrado

que se recogen en una ciudad no existe relación.

1. ¿Cuál es el valor de la covarianza de estas variables?

2. ¿Cuánto vale el coeficiente de correlación lineal?

3. ¿Qué ecuaciones tienen las dos rectas de regresión y cuál es su posición en el

plano?

8. En una empresa de transportes trabajan cuatro conductores. Los años de antigüedad de

permisos de conducir y el número de infracciones cometidas en el último año por cada uno de ellos

son los siguientes:

Años (X) 3 4 5 6

Infracciones (Y) 4 3 2 1

Calcular el coeficiente de correlación lineal e interpretarlo.

9. Una persona rellena semanalmente una quiniela y un boleto de lotería primitiva anotando el

número de aciertos que tiene. Durante las cuatro semanas del mes de febrero, los aciertos fueron:

Quiniela (X) 6 8 6 8

Primitiva (Y) 1 2 2 1

Obtener el coeficiente de correlación lineal e interpretarlo. ¿Ofrecerían confianza las

previsiones hechas con las rectas de regresión?

Page 4: Estadistica ii    correlacion y regresion

ESTADISTICA II Lic. MARTÍNEZ SÁNCHEZ, EDGAR

EJERCICIOS DE CORRELACION Y REGRESION

TRABAJO EN AULA

1. Cinco niños de 2, 3, 5, 7 y 8 años de edad pesan, respectivamente, 14, 20, 32, 42 y 44

kilos.

1. Hallar la ecuación de la recta de regresión de la edad sobre el peso.

2. ¿Cuál sería el peso aproximado de un niño de seis años?

2. Un centro comercial sabe en función de la distancia, en kilómetros, a la que se sitúe de un

núcleo de población, acuden los clientes, en cientos, que figuran en la tabla:

Nº de clientes (X) 8 7 6 4 2 1

Distancia (Y) 15 19 25 23 34 40

1. Calcular el coeficiente de correlación lineal .

2. Si el centro comercial se sitúa a 2 km, ¿cuántos clientes puede esperar?

3. Si desea recibir a 500 clientes, ¿a qué distancia del núcleo de población debe

situarse?

3. Las notas obtenidas por cinco alumnos en Matemáticas y Química son:

Matemáticas 6 4 8 5 3. 5

Química 6. 5 4. 5 7 5 4

Determinar las rectas de regresión y calcular la nota esperada en Química para un alumno

que tiene 7.5 en Matemáticas.

4. Un conjunto de datos bidimensionales (X, Y) tiene coeficiente de correlación r = −0.9,

siendo las medias de las distribuciones marginales = 1, = 2. Se sabe que una de las cuatro

ecuaciones siguientes corresponde a larecta de regresión de Y sobre X:

y = -x + 2 3x - y = 1 2x + y = 4 y = x + 1

Seleccionar razonadamente esta recta.

5. Las estaturas y pesos de 10 jugadores de baloncesto de un equipo son:

Estatura (X) 186 189 190 192 193 193 198 201 203 205

Pesos (Y) 85 85 86 90 87 91 93 103 100 101

Page 5: Estadistica ii    correlacion y regresion

Calcular:

1. La recta de regresión de Y sobre X.

2. El coeficiente de correlación.

3. El peso estimado de un jugador que mide 208 cm.

6. A partir de los siguientes datos referentes a horas trabajadas en un taller (X), y a unidades

producidas (Y), determinar la recta de regresión de Y sobre X, el coeficiente de correlación

lineal e interpretarlo.

Horas (X) 80 79 83 84 78 60 82 85 79 84 80 62

Producción

(Y)

300 302 315 330 300 250 300 340 315 330 310 240

7. Se ha solicitado a un grupo de 50 individuos información sobre el número de horas que

dedican diariamente a dormir y ver la televisión. La clasificación de las respuestas ha permitido

elaborar la siente tabla:

Nº de horas dormidas (X) 6 7 8 9 10

Nº de horas de televisión (Y) 4 3 3 2 1

Frecuencias absolutas (f i) 3 16 20 10 1

Se pide:

1. Calcular el coeficiente de correlación.

2. Determinar la ecuación de la recta de regresión de Y sobre X.

3. Si una persona duerme ocho horas y media, ¿cuánto cabe esperar que vea la

televisión?

8. La tabla siguiente nos da las notas del test de aptitud (X) dadas a seis dependientes a prueba

y ventas del primer mes de prueba (Y) en cientos de euros.

X 25 42 33 54 29 36

Y 42 72 50 90 45 48

1. Hallar el coeficiente de correlación e interpretar el resultado obtenido.

2. Calcular la recta de regresión de Y sobre X. Predecir las ventas de un vendedor

que obtenga 47 en el test.

Page 6: Estadistica ii    correlacion y regresion

SOLUCIONARIO 1

Cinco niños de 2, 3, 5, 7 y 8 años de edad pesan, respectivamente, 14, 20, 32, 42 y 44

kilos.

1 Hallar la ecuación de la recta de regresión de la edad sobre el peso.

2 ¿Cuál sería el peso aproximado de un niño de seis años?

yi xi ·yi xi2 yi

2

2 14 4 196 28

3 20 9 400 60

5 32 25 1 024 160

7 42 49 1 764 294

8 44 64 1 936 352

25 152 151 5 320 894

2.- Un centro comercial sabe en función de la distancia, en kilómetros, a la que se sitúe de un

núcleo de población, acuden los clientes, en cientos, que figuran en la tabla:

Nº de clientes (X) 8 7 6 4 2 1

Distancia (Y) 15 19 25 23 34 40

1 Calcular el coeficiente de correlación lineal.

2 Si el centro comercial se sitúa a 2 km, ¿cuántos clientes puede esperar?

Page 7: Estadistica ii    correlacion y regresion

3 Si desea recibir a 500 clientes, ¿a qué distancia del núcleo de población debe

situarse?

xi yi xi ·yi xi2 yi

2

8 15 120 64 225

7 19 133 49 361

6 25 150 36 625

4 23 92 16 529

2 34 68 4 1 156

1 40 40 1 1 600

28 156 603 170 4 496

Correlación negativa muy fuerte .

Page 8: Estadistica ii    correlacion y regresion

3.-Las notas obtenidas por cinco alumnos en Matemáticas y Química son:

Matemáticas 6 4 8 5 3. 5

Química 6. 5 4. 5 7 5 4

Determinar las rectas de regresión y calcular la nota esperada en Química para un alumno

que tiene 7.5 en Matemáticas.

xi yi xi ·yi xi2 yi

2

6 6. 5 36 42. 25 39

4 4. 5 16 20. 25 18

8 7 64 49 56

5 5 25 25 25

3. 5 4 12. 25 16 14

26. 5 27 153. 25 152. 5 152

4.-Un conjunto de datos bidimensionales (X, Y) tiene coeficiente de correlación r = -0.9,

siendo las medias de las distribuciones marginales = 1, = 2. Se sabe que una de las

cuatro ecuaciones siguientes corresponde a la recta de regresión de Y sobre X:

y = -x + 2 3x - y = 1 2x + y = 4 y = x + 1

Seleccionar razonadamente esta recta.

Page 9: Estadistica ii    correlacion y regresion

Como el coeficiente de correlación lineal es negativo , la pendiente de la recta también

será negativa, por tanto descartamos la 2ª y 4ª.

Un punto de la recta ha de ser ( , ), es decir, (1, 2).

2 ≠ - 1 + 2

2 . 1 + 2 = 4

La recta pedida es: 2x + y = 4.

5.- Las estaturas y pesos de 10 jugadores de baloncesto de un equipo son:

Estatura (X) 186 189 190 192 193 193 198 201 203 205

Pesos (Y) 85 85 86 90 87 91 93 103 100 101

Calcular:

1 La recta de regresión de Y sobre X.

2 El coeficiente de correlación.

3 El peso estimado de un jugador que mide 208 cm.

x i y i x i2 y i

2 x i ·y i

186 85 34 596 7 225 15 810

189 85 35 721 7 225 16 065

190 86 36 100 7 396 16 340

192 90 36 864 8 100 17 280

193 87 37 249 7 569 16 791

193 91 37 249 8 281 17563

198 93 39 204 8 649 18 414

201 103 40 401 10 609 20 703

203 100 41 209 10 000 20 300

205 101 42 025 10 201 20 705

1 950 921 380 618 85 255 179 971

Page 10: Estadistica ii    correlacion y regresion

Correlación positiva muy fuerte.

6.- A partir de los siguientes datos referentes a horas trabajadas en un taller (X), y a unidades

producidas (Y), determinar la recta de regresión de Y sobre X, el coeficiente de correlación

lineal e interpretarlo.

Horas (X) 80 79 83 84 78 60 82 85 79 84 80 62

Producción

(Y)

300 302 315 330 300 250 300 340 315 330 310 240

xi yi xi ·yi xi2 yi

2

80 300 6 400 90 000 24 000

79 302 6 241 91 204 23 858

83 315 6 889 99 225 26 145

84 330 7 056 108 900 27 720

78 300 6 084 90 000 23 400

60 250 3 600 62 500 15 000

82 300 6 724 90 000 24 600

85 340 7 225 115 600 28 900

79 315 6 241 99 225 24 885

84 330 7 056 108 900 27 720

80 310 6 400 96 100 24 800

62 240 3 844 57 600 14 880

936 3 632 73 760 1 109 254 285 908

Page 11: Estadistica ii    correlacion y regresion

Correlación positiva muy fuerte

7.- Se ha solicitado a un grupo de 50 individuos información sobre el número de horas que

dedican diariamente a dormir y ver la televisión. La clasificación de las respuestas ha permitido

elaborar la siente tabla:

Nº de horas dormidas (X) 6 7 8 9 10

Nº de horas de televisión (Y) 4 3 3 2 1

Frecuencias absolutas (f i) 3 16 20 10 1

Se pide:

1 Calcular el coeficiente de correlación.

2 Determinar la ecuación de la recta de regresión de Y sobre X.

3 Si una persona duerme ocho horas y media, ¿cuánto cabe esperar que vea la

televisión?

x i y i f i x i · f i x i2 · f i y i · f i y i

2 · f i x i · y i · f i

6 4 3 18 108 12 48 72

7 3 16 112 784 48 144 336

8 3 20 160 1280 60 180 480

9 2 10 90 810 20 40 180

10 1 1 10 100 1 1 10

50 390 3082 141 413 1078

Page 12: Estadistica ii    correlacion y regresion

Es una correlación negativa y fuerte .

8.- La tabla siguiente nos da las notas del test de aptitud (X) dadas a seis dependientes a prueba

y ventas del primer mes de prueba (Y) en cientos de euros.

X 25 42 33 54 29 36

Y 42 72 50 90 45 48

1 Hallar el coeficiente de correlación e interpretar el resultado obtenido.

2 Calcular la recta de regresión de Y sobre X. Predecir las ventas de un vendedor

que obtenga 47 en el test.

xi yi xi ·yi xi2 yi

2

25 42 625 1 764 1 050

42 72 1 764 5 184 3 024

33 50 1 089 2 500 1 650

54 90 2 916 8 100 4 860

29 45 841 2 025 1 305

36 48 1 296 2 304 1 728

209 347 8 531 21 877 13 617

Page 13: Estadistica ii    correlacion y regresion
Page 14: Estadistica ii    correlacion y regresion

SOLUCIONARIO 2

1.- Una compañía desea hacer predicciones del valor anual de sus ventas totales en cierto país a

partir de la relación de éstas y la renta nacional. Para investigar la relación cuenta con los

siguientes datos:

X 189 190 208 227 239 252 257 274 293 308 316

Y 402 404 412 425 429 436 440 447 458 469 469

X representa la renta nacional en millones de euros e Y representa las ventas de la

compañía en miles de euros en el periodo que va desde 1990 hasta 2000 (ambos inclusive).

Calcular:

1 La recta de regresión de Y sobre X.

2 El coeficiente de correlación lineal e interpretarlo.

3 Si en 2001 la renta nacional del país fue de 325 millones de euros. ¿Cuál será la

predicción para las ventas de la compañía en este año?

xi yi xi ·yi xi2 yi

2

189 402 35 721 161 604 75 978

190 404 36 100 163 216 76 760

208 412 43 264 169 744 85 696

227 425 51 529 180 625 96 475

239 429 57 121 184 041 102 531

252 436 63 504 190 096 109 872

257 440 66 049 193 600 113 080

274 447 75 076 199 809 122 478

293 458 85 849 209 764 134 194

308 469 94 864 219 961 144 452

316 469 99 856 219 961 148 204

2 753 4 791 708 933 2 092 421 1 209 720

Page 15: Estadistica ii    correlacion y regresion

2. La información estadística obtenida de una muestra de tamaño 12 sobre la relación existente

entre la inversión realizada y el rendimiento obtenido en cientos de miles de euros para

explotaciones agrícolas, se muestra en el siguiente cuadro:

Inversión (X) 11 14 16 15 16 18 20 21 14 20 19 11

Rendimiento (Y) 2 3 5 6 5 3 7 10 6 10 5 6

Calcular:

1 La recta de regresión del rendimiento respecto de la inversión.

2 La previsión de inversión que se obtendrá con un rendimiento de 1 250 000 €.

xi yi xi ·yi xi2 yi

2

11 2 121 4 22

14 3 196 9 42

16 5 256 25 80

15 6 225 36 90

16 5 256 25 80

18 3 324 9 54

20 7 400 49 140

21 10 441 100 210

14 6 196 36 84

20 10 400 100 200

19 5 361 25 95

11 6 121 36 66

195 68 3 297 454 1 163

Page 16: Estadistica ii    correlacion y regresion

3.- El número de horas dedicadas al estudio de una asignatura y la calificación obtenida en el

examen correspondiente, de ocho personas es:

Horas (X) 20 16 34 23 27 32 18 22

Calificación (Y) 6.5 6 8.5 7 9 9.5 7.5 8

Se pide:

1 Recta de regresión de Y sobre X.

2 Calificación estimada para una persona que hubiese estudiado 28 horas.

xi yi xi ·yi xi2 yi

2

16 6 256 36 96

18 7.5 324 56.25 135

20 6.5 400 42.25 130

22 8 484 64 176

23 7 529 49 161

27 9 729 81 243

32 9.5 1 024 90.25 304

34 8.5 1156 72.25 289

192 62 4 902 491 1 534

Page 17: Estadistica ii    correlacion y regresion

4. En la tabla siguiente se indica la edad (en años) y la conducta agresiva (medida en una escala

de cero a 10) de 10 niños.

Edad 6 6 6.7 7 7.4 7.9 8 8.2 8.5 8.9

Conducta agresiva 9 6 7 8 7 4 2 3 3 1

1 Obtener la recta de regresión de la conducta agresiva en función de la edad.

2 A partir de dicha recta, obtener el valor de la conducta agresiva que correspondería

a un niño de 7.2 años.

xi yi xi ·yi xi2 yi

2

6 9 36 81 54

6.4 6 40.96 36 38.4

6.7 7 44.89 49 46.9

7 8 49 64 56

7.4 7 54.76 49 51.8

7.9 4 62.41 16 31.6

8 2 64 4 16

8.2 3 67.24 9 24.6

8.5 2 72.25 4 17

8.9 1 79.21 1 8.9

75 49 570.72 313 345.2

Page 18: Estadistica ii    correlacion y regresion

5.- Los valores de dos variables X e Y se distribuyen según la tabla siguiente:

Y/X 100 50 25

14 1 1 0

18 2 3 0

22 0 1 2

Se pide:

1 Calcular la covarianza.

2 Obtener e interpretar el coeficiente de correlación lineal .

3 Ecuación de la recta de regresión de Y sobre X.

Convertimos la tabla de doble entrada en una tabla simple.

xi yi fi xi · fi xi2 · fi yi · fi yi

2 · fi xi · yi · fi

100 14 1 100 10 000 14 196 1 400

100 18 2 200 20 000 36 648 3 600

50 14 1 50 2 500 14 196 700

50 18 3 150 7 500 54 972 2 700

50 22 1 50 2 500 22 484 1 100

25 22 2 50 1 250 44 968 1 100

10 600 43 750 184 3 464 10 600

Page 19: Estadistica ii    correlacion y regresion

Es una correlación negativa débil .

6.- Las puntuaciones obtenidas por un grupo de alumnos en una batería de test que mide la

habilidad verbal (X) y el razonamiento abstracto (Y) son las siguientes:

Y/X 20 30 40 50

(25-35) 6 4 0 0

(35-45) 3 6 1 0

(45-55) 0 2 5 3

(55-65) 0 1 2 7

Se pide:

1 ¿Existe correlación entre ambas variables?

2 Según los datos de la tabla, si uno de estos alumnos obtiene una puntuación de 70

puntos en razonamiento abstracto, ¿en cuánto se estimará su habilidad verbal?

Page 20: Estadistica ii    correlacion y regresion

Convertimos la tabla de doble entrada en tabla simple.

xi yi fi xi · fi xi2 · fi yi · fi yi

2 · fi xi · yi · fi

20 30 6 120 2 400 180 5 400 3 600

20 40 3 60 1 200 120 4 800 2 400

30 30 4 120 3 600 120 3 600 3 600

30 40 6 180 5 400 240 9 600 7 200

30 50 2 60 1 800 100 5 000 3 000

30 60 1 30 900 60 3 600 1 800

40 40 1 40 1 600 40 1 600 1 600

40 50 5 200 8 000 250 12 500 10 000

40 60 2 80 3 200 120 7 200 4 800

50 50 3 150 7 500 150 7 500 7 500

50 60 7 350 17 500 420 25 200 21 000

40 1 390 53 100 1 080 86 000 66 500

Page 21: Estadistica ii    correlacion y regresion

7.-Se sabe que entre el consumo de papel y el número de litros de agua por metro cuadrado

que se recogen en una ciudad no existe relación.

1 ¿Cuál es el valor de la covarianza de estas variables?

= 0

2 ¿Cuánto vale el coeficiente de correlación lineal?

r = 0

3 ¿Qué ecuaciones tienen las dos rectas de regresión y cuál es su posición en el

plano?

= k1 , = k2 k1, k2 .

Las rectas son paralelas a los ejes y perpendiculares entre sí.

8.- En una empresa de transportes trabajan cuatro conductores. Los años de antigüedad de

permisos de conducir y el número de infracciones cometidas en el último año por cada uno de ellos

son los siguientes:

Años (X) 3 4 5 6

Infracciones (Y) 4 3 2 1

Calcular el coeficiente de correlación lineal e interpretarlo.

xi yi xi ·yi xi2 yi

2

3 4 12 9 16

4 3 12 16 9

5 2 10 25 4

6 1 6 36 1

18 10 40 86 30

Page 22: Estadistica ii    correlacion y regresion

La correlación es perfecta e inversa .

9.-Una persona rellena semanalmente una quiniela y un boleto de lotería primitiva anotando el

número de aciertos que tiene. Durante las cuatro semanas del mes de febrero, los aciertos fueron:

Quiniela (X) 6 8 6 8

Primitiva (Y) 1 2 2 1

Obtener el coeficiente de correlación lineal e interpretarlo. ¿Ofrecerían confianza

las previsiones hechas con las rectas de regresión?

xi yi xi ·yi xi2 yi

2

6 1 6 36 1

8 2 16 64 4

6 2 12 36 4

8 1 8 64 1

28 6 42 200 10

Page 23: Estadistica ii    correlacion y regresion