Regresion Lineal y Multiple

15
“AÑO DEL CENTENARIO DE MACHU PICCHU PARA EL MUNDO” ESCUELA ACADÉMICO PROFESIONAL DE INGENIERÍA QUÍMICA ASIGNATURA: Ingeniería de la Producción TEMA: Regresión Lineal y Múltiple DOCENTE: Ing. José Soto La Rosa. CICLO: X ALUMNOS: Espíritu Vergara, Daniel Freddy. Jamanca Antonio, Edgar Martin Macarlupú Chávez, Anthony Junior. Silvestre Quispe, Christian Jesús. Urbano Ortiz Pedro Alexander Vílchez Carbajal Maribel Giovanna HUACHO - PERÚ 2011

Transcript of Regresion Lineal y Multiple

Page 1: Regresion Lineal y Multiple

“AÑO DEL CENTENARIO DE MACHU PICCHU PARA EL MUNDO”

ESCUELA ACADÉMICO PROFESIONAL DE INGENIERÍA QUÍMICA

ASIGNATURA: Ingeniería de la Producción

TEMA: Regresión Lineal y Múltiple

DOCENTE: Ing. José Soto La Rosa.

CICLO: X

ALUMNOS: Espíritu Vergara, Daniel Freddy.

Jamanca Antonio, Edgar Martin

Macarlupú Chávez, Anthony Junior.

Silvestre Quispe, Christian Jesús.

Urbano Ortiz Pedro Alexander

Vílchez Carbajal Maribel Giovanna

HUACHO - PERÚ

2011

Page 2: Regresion Lineal y Multiple

Facultad de Ingeniería Química, Metalurgia y Ambiental

Ingeniería de la Producción Página 2

PRACTICA DIRIGIDA Nª 02

Problema Nª 01:

Una empresa química produce sosa caustica, lo que se quiere determinar la demanda para los próximos

años, sabiendo los datos reales que se encuentran considerados en el presente cuadro histórico.

Año x Demanda de Soda Caustica miles de litros (y)

2001 1 6.5

2002 2 8.1

2003 3 9.8

2004 4 15.1

2005 5 19.2

2006 6 23.5

2007 7 28.7

2008 8 33.5

2009 9 34.9

2010 10 43.7

Hallar:

A. Parámetros de regresión a y b.

B. Coeficiente de correlación.

C. Desviación estándar.

D. Limites de control y demanda futura.

Solución:

A. Parámetros de regresión a y b.

El modelo a utilizar es de la correlación Lineal, utilizamos el modelo:

𝑦 = 𝑎 + 𝑏𝑥

Entonces hallamos las siguientes variables en el siguiente cuadro:

Año x y xy x2 y2

2001 1 6,5 6,5 1 42,25

2002 2 8,1 16,2 4 65,61

2003 3 9,8 29,4 9 96,04

2004 4 15,1 60,4 16 228,01

2005 5 19,2 96 25 368,64

2006 6 23,5 141 36 552,25

2007 7 28,7 200,9 49 823,69

2008 8 33,5 268 64 1122,25

2009 9 34,9 314,1 81 1218,01

2010 10 43,5 435 100 1892,25

∑ 𝒊 55 222,8 1567,5 385 6409

Page 3: Regresion Lineal y Multiple

Facultad de Ingeniería Química, Metalurgia y Ambiental

Ingeniería de la Producción Página 3

Como los parámetros a y b están dadas por las fórmulas:

∑ 𝑦 = 𝑎 ∗ 𝑛 + 𝑏 ∗ ∑ 𝑥 … 𝐸𝑐𝑢𝑎𝑐𝑖𝑜𝑛 𝑁º01

∑ 𝑥𝑦 = 𝑎 ∗ ∑ 𝑥 + 𝑏 ∗ ∑ 𝑥2 … 𝐸𝑐𝑢𝑎𝑐𝑖𝑜𝑛 𝑁º02

Donde:

𝑏 =10 ∗ (1567.5) − 55 ∗ (222.8)

10 ∗ 385 − (55)2= 4.146666667

𝑎 =222.8 − 4.15 ∗ 55

10= −0.52667

El modelo obtenido a través de la correlación es:

𝑦 = −0.52667 + 4.146666667 ∗ 𝑥

B. Coeficiente de correlación:

Esta dada por la siguiente formula:

𝑟 = 𝑏 ∗ √𝑛 ∗ ∑ 𝑥2 − (∑ 𝑥)2

𝑛 ∗ ∑ 𝑦2 − (∑ 𝑦)2

Donde:

𝑟 = 4.146666667 ∗ √10 ∗ 385 − 552

10 ∗ 6409 − 222.82= 0.9908

𝑟2 = 0.9817

Interpretación:

Significa que el 99% de los datos estimados se encuentran alrededor o cerca de los datos reales.

El 98% significa que de los datos estimados coinciden con los datos reales por tanto es una

correlación alta positiva y entonces el pronostico es confiable.

C. Desviación estándar:

Esta dada por la siguiente formula.

𝐷𝑦 = √∑(𝑦 − �̅�)2

𝑛 − 1

Page 4: Regresion Lineal y Multiple

Facultad de Ingeniería Química, Metalurgia y Ambiental

Ingeniería de la Producción Página 4

Año 𝒙 𝒚 �̅� 𝒚 − �̅� (𝒚 − �̅�)𝟐

2001 1 6,5 3,62 2,88 8,2944

2002 2 8,1 7,766666667 0,333333333 0,111111

2003 3 9,8 11,91333333 -2,113333333 4,466178

2004 4 15,1 16,06 -0,96 0,9216

2005 5 19,2 20,20666667 -1,006666667 1,013378

2006 6 23,5 24,35333333 -0,853333333 0,728178

2007 7 28,7 28,5 0,2 0,04

2008 8 33,5 32,64666667 0,853333333 0,728178

2009 9 34,9 36,79333333 -1,893333333 3,584711

2010 10 43,5 40,94 2,56 6,5536

∑ 𝒊 55 222,8 222,8 -2,84217E-14 26,44133

Calculamos:

𝐷𝑦 = √26.44133

9= 1.714037901

D. Limites de control:

Esta compuesta por:

Limites de control superior

Esta dada por la siguiente ecuación:

𝑦 = −0.52667 + 4.146666667 ∗ 𝑥 + 1.96 ∗ 1.71

Así podemos visualizarla en la siguiente tabla:

𝒙 𝒚

1 6,979514286

2 11,12618095

3 15,27284762

4 19,41951429

5 23,56618095

6 27,71284762

7 31,85951429

8 36,00618095

9 40,15284762

10 44,29951429

Page 5: Regresion Lineal y Multiple

Facultad de Ingeniería Química, Metalurgia y Ambiental

Ingeniería de la Producción Página 5

Limites de control inferior

Esta dada por la siguiente ecuación:

𝑦 = −0.52667 + 4.146666667 ∗ 𝑥 − 1.96 ∗ 1.71

Así podemos visualizarla en la siguiente tabla:

𝒙 𝒚

1 0,260485714

2 4,407152381

3 8,553819047

4 12,70048571

5 16,84715238

6 20,99381905

7 25,14048571

8 29,28715238

9 33,43381905

10 37,58048571

Aquí se puede visualizar con la grafica:

0.5

5.5

10.5

15.5

20.5

25.5

30.5

35.5

40.5

0 2 4 6 8 10

mile

s d

e li

tro

s (Y

)

X

MODELOPRONOSTICO

LCS

LCI

Y ESTIMADO

Page 6: Regresion Lineal y Multiple

Facultad de Ingeniería Química, Metalurgia y Ambiental

Ingeniería de la Producción Página 6

Problema Nª 02:

Una empresa química produce sosa caustica, lo que se quiere determinar la demanda para los próximos

años, sabiendo los datos reales que se encuentran considerados en el presente cuadro histórico.

Año x Demanda de Soda Caustica miles de litros (y)

2003 1 9.8

2004 2 15.1

2005 3 19.2

2006 4 23.5

2007 5 28.7

2008 6 33.5

2009 7 34.9

2010 8 43.7

Hallar:

E. Parámetros de regresión a y b.

F. Coeficiente de correlación.

G. Desviación estándar.

H. Limites de control y demanda futura.

Solución:

A. Parámetros de regresión a y b.

El modelo a utilizar es de la correlación no Lineal, utilizamos el modelo:

𝑦 = 𝑎 + 𝑏𝑥 + 𝑐𝑥2

Entonces hallamos las siguientes variables en el siguiente cuadro:

𝑵 𝒙 𝒚 𝒙𝒚 𝒙𝟐 𝒚𝟐 𝒙𝟑 𝒙𝟒 𝒙𝟐𝒚

1 1 9,8 9,8 1 96,04 1 1 9,8

2 2 15,1 30,2 4 228,01 8 16 60,4

3 3 19,2 57,6 9 368,64 27 81 172,8

4 4 23,5 94 16 552,25 64 256 376

5 5 28,7 143,5 25 823,69 125 625 717,5

6 6 33,5 201 36 1122,25 216 1296 1206

7 7 34,9 244,3 49 1218,01 343 2401 1710,1

8 8 43,5 348 64 1892,25 512 4096 2784

∑ 𝒊 36 208,2 1128,4 204 6301,14 1296 8772 7036,6

Como los parámetros a ,b y c están dadas por las fórmulas:

∑ 𝑦 = 𝑎 ∗ 𝑛 + 𝑏 ∗ ∑ 𝑥 + 𝑐 ∗ ∑ 𝑥2

∑ 𝑥𝑦 = 𝑎 ∗ ∑ 𝑥 + 𝑏 ∗ ∑ 𝑥2 + 𝑐 ∗ ∑ 𝑥3

Page 7: Regresion Lineal y Multiple

Facultad de Ingeniería Química, Metalurgia y Ambiental

Ingeniería de la Producción Página 7

∑ 𝑥2𝑦 = 𝑎 ∗ ∑ 𝑥2 + 𝑏 ∗ ∑ 𝑥3 + 𝑐 ∗ ∑ 𝑥4

Esto se resuelve por matrices como:

𝑎 =

|

∑ 𝑦 ∑ 𝑥 ∑ 𝑥2

∑ 𝑥𝑦 ∑ 𝑥2 ∑ 𝑥3

∑ 𝑥2𝑦 ∑ 𝑥3 ∑ 𝑥4

|

|𝑛 ∑ 𝑥 ∑ 𝑥2

∑ 𝑥 ∑ 𝑥2 ∑ 𝑥3

∑ 𝑥2 ∑ 𝑥3 ∑ 𝑥4

| = 𝑇

𝑏 =

|

𝑛 ∑ 𝑦 ∑ 𝑥2

∑ 𝑥 ∑ 𝑥𝑦 ∑ 𝑥3

∑ 𝑥2 ∑ 𝑥2𝑦 ∑ 𝑥4

|

𝑇

𝑐 =

|

𝑛 ∑ 𝑥 ∑ 𝑥2

∑ 𝑥 ∑ 𝑥2 ∑ 𝑥𝑦

∑ 𝑥2 ∑ 𝑥3 ∑ 𝑥2𝑦

|

𝑇

Entonces reemplazando y hallando la determínate se obtiene:

𝑎 =

|208.2 36 204

1128.4 204 12967036.6 1296 8772

|

|8 36 204

36 204 1296204 1296 8772

|

=331027.2

56448= 5.8643

𝑏 =

|8 208.2 204

36 1128.4 1296204 7036.6 8772

|

56448=

245280

56448= 4.3452

𝑐 =

|8 36 208.2

36 204 1128.4204 1296 7036.6

|

56448=

1344

56448= 0.0238

El modelo obtenido a través de la correlación es:

𝑦 = 5.8643 + 4.3452 ∗ 𝑥 + 0.0238 ∗ 𝑥2

B. Coeficiente de correlación:

Esta dada por la siguiente formula:

�̅� =∑ 𝑦

𝑛

𝑟 = √𝑎 ∗ ∑ 𝑦 + ∑ 𝑥𝑦 + 𝑐 ∗ ∑ 𝑥2𝑦 − 𝑛 ∗ �̅�2

∑ 𝑦 − 𝑛 ∗ �̅�2

Page 8: Regresion Lineal y Multiple

Facultad de Ingeniería Química, Metalurgia y Ambiental

Ingeniería de la Producción Página 8

Donde:

�̅�2 = (208.2

8)

2

= 677.3

𝑟 = √5.86 ∗ 208.2 + 4.55 ∗ 1128.4 + 0.024 ∗ 7036.6 − 8 ∗ 677.3

6301.1 − 8 ∗ 677.3= 0.99

𝑟2 = 0.98

Interpretación:

Significa que el 99% de los datos estimados se encuentran alrededor o cerca de los datos reales.

El 98% significa que de los datos estimados coinciden con los datos reales por tanto es una

correlación alta positiva y entonces el pronostico es confiable.

C. Desviación estándar:

Esta dada por la siguiente formula.

𝐷𝑦 = √∑(𝑦 − �̅�)2

𝑛 − 1

Año 𝒙 𝒚 �̅� (𝒚 − �̅�) (𝒚 − �̅�)𝟐

2003 1 9,8 10,23 -0,43 0,19

2004 2 15,1 14,65 0,45 0,20

2005 3 19,2 19,11 0,09 0,01

2006 4 23,5 23,63 -0,13 0,02

2007 5 28,7 28,19 0,51 0,26

2008 6 33,5 32,79 0,71 0,50

2009 7 34,9 37,45 -2,55 6,49

2010 8 43,5 42,15 1,35 1,82

∑ 𝒊 36 208,2 208,2 0,00 9,49

Calculamos:

𝐷𝑦 = √9.49

8= 1.16

D. Limites de control:

Esta compuesta por:

Limites de control superior

Esta dada por la siguiente ecuación:

𝑦 = 5.8643 + 4.3452 ∗ 𝑥 + 0.0238 ∗ 𝑥2 + 1.96 ∗ 1.16

Page 9: Regresion Lineal y Multiple

Facultad de Ingeniería Química, Metalurgia y Ambiental

Ingeniería de la Producción Página 9

Así podemos visualizarla en la siguiente tabla:

x LCS

1 12,5069

2 16,9235

3 21,3877

4 25,8995

5 30,4589

6 35,0659

7 39,7205

8 44,4227

Limites de control inferior

Esta dada por la siguiente ecuación:

𝑦 = 5.8643 + 4.3452 ∗ 𝑥 + 0.0238 ∗ 𝑥2 − 1.96 ∗ 1.16

Así podemos visualizarla en la siguiente tabla:

x LCI

1 7,9597

2 12,3763

3 16,8405

4 21,3523

5 25,9117

6 30,5187

7 35,1733

8 39,8755

Page 10: Regresion Lineal y Multiple

Facultad de Ingeniería Química, Metalurgia y Ambiental

Ingeniería de la Producción Página 10

Aquí se puede visualizar con la grafica:

8

18

28

38

48

58

1 2 3 4 5 6 7 8

Y

X

Modelo Real

Y ESTIMADO

LCS

LCI

Page 11: Regresion Lineal y Multiple

Facultad de Ingeniería Química, Metalurgia y Ambiental

Ingeniería de la Producción Página 11

Problema Nª 03:

Una empresa química produce sosa caustica, lo que se quiere determinar la demanda para los próximos

años, sabiendo los datos reales que se encuentran considerados en el presente cuadro histórico.

Año x Demanda de Soda Caustica miles de litros (y)

2003 1 9.8

2004 2 15.1

2005 3 19.2

2006 4 23.5

2007 5 28.7

2008 6 33.5

2009 7 34.9

2010 8 43.7

Hallar:

I. Parámetros de regresión a y b.

J. Coeficiente de correlación.

K. Desviación estándar.

L. Limites de control y demanda futura.

Solución:

E. Parámetros de regresión a y b.

El modelo a utilizar es de la correlación no Lineal, utilizamos el modelo:

𝑦 = 𝑎 ∗ 𝑏𝑥

Propiedad de logaritmo:

𝑙𝑛 𝑦 = 𝑙𝑛 𝑎 + 𝑙𝑛 𝑏 ∗ 𝑥

𝑦′ = 𝑎′ + 𝑏′ ∗ 𝑥′

Entonces hallamos las siguientes variables en el siguiente cuadro:

N 𝒙 𝒚 𝑳𝒐𝒈𝑿 𝑳𝒐𝒈𝒀 𝑳𝒐𝒈𝑿𝑳𝒐𝒈𝒀 𝑳𝒐𝒈𝑿𝟐 𝑳𝒐𝒈𝒀𝟐 𝑿𝑳𝒐𝒈𝒀 𝑿𝟐

1 1 9,8 1 0,9912 0,9912 1 0,9825 0,9912 1

2 2 15,1 2 1,1790 2,3580 4 1,3900 2,3580 4

3 3 19,2 3 1,2833 3,8499 9 1,6469 3,8499 9

4 4 23,5 4 1,3711 5,4843 16 1,8798 5,4843 16

5 5 28,7 5 1,4579 7,2894 25 2,1254 7,2894 25

6 6 33,5 6 1,5250 9,1503 36 2,3258 9,1503 36

7 7 34,9 7 1,5428 10,7998 49 2,3803 10,7998 49

8 8 43,5 8 1,6385 13,1079 64 2,6846 13,1079 64

∑ 𝒊 36 208,2 36 10,989 53,031 204 15,415 53,031 204

Page 12: Regresion Lineal y Multiple

Facultad de Ingeniería Química, Metalurgia y Ambiental

Ingeniería de la Producción Página 12

Como los parámetros a y b están dadas por las fórmulas:

∑ 𝑙𝑜𝑔 𝑦 = 𝑙𝑜𝑔 𝑎 ∗ 𝑛 + 𝑙𝑜𝑔 𝑏 ∗ ∑ 𝑥

∑ 𝑥 ∗ 𝑙𝑜𝑔 𝑦 = 𝑙𝑜𝑔 𝑎 ∗ ∑ 𝑥 + 𝑙𝑜𝑔 𝑏 ∗ ∑ 𝑥2

Esto se resuelve por matrices como:

𝑎′ =

|∑ 𝑙𝑜𝑔 𝑦 ∑ 𝑥

∑ 𝑥 ∗ 𝑙𝑜𝑔 𝑦 ∑ 𝑥2|

|𝑛 ∑ 𝑥

∑ 𝑥 ∑ 𝑥2| = 𝑇′

𝑏′ =

|𝑛 ∑ 𝑙𝑜𝑔 𝑦

∑ 𝑥 ∑ 𝑥 ∗ 𝑙𝑜𝑔 𝑦|

𝑇′

Entonces reemplazando y hallando la determínate se obtiene:

𝑎′ =|10.989 3653.03 204

|

|8 10.989

36 204|

=332.61

336= 0.9899

Donde:

𝑎′ = 𝑙𝑜𝑔 𝑎

𝑎 = 10𝑎′ = 100.9899 = 9.77

𝑏′ =|

8 10.98936 53.01

|

336=

28.6485

336= 0.0852

Donde:

𝑏′ = 𝑙𝑜𝑔 𝑏

𝑏 = 10𝑏′ = 100.0852 = 1.217

El modelo obtenido a través de la correlación es:

𝑦 = 9.77 ∗ (1.2172)𝑥

Page 13: Regresion Lineal y Multiple

Facultad de Ingeniería Química, Metalurgia y Ambiental

Ingeniería de la Producción Página 13

F. Coeficiente de correlación:

Esta dada por la siguiente formula:

𝑙𝑜𝑔 �̅� =∑ 𝑙𝑜𝑔 𝑦

𝑛

𝑙𝑜𝑔 �̅�2 = (∑ 𝑙𝑜𝑔 𝑦

𝑛)

2

𝑟 = √𝑙𝑜𝑔 𝑎 ∗ ∑ 𝑙𝑜𝑔 𝑦 + 𝑙𝑜𝑔 𝑏 ∗ ∑ 𝑥 𝑙𝑜𝑔 𝑦 − 𝑛 ∗ 𝑙𝑜𝑔 �̅�2

∑ 𝑙𝑜𝑔 𝑦2 − 𝑛 ∗ 𝑙𝑜𝑔 �̅�2

Donde:

𝑙𝑜𝑔 �̅�2 = (10.989

8)

2

= 677.3

𝑟 = √9.77 ∗ 10.989 + 1.2172 ∗ 53.031 − 8 ∗ 677.3

21.97 − 8 ∗ 677.3= 1

𝑟2 = 1.0021

G. Desviación estándar:

Esta dada por la siguiente formula.

𝐷𝑦 = √∑(𝑦 − �̅�)2

𝑛 − 1

Año 𝒙 𝒚 �̅� 𝒚 − �̅� (𝒚 − �̅�)𝟐

2003 1 9,8 11,889939 -2,08993904 4,36784517

2004 2 15,1 14,4691518 0,63084818 0,39796943

2005 3 19,2 17,6078577 1,59214232 2,53491718

2006 4 23,5 21,4274241 2,07257593 4,29557097

2007 5 28,7 26,075546 2,62445402 6,88775893

2008 6 33,5 31,7319569 1,76804306 3,12597628

2009 7 34,9 38,615379 -3,71537902 13,8040413

2010 8 43,5 46,9919803 -3,49198035 12,1939268

∑ 𝒊 36 208,2 208,809235 -0,60923488 47,608006

Calculamos:

𝐷𝑦 = √47.6

8= 2.6079

Page 14: Regresion Lineal y Multiple

Facultad de Ingeniería Química, Metalurgia y Ambiental

Ingeniería de la Producción Página 14

H. Limites de control:

Esta compuesta por:

Limites de control superior

Esta dada por la siguiente ecuación:

𝑦 = 5.8643 + 4.3452 ∗ 𝑥 + 0.0238 ∗ 𝑥2 + 1.96 ∗

Así podemos visualizarla en la siguiente tabla:

x y LCS

1 9,8 17,0014235

2 15,1 19,5806363

3 19,2 22,7193422

4 23,5 26,5389086

5 28,7 31,1870305

6 33,5 36,8434414

7 34,9 43,7268635

8 43,5 52,1034648

Limites de control inferior

Esta dada por la siguiente ecuación:

𝑦 = 5.8643 + 4.3452 ∗ 𝑥 + 0.0238 ∗ 𝑥2 − 1.96 ∗ 𝑥

Así podemos visualizarla en la siguiente tabla:

x LCI

1 6,77845455

2 9,35766733

3 12,4963732

4 16,3159396

5 20,9640615

6 26,6204724

7 33,5038945

8 41,8804959

Page 15: Regresion Lineal y Multiple

Facultad de Ingeniería Química, Metalurgia y Ambiental

Ingeniería de la Producción Página 15

Aquí se puede visualizar con la grafica:

6

11

16

21

26

31

36

41

46

51

1 2 3 4 5 6 7 8

Y

X

MODELOREAL

Y ESTIMADO

LCS

LCI