MÉTODOS DE CALIBRACIÓN: REGRESIÓN Y CORRELACIÓN Estadística en el laboratorio.
Laboratorio Estadística
description
Transcript of Laboratorio Estadística
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 1/78
2012
[LABORATORIO PRIMERAUNIDAD] ANÁLISIS DE REGRESIÓN I
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 2/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
1 UNIVERSIDAD NACIONAL DE TRUJILLO
UNIVERSIDAD NACIONAL DE TRUJILLO
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 3/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
2 UNIVERSIDAD NACIONAL DE TRUJILLO
2.4. La tabla B – 3 del apéndice contiene datos sobre el rendimiento de la gasolina, en
millas, de 32 automóviles diferentes.
Nº Automóvil Y = Millas / Galón X1 = Cilindrada (pulg3)
1 Apollo 18.90 350.0
2 Omega 27.00 350.03 Nova 20.00 250.0
4 Monarch 18.25 351.0
5 Duster 20.07 225.0
6 JensonConv. 11.20 440.0
7 Skyhawk 22.12 231.0
8 Monza 21.47 262.0
9 Scirocco 34.70 89.7
10 Corolla SR-5 30.40 96.9
11 Camaro 16.50 350.0
12 Datsun B210 36.50 85.3
13 Capri II 21.50 171.0
14 Pacer 19.70 258.0
15 Babcat 20.30 140.0
16 Granada 17.80 302.0
17 Eldorado 14.39 500.0
18 Imperial 14.89 440.0
19 Nova LN 17.80 350.0
20 Valiant 16.41 318.0
21 Starfire 23.54 231.022 Cordoba 21.47 360.0
23 Trans AM 16.59 400.0
24 Corolla S-5 31.90 96.9
25 Astre 29.40 140.0
26 Mark IV 13.27 460.0
27 Celica GT 23.90 133.6
28 Charger SE 19.73 318.0
29 Cougar 13.90 351.0
30 Elite 13.27 351.0
31 Matador 13.77 360.0
32 Corvette 16.50 350.0
Tabla B.3 - Rendimiento de la gasolina para 32 automóviles
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 4/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
3 UNIVERSIDAD NACIONAL DE TRUJILLO
a) Ajustar un modelo de regresión lineal simple que relacione el rendimiento de la
gasolina (millas por galón) y la cilindrada del motor X1 (pulgadas cúbicas).
Nº Automóvil Y = Millas / Galón X1 = Cilindrada (pulg3) Xi2 Yi
2 XiYi
1 Apollo 18.90 350.0 122500.00 357.21 6615.002 Omega 27.00 350.0 122500.00 729.00 9450.00
3 Nova 20.00 250.0 62500.00 400.00 5000.00
4 Monarch 18.25 351.0 123201.00 333.06 6405.75
5 Duster 20.07 225.0 50625.00 402.80 4515.75
6 JensonConv. 11.20 440.0 193600.00 125.44 4928.00
7 Skyhawk 22.12 231.0 53361.00 489.29 5109.72
8 Monza 21.47 262.0 68644.00 460.96 5625.14
9 Scirocco 34.70 89.7 8046.09 1204.09 3112.59
10 Corolla SR-5 30.40 96.9 9389.61 924.16 2945.76
11 Camaro 16.50 350.0 122500.00 272.25 5775.00
12 Datsun B210 36.50 85.3 7276.09 1332.25 3113.45
13 Capri II 21.50 171.0 29241.00 462.25 3676.50
14 Pacer 19.70 258.0 66564.00 388.09 5082.60
15 Babcat 20.30 140.0 19600.00 412.09 2842.00
16 Granada 17.80 302.0 91204.00 316.84 5375.60
17 Eldorado 14.39 500.0 250000.00 207.07 7195.00
18 Imperial 14.89 440.0 193600.00 221.71 6551.60
19 Nova LN 17.80 350.0 122500.00 316.84 6230.00
20 Valiant 16.41 318.0 101124.00 269.29 5218.3821 Starfire 23.54 231.0 53361.00 554.13 5437.74
22 Cordoba 21.47 360.0 129600.00 460.96 7729.20
23 Trans AM 16.59 400.0 160000.00 275.23 6636.00
24 Corolla S-5 31.90 96.9 9389.61 1017.61 3091.11
25 Astre 29.40 140.0 19600.00 864.36 4116.00
26 Mark IV 13.27 460.0 211600.00 176.09 6104.20
27 Celica GT 23.90 133.6 17848.96 571.21 3193.04
28 Charger SE 19.73 318.0 101124.00 389.27 6274.14
29 Cougar 13.90 351.0 123201.00 193.21 4878.90
30 Elite 13.27 351.0 123201.00 176.09 4657.77
31 Matador 13.77 360.0 129600.00 189.61 4957.20
32 Corvette 16.50 350.0 122500.00 272.25 5775.00
Σ 657.14 9111.40 3019001.36 14764.74 167618.14
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 5/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
4 UNIVERSIDAD NACIONAL DE TRUJILLO
Realizamos nuestro gráfico de dispersión para visualizar el comportamiento o
relación entre las variables:
Sabemos que:
n 32 284.7313
20.5356
Hallamos :
∑
y = -0.0459x + 33.602R² = 0.7043
0
510
15
20
25
30
35
40
0 100 200 300 400 500 600
Gráfico de dispersion del rendimiento
de la gasolina (millas por galón) y lacilindrada del motor (pulg3)
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 6/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
5 UNIVERSIDAD NACIONAL DE TRUJILLO
Hallamos :
∑ ∑
Hallamos :
Hallamos :
Reemplazamos en nuestro modelo :
Interpretación:
El rendimiento de la gasolina disminuye en 0,046 millas/galón con respecto a la
cilindrada del motor X1 unidades en pulgadas cúbicas.
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 7/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
6 UNIVERSIDAD NACIONAL DE TRUJILLO
b) Formar la tabla de análisis de varianza y prueba de significancia de la regresión.
Se desea probar lo siguiente:
Entonces hallamos:
:
:
∑
:
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 8/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
7 UNIVERSIDAD NACIONAL DE TRUJILLO
:
Armamos la tabla de análisis de varianza con los datos obtenidos
anteriormente:
F.de V. SC gl CM F Valor - P
Regresión 894.432 1 894.43271.4545 0.0000Error 375.525 30 12.517
Total 1269.957 31
Se debe tener en cuenta que:
Interpretación:
Se Rechaza H0: No es significativa, por lo que podemos decir que nuestro modelo
de regresión estimada es significativo implicado por el rendimiento de la gasolina
dado la cilindrada del motor X1.
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 9/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
8 UNIVERSIDAD NACIONAL DE TRUJILLO
c) ¿Qué porcentaje de la variabilidad total del rendimiento de la gasolina explica la
relación lineal con la cilindrada del motor?
Si:
Interpretación:
Existe un 70.43% de variabilidad total del rendimiento de la gasolina expresadapor la variable cilindrada del motor en el modelo de regresión lineal estimado.
d) Determinar un intervalo de confianza de 95% para el rendimiento promedio de
gasolina, si el desplazamiento del motor es 275 pulg3.
Si:
∑
Para ello tenemos que tener en cuenta lo siguiente:
:
:
( )
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 10/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
9 UNIVERSIDAD NACIONAL DE TRUJILLO
:
( )
( )
:
Reemplazamos
∑
Interpretación:
Se estima con un nivel confianza de 95% el rendimiento promedio de gasolina, si
el desplazamiento del motor es 275 pulg3, se encuentra entre 19.7003 y 22.2641
(millas/ galón).
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 11/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
10 UNIVERSIDAD NACIONAL DE TRUJILLO
e) Suponer que se desea pronosticar el rendimiento de gasolina que tiene un coche
con motor de 275 pulg3. Determine un estimado puntual para el rendimiento.
Determinar un intervalo de predicción de 95% para el rendimiento.
Si:
∑
Debemos tener en cuenta los siguientes parámetros:
:
:
:
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 12/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
11 UNIVERSIDAD NACIONAL DE TRUJILLO
Reemplazamos:
∑
Interpretación:
Se estima con un 95% de confianza que un motor nuevo de 275 pulg3tuviera un
rendimiento de gasolina entre 13.6438 y 28.3206 (millas por galón).
f) Comparar los dos intervalos obtenidos en las partes de d y e. explicar la diferencia
entre ellos. ¿Cuál es más amplio y por qué?
Intervalo de la respuesta media:
Intervalo de nuevas observaciones:
La estimación del intervalo para las nuevas observaciones es más amplio que la
estimación del intervalo para la respuesta media debido a las k nuevas
observaciones futuras y debido a que en la fórmula de la varianza a las nuevas
observaciones se le agrega el 1.
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 13/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
12 UNIVERSIDAD NACIONAL DE TRUJILLO
2.7 Se cree que la pureza del oxígeno producido con su proceso de fraccionamiento está
relacionada con el porcentaje de hidrocarburos en el condensador principal de la
unidad de procesamiento. A continuación se muestran los datos de veinte muestras.
Pureza (%) Hidrocarburos (%)
Y X86.91 1.02
89.85 1.11
90.28 1.43
86.34 1.11
92.58 1.01
87.33 0.95
86.29 1.11
91.86 0.87
95.61 1.43
89.86 1.02
96.73 1.46
99.42 1.55
98.66 1.55
96.07 1.55
93.65 1.40
87.31 1.15
95.00 1.01
96.85 0.99
85.20 0.9590.56 0.98
a) Ajustar un modelo de regresión lineal simple a los datos.
NºHidrocarburos(%) Pureza (%)
Xi2 Yi
2 XiYi X Y
1 1.02 86.91 1.0404 7553.3481 88.6482
2 1.11 89.85 1.2321 8073.0225 99.7335
3 1.43 90.28 2.0449 8150.4784 129.1004
4 1.11 86.34 1.2321 7454.5956 95.83745 1.01 92.58 1.0201 8571.0564 93.5058
6 0.95 87.33 0.9025 7626.5289 82.9635
7 1.11 86.29 1.2321 7445.9641 95.7819
8 0.87 91.86 0.7569 8438.2596 79.9182
9 1.43 95.61 2.0449 9141.2721 136.7223
10 1.02 89.86 1.0404 8074.8196 91.6572
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 14/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
13 UNIVERSIDAD NACIONAL DE TRUJILLO
11 1.46 96.73 2.1316 9356.6929 141.2258
12 1.55 99.42 2.4025 9884.3364 154.101
13 1.55 98.66 2.4025 9733.7956 152.923
14 1.55 96.07 2.4025 9229.4449 148.9085
15 1.40 93.65 1.96 8770.3225 131.11
16 1.15 87.31 1.3225 7623.0361 100.4065
17 1.01 95.00 1.0201 9025 95.95
18 0.99 96.85 0.9801 9379.9225 95.8815
19 0.95 85.20 0.9025 7259.04 80.94
20 0.98 90.56 0.9604 8201.1136 88.7488
Σ 23.65 1836.36 29.03 168992.05 2184.06
Realizamos nuestro gráfico de dispersión para visualizar el comportamiento o
relación entre las variables:
Sabemos que:
n 20
1.1825
91.8180
y = 11.801x + 77.863R² = 0.3891
84.00
86.00
88.00
90.00
92.00
94.00
96.00
98.00
100.00
102.00
0.00 0.20 0.40 0.60 0.80 1.00 1.20 1.40 1.60 1.80
%
d e P u e r z a
% de Hidrocarburo
Gráfico de dispersion del % deHidrocarburos con respecto al % de pureza.
Series1
Lineal (Series1)
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 15/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
14 UNIVERSIDAD NACIONAL DE TRUJILLO
Hallamos :
∑
Hallamos :
∑ ∑
Hallamos :
Hallamos :
Reemplazamos en nuestro modelo :
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 16/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
15 UNIVERSIDAD NACIONAL DE TRUJILLO
Interpretación:
El porcentaje de pureza aumenta en 11.8010 con respecto al porcentaje de
hidrocarburos X1(unidades porcentuales).
b)
Probar la hipótesis H0: β1 = 0.
Se desea probar lo siguiente:
Entonces hallamos:
:
148.3130
:
∑
:
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 17/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
16 UNIVERSIDAD NACIONAL DE TRUJILLO
:
Armamos la tabla de análisis de varianza con los datos obtenidos
anteriormente:
F.de V SC gl CM F Valor - P
Regresión 148.313 1 148.31311.466 0.0033Error 232.834 18 12.935
Total 381.147 19
Se debe tener en cuenta que:
Interpretación:
Se Rechaza H0: No es significativa, por lo que podemos decir que nuestro modelo
de regresión estimada es significativo implicado por el por el porcentaje de
hidrocarburos X1.
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 18/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
17 UNIVERSIDAD NACIONAL DE TRUJILLO
c) Calcular R2.
Si:
Interpretación:
El 38.91% de la variabilidad total de la pureza del modelo estimado de regresión
lineal explica la relación lineal con el porcentaje de hidrocarburos.
d) Determinar un intervalo de confianza de 95% para la pendiente.
Si:
∑
Para hallar nuestro intervalo debemos tener en cuenta lo siguientes:
∑
∑
∑
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 19/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
18 UNIVERSIDAD NACIONAL DE TRUJILLO
Reemplazamos los datos obtenidos en la fórmula del intervalo presentado
anteriormente:
e)
Determinar un intervalo de confianza de 95% para la pureza media, cuando el
porcentaje de hidrocarburos es 1.00.
Si:
∑
Para ello tenemos que tener en cuenta lo siguiente:
:
:
(
)
( )
:
( )
( )
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 20/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
19 UNIVERSIDAD NACIONAL DE TRUJILLO
:
Reemplazamos
∑
Interpretación:
Se estima con un nivel confianza de 95% la pureza media de gasolina, cuando elporcentaje de hidrocarburos es 1.00, donde se encuentra entre 87.5102 y
91.8185 (unidades porcentuales).
2.12. Se cree que la cantidad de libras de vapor usadas en una planta por mes está
relacionada con la temperatura ambiente promedio. A continuación se
presentan los consumos y las temperaturas del último año.
Temperatura Uso/1000
Mes Xi Yi
Enero 21 185.79Febrero 24 214.47Marzo 32 288.03Abril 47 424.84Mayo 50 454.68Junio 59 539.03Julio 68 621.55
Agosto 74 675.06Septiembre 62 562.03
Octubre 50 452.93Noviembre 41 369.95Diciembre 30 273.98
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 21/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
20 UNIVERSIDAD NACIONAL DE TRUJILLO
a) Ajustar un modelo de regresión lineal simple a los datos.
Temperatura Uso/1000Xi
2 Yi2 XiYi Mes Xi Yi
Enero 21 185.79 441 34517.9241 3901.59
Febrero 24 214.47 576 45997.3809 5147.28
Marzo 32 288.03 1024 82961.2809 9216.96
Abril 47 424.84 2209 180489.026 19967.48
Mayo 50 454.68 2500 206733.902 22734
Junio 59 539.03 3481 290553.341 31802.77
Julio 68 621.55 4624 386324.403 42265.4
Agosto 74 675.06 5476 455706.004 49954.44
Septiembre 62 562.03 3844 315877.721 34845.86
Octubre 50 452.93 2500 205145.585 22646.5
Noviembre 41 369.95 1681 136863.003 15167.95
Diciembre 30 273.98 900 75065.0404 8219.4
Σ 558 5062.34 29256 2416234.61 265869.63
Realizamos nuestro gráfico de dispersión para visualizar el comportamiento o
relación entre las variables:
y = 9.2085x - 6.3321R² = 0.9999
0
100
200
300
400
500
600
700
800
0 20 40 60 80
Gráfico de dispersión de latemperatura con respecto al uso/1000.
Yi
Lineal (Yi)
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 22/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
21 UNIVERSIDAD NACIONAL DE TRUJILLO
Sabemos que:
n 12 46.5000
421.8617
Hallamos :
∑
Hallamos :
∑ ∑
Hallamos :
Hallamos :
Reemplazamos en nuestro modelo :
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 23/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
22 UNIVERSIDAD NACIONAL DE TRUJILLO
Interpretación:
La cantidad de vapor aumenta en 9.2085 libras con respecto al porcentaje de
temperatura. X1.
b)
Probar la significancia de la regresión.
Se desea probar lo siguiente:
Entonces hallamos:
:
:
∑
:
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 24/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
23 UNIVERSIDAD NACIONAL DE TRUJILLO
:
∑
t tabulado:
Interpretación:
Por lo tanto se rechaza la H0 = 0, ya que el valor absoluto de mi valor calculado es
mayor que mi valor tabulado t. podemos concluir que nuestro modelo de
regresión lineal es estadísticamente significativo.
c)
En la administración de la planta se cree que un aumento de 1 grado en la
temperatura ambiente promedio hace aumentar 10000 libas el consumo mensual
de vapor. ¿Estos datos respaldan la afirmación?
Si:
∑
Para ello tenemos que tener en cuenta lo siguiente:
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 25/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
24 UNIVERSIDAD NACIONAL DE TRUJILLO
:
:
( )
:
( )
( )
:
Reemplazamos
∑
()
Interpretación:
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 26/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
25 UNIVERSIDAD NACIONAL DE TRUJILLO
Se estima que un aumento de 1 grado en la temperatura ambiente promedio
hace aumentar 10000 libas el consumo mensual de vapor el cual se estimo en un
intervalo al 95% de confianza donde se encuentra entre 82.7306 y 88.7746 libras.
Por lo cual se puede decir que si se respaldan.
d) Determinar un intervalo de predicción de 99% para el uso de vapor en un mes con
temperatura ambiente promedio de 580.
Si:
∑
Debemos tener en cuenta lo siguiente:
:
:
∑
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 27/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
26 UNIVERSIDAD NACIONAL DE TRUJILLO
:
Reemplazamos con nuestros datos hallados anteriormente y tenemos nuestro
intervalo:
Interpretación:
Se estima un intervalo de predicción de 99% de confianza para el uso de vapor en
un mes con temperatura ambiente promedio de 580, donde se aprecia
claramente que dicho uso de vapor varía entre 521.2237 y 534.2944 libras.
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 28/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
27 UNIVERSIDAD NACIONAL DE TRUJILLO
2.15. Byers y Williams estudiaron el impacto de la temperatura sobre la viscosidad de mezclas
de tolueno y tetralina. La tabla siguiente muestra los datos para mezclas con fracción molar de
tolueno igual a 0.4.
Temperatura °C Viscosidad
(mPa*s)24.9 1.133
35 0.9772
44.9 0.8532
55.1 0.775
65.2 0.6723
75.2 0.6021
85.2 0.542
95.2 0.5074
a.
Estimar la ecuación de predicción.
Primero graficaremos los datos para ver el comportamiento y elegir el modelo adecuado:
y = -0.476ln(x) + 2.6676
0
0.2
0.4
0.6
0.8
1
1.2
20 30 40 50 60 70 80 90 100
V i s c o s i d a d ( m P a * s )
Temperatura (°C)
Diagrama de Dispersión deTemperatura (°C) y Viscosidad (mPa*s)
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 29/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
28 UNIVERSIDAD NACIONAL DE TRUJILLO
Observamos que el modelo que se ajusta mejor a los datos es el logarítmico que tiene la siguiente
ecuación:
Para utilizar las fórmulas de un modelo lineal, tenemos que hallar una columna en la tabla con lnX
y la columna de la variable dependiente y:
X Y ln X
Temperatura °C Viscosidad (mPa*s)
1 24.9 1.133 3.21487
2 35 0.9772 3.55535
3 44.9 0.8532 3.80444
4 55.1 0.775 4.00915
5 65.2 0.6723 4.17746
6 75.2 0.6021 4.320157 85.2 0.542 4.44500
8 95.2 0.5074 4.55598
Necesitaremos además las siguientes sumatorias:
∑lnX 32.0824
∑lnX2 130.1528
∑lnX*Y 23.6003
4.0103
∑Y 6.0622
∑Y2 4.9329
Y 0.7578
Utilizamos las fórmulas:
Para hallar 1:
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 30/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
29 UNIVERSIDAD NACIONAL DE TRUJILLO
Dónde:
∑ ∑
Y:
∑
Entonces:
Para hallar 0:
Entonces remplazando en la ecuación del modelo:
INTERPRETACIÓN: Cada vez que latemperatura aumenta en un °C la viscosidad
disminuye en 0.4762 mPa*s.
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 31/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
30 UNIVERSIDAD NACIONAL DE TRUJILLO
b.
Hacer un análisis completo del modelo.
Probar la significancia del modelo:
Para hacer la tabla de ANVA necesitamos:
SCR:
SCT:
SCE:
CMR:
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 32/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
31 UNIVERSIDAD NACIONAL DE TRUJILLO
CME:
Estadístico de prueba F:
Hacemos la tabla de ANVA:
F.V. SC gl CM F
Regresión 0.33856 1 0.338563547.91857
Error 0.00057 6 0.000954
Total 0.33913 7
Hallamos:
Si:
Rechazamos la hipótesis nula, es decir 1 es significativo en el modelo propuesto.
Contraste de la hipótesis usando la probabilidad (p):
Si:
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 33/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
32 UNIVERSIDAD NACIONAL DE TRUJILLO
Probar la significancia individual de los estimadores:
PARA β0:
Para contrastar la hipótesis necesitamos:
2:
(β0):
()
()
()
Estadístico de prueba:
()
√
Hallamos:
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 34/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
33 UNIVERSIDAD NACIONAL DE TRUJILLO
Si:
||
Rechazamos la hipótesis nula, es decir 0 es significativo en el modelo propuesto.
Contraste de la hipótesis usando la probabilidad (p):
Entonces:
Si:
PARA β1:
Para contrastar la hipótesis necesitamos:
2:
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 35/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
34 UNIVERSIDAD NACIONAL DE TRUJILLO
(β1):
()
()
()
Estadístico de prueba:
()
√
Hallamos:
Si:
||
Rechazamos la hipótesis nula, es decir 1 es significativo en el modelo propuesto.
Contraste de la hipótesis usando la probabilidad (p):
Entonces:
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 36/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
35 UNIVERSIDAD NACIONAL DE TRUJILLO
Si:
R2:
c.
Calcular y graficar las bandas de 95% de confianza y de predicción.
Intervalo de confianza para β0:
⁄ ()
Sabemos:
()
Entonces:
INTERPRETACIÓN: El 99.83% del porcentaje
de variación de “y” es explicada por la
ecuación:
INTERPRETACIÓN: Se estima al 95% de
confianza que el intervalo del parámetro β0
está entre 2.5887 y 2.7465.
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 37/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
36 UNIVERSIDAD NACIONAL DE TRUJILLO
Intervalo de confianza para β1:
⁄ ()
Sabemos:
()
Entonces:
Intervalo de predicción:
Agregamos un nuevo valor de x para hacer el intervalo de predicción, para este caso:
Hallamos el lnX:
Necesitamos:
INTERPRETACIÓN: Se estima al 95% de
confianza que el intervalo del parámetro β1
está entre -0.4958 y -0.4567.
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 38/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
37 UNIVERSIDAD NACIONAL DE TRUJILLO
Además:
Entonces:
2.19. Se tiene el modelo de regresión lineal simple , con y
y
no correlacionado.
a.
Demostrar que ( ) .
( ) * () ()+
Sabemos que:
()
Entonces:
()
() ( )
INTERPRETACIÓN: Se estima al 95% de
confianza que el intervalo para una nueva
observación x0 = 99°C, y0 estará entre -2.3725
y 3.3223 mPa*s
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 39/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
38 UNIVERSIDAD NACIONAL DE TRUJILLO
Remplazando en la fórmula:
( ) *( ) ( )+
( ) *( )
+
( ) ()
( )
b.
Demostrar que ( ) .
() *() ()+
() [( )]
() [ ( )] ()
( )
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 40/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
39 UNIVERSIDAD NACIONAL DE TRUJILLO
3.5. Véanse los datos de rendimiento de gasolina de la siguiente tabla:
y x1 x6
Automóvil Millas/galón Cilindrada (pulgadas cúbicas) Carburador (gargantas)
1 Apollo 18.9 350 4
2 Omega 17 350 4
3 Nova 20 250 1
4 Monarch 18.25 351 2
5 Duster 20.07 225 1
6 Jenson Cov. 11.2 440 4
7 Skyhawk 22.12 231 2
8 Monza 21.47 262 2
9 Scirocco 34.7 89.7 2
10 Corolla SR-5 30.4 96.9 2
11 Camaro 16.5 350 412 Datsun B210 36.5 85.3 2
13 Capri II 21.5 171 2
14 Pacer 19.7 258 1
15 Babcat 20.3 140 2
16 Granada 17.8 302 2
17 Eldorado 14.39 500 4
18 Imperial 14.89 440 4
19 Nova LN 17.8 350 4
20 Valiant 16.41 318 2
21 Starfire 23.54 231 2
22 Cordoba 21.47 360 2
23 Trans AM 16.59 400 4
24 Corolla E-5 31.9 96.9 2
25 Astre 29.4 140 2
26 Mark IV 13.27 460 4
27 Celica GT 23.9 133.6 2
28 Charger SE 19.73 318 2
29 Cougar 13.9 351 2
30 Elite 13.27 351 231 Matador 13.77 360 4
32 Corvette 16.5 350 4
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 41/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
40 UNIVERSIDAD NACIONAL DE TRUJILLO
a.
Ajustar un modelo de regresión lineal múltiple que relacione el rendimiento de la
gasolina y , en millas por galón, la cilindrada del motor x 1 y la cantidad de gargantas en el
carburador, x 6.
Hacemos los cálculos de las matrices necesarias:
X'X =
32 9111.4 83
9111.4 3019001.36 26189.8
83 26189.8 251
0.2602 -0.00041 -0.0433
(X'X)-1 = -0.00041 0.000004138 -0.000296
-0.0433 -0.000296 0.04921
647.14X'Y = 164118.14
1576.13
Para estimar la matriz utilizamos la siguiente fórmula:
Entonces la ecuación del modelo es:
INTERPRETACIÓN DE β1:
INTERPRETACIÓN: Si la cilindrada del motor
aumenta en una pulgada cúbica y el número
de carburadores permanece constante, el
rendimiento de la gasolina disminuye 0.053
millas /galón.
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 42/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
41 UNIVERSIDAD NACIONAL DE TRUJILLO
INTERPRETACIÓN DE β6:
b. Formar la tabla de análisis de varianza, y probar la significancia de la regresión.
Para formar la tabla de ANVA necesitamos los siguientes datos:
Hipótesis:
Error tipo I:
Suma de cuadrados de la regresión:
Suma de cuadrados del total:
INTERPRETACIÓN: Si el número de
carburadores aumenta en una unidad y la
cilindrada del motor permanece constante, elrendimiento de la gasolina disminuye 0.9295
millas /galón.
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 43/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
42 UNIVERSIDAD NACIONAL DE TRUJILLO
Suma de cuadrados del error:
Hacemos el cuadro de análisis de varianza:
F.V. SC gl CM F
Regresión 972.8984 2 486.4492 53.305333
Error 264.6457 29 9.1257
Total 1237.5441 31
Estadístico de prueba:
Contraste de la hipótesis:
Se rechazará H0 si:
Hallamos:
Entonces:
Contraste usando la probabilidad (p):
INTERPRETACIÓN: Se pude afirmar con un
95% de confianza que al menos uno de los
estimadores es significativo, por lo que
podemos concluir que el modelo es
significativo.
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 44/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
43 UNIVERSIDAD NACIONAL DE TRUJILLO
c.
Calcular R2 y R2adj para el modelo. Compararlas con la R2 y R2
adj de regresión lineal simple,
que relacionaba las millas con la cilindrada en el problema 2.4.
Calculamos R2:
Calculamos R2ajustado:
Comparación con el ejercicio 2.4.:
INTERPRETACIÓN: como no existe diferencia
significativa entre R2 y R2ajustado podemos
afirmar que todos los términos del modelo
son significativos.
COMPARACIÓN: debido a que R2 es menor cuando se
trabaja con el modelo simple con una sola variable
que cuando se trabaja con un modelo múltiple con 2
variables (x1 y x2), y R2 es la explicación de la
variabilidad de y explicada por la ecuación de
regresión es conveniente trabajar con el modelo de
regresión múltiple con x1 y x2 como variables
independientes.
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 45/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
44 UNIVERSIDAD NACIONAL DE TRUJILLO
d. Determinar un intervalo de confianza de 95% para β1.
Para determinar el intervalo necesitamos:
2:
V(β1):
Necesitamos la matriz C:
C = (X'X)-1 =
C00 C01 C06
C10 C11 C16
C60 C61 C66
C = (X'X)-1 =
0.260195 -0.000410 -0.043272
-0.000410 0.000004 -0.000296
-0.043272 -0.000296 0.049206
La fórmula para V(1): ()
()
()
Entonces la fórmula para el intervalo:
⁄
(
)
Dónde:
Entonces:
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 46/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
45 UNIVERSIDAD NACIONAL DE TRUJILLO
e.
Calcular el estadístico t para probar y . ¿Qué conclusiones se
pueden sacar?
Prueba de significancia individual para β1:
Estadístico de prueba:
()
√
Hallamos:
Si:
||
Existe evidencia para rechazar H0, es decir 1 no es significativo en el modelo propuesto.
Contraste de la hipótesis usando la probabilidad (p):
INTERPRETACIÓN: se estima al 95% de
confianza que el valor del parámetro 1
oscilará entre -0.0656 y -0.0405
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 47/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
46 UNIVERSIDAD NACIONAL DE TRUJILLO
Entonces:
Si:
Prueba de significancia individual para β6:
Hallamos V(6):
()
()
()
Estadístico de prueba:
()
√
Hallamos:
Si:
||
No existe evidencia para rechazar H0, es decir 6 no es significativo en el modelo propuesto.
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 48/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
47 UNIVERSIDAD NACIONAL DE TRUJILLO
Contraste de la hipótesis usando la probabilidad (p):
Entonces:
Si:
f.
Determinar un intervalo de predicción de 95% para una nueva observación derendimiento de gasolina cuando x1 = 275 pulg3 y x6 = 2 gargantas.
Hallamos la matriz x0 y su transpuesta:
1
x0 = 275
2
x0' 1 275 2
Hallamos ŷ0:
Hallamos la V(ŷ0):
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 49/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
48 UNIVERSIDAD NACIONAL DE TRUJILLO
Hacemos el intervalo:
⁄ ⁄
⁄
g.
Determinar un intervalo de predicción de 95% para una nueva observación de
rendimiento de gasolina cuando x1 = 275 pulg3 y x
6 = 2 gargantas.
De item anterior sabemos que:
Hallamos la V(ŷ0):
La fórmula del intervalo para una nueva predicción es:
⁄
Sabemos que:
⁄
El intervalo será:
INTERPRETACIÓN: se estima al 95% de
confianza que la dureza promedio cuando x1
es 275 pulg3 y x6 es 2 gargantas estará
comprendida entre 18.869 y 21.5059
millas/galón.
INTERPRETACIÓN: se estima al 95% de
confianza que la dureza para nuevas
observaciones cuando x1 es 275 pulg3 y x6 es
2 gargantas estará comprendida entre
18.869 y 21.5059 millas/galón.
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 50/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
49 UNIVERSIDAD NACIONAL DE TRUJILLO
3.8. Los datos de la siguiente tabla presentan la eficiencia de un proceso químico, en función de
varias variables controlables del proceso.
N° y:CO2 X6:Solvente Total X7:Consumo de Hidrógeno
1 36.98 2227.25 2.062 13.74 434.9 1.33
3 10.08 481.19 0.97
4 8.53 247.14 0.62
5 36.42 1645.89 0.22
6 26.59 907.59 0.76
7 19.07 608.05 1.71
8 5.96 380.55 3.93
9 15.52 213.4 1.97
10 56.61 2043.36 5.08
11 26.72 761.48 0.6
12 20.8 566.4 0.9
13 6.99 237.08 0.63
14 45.93 1961.49 2.04
15 43.09 1023.89 1.57
16 15.79 411.3 2.38
17 21.6 2244.77 0.32
18 35.19 978.64 0.4419 26.14 687.62 8.82
20 8.6 468.28 0.02
21 11.63 460.62 1.72
22 9.59 290.42 1.88
23 4.42 233.95 1.43
24 38.89 2088.12 1.35
25 11.19 994.63 1.61
26 75.62 2196.17 4.78
27 36.03 1080.11 5.88
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 51/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
50 UNIVERSIDAD NACIONAL DE TRUJILLO
a.
Ajustar un modelo de regresión múltiple que relaciona el CO2 del producto(y) con el
solvente total (X 6 ) y el consumo de hidrogeno (X 7 )
Donde:
36.98
13.74
10.08
8.53
36.42
26.5919.07
5.96
15.52
56.61
26.72
20.8
6.99
Y = 45.93
43.09
15.7921.6
35.19
26.14
8.6
11.63
9.59
4.42
38.89
11.19
75.6236.03
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 52/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
51 UNIVERSIDAD NACIONAL DE TRUJILLO
1 2227.25 2.06
1 434.9 1.33
1 481.19 0.97
1 247.14 0.62
1 1645.89 0.22
1 907.59 0.761 608.05 1.71
1 380.55 3.93
1 213.4 1.97
1 2043.36 5.08
1 761.48 0.6
1 566.4 0.9
1 237.08 0.63
X= 1 1961.49 2.04
1 1023.89 1.57
1 411.3 2.381 2244.77 0.32
1 978.64 0.44
1 687.62 8.82
1 468.28 0.02
1 460.62 1.72
1 290.42 1.88
1 233.95 1.43
1 2088.12 1.35
1 994.63 1.61
1 2196.17 4.781 1080.11 5.88
27 25874.29 55.02
X'X= 25874.29 38111725.38 58043.2026
55.02 58043.2026 218.3418
0.132317504 -6.56168E-05 -0.015899372
(X'X)-1= -6.56168E-05 7.6628E-08 -3.83572E-06
-0.015899372 -3.83572E-06 0.009606136
667.72
X'Y= 898144.97
1691.3233
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 53/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
52 UNIVERSIDAD NACIONAL DE TRUJILLO
b.
Probar la significancia de la regresión. Calcular R2 y R2 Adj
b.1) Probar la significancia de la regresión:
H0: 1=2=…=k = 0
H1: j≠0 al menos una j
Estadístico de Prueba
⁄ ⁄
Se rechaza H0 si:
F0 > F(p-1,n-p)
667.72
X'Y= 898144.971691.3233
n=27
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 54/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
53 UNIVERSIDAD NACIONAL DE TRUJILLO
p= 3
F(0.05,2,24)= 3.402826
F. de V SC GL CM F0 Valor P
Regresión 5506.287 2 2753.143 27.953 5.39031E-07
Error 2363.825 24 98.493
Total 7870.112 26
Comparamos:
F0 > F(0.05,2,24)
27.953> 3.402826
Interpretación:
Al rechazarse Ho entonces tenemos que al menos una de los regresoresX6(solvente total) o X7(consumo de hidrógeno) contribuye al modelo
Y=2.52663+0.01852X6+2.18572X7 en forma significativa.
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 55/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
54 UNIVERSIDAD NACIONAL DE TRUJILLO
b.2) Calcular R2
SCR= 5506.286737 SCT= SCE + SCR
SCT= 2363.82536 + 5506.286737
SCT=7870.112
Interpretación: Existe un 69,96% de variabilidad total de la variable Y
expresada por la variable X en el modelo de regresión múltiple estimada.
b.3) Calcular R2Adj
( )
c. Usar pruebas t para determinar la contribución de X 6 y X 7 al modelo.
c.1) Contribución de X 6:
Estadístico de Prueba:
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 56/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
55 UNIVERSIDAD NACIONAL DE TRUJILLO
Se rechaza H0 si:
||
Datos:
C jj=diagonal de la matriz C=(X’X)-1
0.132317504 -6.56168E-05 -0.015899372
(X'X)-1= -6.56168E-05 7.6628E-08 -3.83572E-06
-0.015899372 -3.83572E-06 0.009606136
Tenemos:
√
Comparamos:
||
Interpretación: El coeficiente 6 es individualmente
significativo al modelo de regresión lineal múltiple.
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 57/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
56 UNIVERSIDAD NACIONAL DE TRUJILLO
c.2) Contribución de X 7 :
Estadístico de Prueba:
Se rechaza H0 si:
||
Desarrollo:
C jj=diagonal de la matriz C=(X’X)-1
0.132317504 -6.56168E-05 -0.015899372
(X'X)-1= -6.56168E-05 7.6628E-08 -3.83572E-06
-0.015899372 -3.83572E-06 0.009606136
Tenemos:
√
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 58/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
57 UNIVERSIDAD NACIONAL DE TRUJILLO
Comparamos:
||
Interpretación: El coeficiente β7 es individualmente
significativo al modelo de regresión lineal múltiple.
d. Establecer intervalos de confianza de 95% para β6 y β7
Para β6:
√
Para β7:
√
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 59/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
58 UNIVERSIDAD NACIONAL DE TRUJILLO
e.
Volver a ajustar el modelo solo con X6 como regresor. Probar la significancia de la
regresión y calcular R2 Y R2Adj. Comentar los resultados. Con base en estos estadísticos.
¿Es satisfactorio el modelo?
N° y :CO2 X6 : Solvente Total
1 36.98 2227.252 13.74 434.9
3 10.08 481.19
4 8.53 247.14
5 36.42 1645.89
6 26.59 907.59
7 19.07 608.05
8 5.96 380.55
9 15.52 213.4
10 56.61 2043.3611 26.72 761.48
12 20.8 566.4
13 6.99 237.08
14 45.93 1961.49
15 43.09 1023.89
16 15.79 411.3
17 21.6 2244.77
18 35.19 978.64
19 26.14 687.62
20 8.6 468.28
21 11.63 460.62
22 9.59 290.42
23 4.42 233.95
24 38.89 2088.12
25 11.19 994.63
26 75.62 2196.17
27 36.03 1080.11
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 60/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
59 UNIVERSIDAD NACIONAL DE TRUJILLO
Ajustamos los datos a un Modelo Potencial de Regresión Lineal:
X6 Y Log Y Log X6
2227.25 36.98 1.56796691 3.34776897
434.9 13.74 1.13798673 2.63838941
471.19 10.08 1.00346053 2.67319606
247.14 8.53 0.93094903 2.392943041645.89 36.42 1.56133994 3.21640081
907.59 26.59 1.42471834 2.9578897
608.05 19.07 1.28035069 2.78393929
380.55 5.96 0.77524626 2.58041173
213.4 15.52 1.19089172 2.32919442
2043.36 56.61 1.75289315 3.31034489
761.48 26.72 1.42683645 2.8816585
566.4 20.8 1.31806333 2.75312324
237.08 6.99 0.84447718 2.37489492
1961.49 45.93 1.66209645 3.2925861
1023.89 43.09 1.63437649 3.0102533
y = 0.0985x0.8016
R² = 0.7078
0
10
20
30
40
5060
70
80
0 500 1000 1500 2000 2500
C O 2
Solvente Total
Eficiencia de un Proceso Químico
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 61/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
60 UNIVERSIDAD NACIONAL DE TRUJILLO
411.3 15.79 1.19838213 2.61415871
2244.77 21.6 1.33445375 3.35117185
978.64 35.19 1.54641927 2.99062296
687.62 26.14 1.41730558 2.8373485
468.28 8.6 0.93449845 2.67050561
460.62 11.63 1.06557971 2.66334279
290.42 9.59 0.98181861 2.46302652
233.95 4.42 0.64542227 2.36912305
2088.12 38.89 1.58983794 3.31975545
994.63 11.19 1.04883009 2.99766155
2196.17 75.62 1.87863667 3.34166595
1080.11 36.03 1.55666426 3.03346799
∑ ∑
Desarrollando : ∑XY= 101.631286
n= 27
∑X2= 223.692245
Sxx= 2.9869061
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 62/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
61 UNIVERSIDAD NACIONAL DE TRUJILLO
Interpretación: Si el solvente total aumenta en una unidad, el CO2 del
producto aumentará en 0.0816482.
Desarrollando : Para el caso de Potencia:
Significancia de la regresión:
Estadístico de Prueba:
Grados de
libertad
Suma de
cuadrados
Cuadrado
Medio
F Valor crítico
de F(Valor P)
Regresión 1 1.91950462 1.91950462 60.5493936 3.8797E-08
Residuos 25 0.79253668 0.03170147
Total 26 2.7120413
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 63/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
62 UNIVERSIDAD NACIONAL DE TRUJILLO
Comparando:
Interpretación: Como el Ho> H se dice que existe al menos un coeficiente del
modelo de regresión que influye en el comportamiento de Y (CO2).
Calcular R2
Interpretación: Existe un 70.78% de variabilidad total en el CO2 (Y) en el producto
expresado por el solvente total del producto (X 6) en el modelo de regresión
estimada.
Calcular R2Adj
( )
¿Es satisfactorio el modelo?
El Modelo de Regresión Simple para X (CO2) y el Solvente Total(X6) es satisfactorio
ya que tiene un 70% de significancia.
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 64/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
63 UNIVERSIDAD NACIONAL DE TRUJILLO
f.
Establecer un intervalo de confianza de 95% para β6, con el modelo que se ajusto en el
punto e. Comparar la longitud de este intervalo de confianza con la del determinado en
la parte d. ¿Se deduce algo importante acerca de la contribución de X7 al modelo?
∑
Comparamos los intervalos:
Intervalo de Regresión Lineal Múltiple(inciso d)
Intervalo de Regresión Lineal Simple(inciso e)
g.
Comparar los valores del CME obtenidos con los dos modelos que se ajustaron (partes a
y e) ¿Cómo cambio el CME al quitar X7 del modelo? ¿Indica lo anterior algo importante
acerca de la contribución de X7 al modelo?
CME del inciso a:
CME del inciso e
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 65/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
64 UNIVERSIDAD NACIONAL DE TRUJILLO
¿Cómo cambio el CME al quitar X7?
Al obtener el CME del Modelo de Regresión Simple de las variables Y y X6 este
valor disminuyo, lo cual nos dice que X7 no es tan significativo para este modelo;
ya que al estudiar solo X6 tenemos menos error.
¿Indica lo anterior algo importante acerca de la contribución de X7 al modelo?
Nos indica que X7 no contribuye mucho a nuestro Modelo de Regresión Múltiple.
3.12. Un ingeniero químico estudió el efecto de la cantidad de surfactante y el tiempo sobre la
formación de catrato. Los catratos se usan como medio de conservación en frio. La siguiente
tabla resume los resultados experimentales.
Cant.Surfactante Tiempo(min) Form.Catrato
X1 X2 Y0 10 7.5
0 50 150 85 220 110 28.60 140 31.60 170 340 200 350 230 35.50 260 36.50 290 38.50 10 12.30 30 18
0 62 20.80 90 25.70 150 32.50 210 340 270 35
0.02 10 14.40.02 30 190.02 60 26.40.02 90 28.50.02 120 290.02 210 350.02 30 15.10.02 60 26.40.02 120 270.02 150 290.05 20 210.05 40 27.30.05 130 48.50.05 190 50.40.05 250 52.5
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 66/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
65 UNIVERSIDAD NACIONAL DE TRUJILLO
0.05 60 34.40.05 90 46.50.05 120 500.05 150 51.9
a.
Ajustar un modelo de regresión lineal múltiple que relacione la formación de catrato con
estos regresores
Donde:
1 0 10
1 0 501 0 851 0 1101 0 1401 0 1701 0 2001 0 2301 0 2601 0 2901 0 101 0 30
1 0 621 0 901 0 150
X = 1 0 2101 0 2701 0.02 101 0.02 301 0.02 601 0.02 901 0.02 1201 0.02 2101 0.02 30
1 0.02 601 0.02 1201 0.02 1501 0.05 201 0.05 401 0.05 1301 0.05 1901 0.05 250
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 67/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
66 UNIVERSIDAD NACIONAL DE TRUJILLO
1 0.05 601 0.05 901 0.05 1201 0.05 150
7.51522
28.631.63435
35.536.538.512.3
1820.825.732.5
Y = 3435
14.419
26.428.52935
15.126.4272921
27.348.550.452.534.446.5
5051.9
36 0.65 4297
X'X = 0.65 0.0265 70.1
4297 70.1 746169
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 68/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
67 UNIVERSIDAD NACIONAL DE TRUJILLO
0.12183 -1.50687 -0.00056
(X'X)- 1= -1.50687 68.85280 0.00221
-0.00056 0.00221 0.000004
1094.8
X'Y : 24.121
153467.6
b.
Probar la significancia de la regresión ¿A qué conclusiones se puede llegar?
H0: β1=β2=…=βk = 0
H1: β j≠0 al menos una j
Estadístico de Prueba
⁄ ⁄
Se rechaza H0 si:
F0 > F(α,p-1,n-p)
n=36
1094.8
x'y = 24.121
153467.6
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 69/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
68 UNIVERSIDAD NACIONAL DE TRUJILLO
p= 3
F(0.05,2,33)= 3.4028
F. de V SC GL CM F Valor P
Regresión 4007.072 2 2003.536 87.601 6.316E-14
Error 754.744 33 22.871
Total 4761.816 35
Comparamos:
F0 > F(0.05,2,24)
87.601 > 3.4028; rechazamos H0
Interpretación:
Se puede concluir que al menos una de los regresores X1(cantidad de
surfactante) o X2(tiempo) contribuye al modelo Y=11.0870+350.1192
X1+0.1089 X2 en forma significativa.
c.
Hacer pruebas t para evaluar la contribución de cada regresor al modelo. Comentar los
resultados
c.1) Contribución de β1:
Estadístico de Prueba:
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 70/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
69 UNIVERSIDAD NACIONAL DE TRUJILLO
Se rechaza H0 si: ||
Desarrollo:
C jj=diagonal de la matriz C=(X’X)-1
0.12183 -1.50687 -0.00056
(X'X)-1 = -1.50687 68.85280 0.00221
-0.00056 0.00221 0.000004
Tenemos:
√
Comparamos:
||
Interpretación: El coeficiente 1 es individualmente significativo al
modelo de regresión lineal múltiple.
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 71/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
70 UNIVERSIDAD NACIONAL DE TRUJILLO
c.2) Contribución de β2:
Estadístico de Prueba:
Se rechaza H0 si: ||
Desarrollo:
C jj=diagonal de la matriz C=(X’X)-1
0.12183 -1.50687 -0.00056
(X'X)-1 : -1.50687 68.85280 0.00221
-0.00056 0.00221 0.000004
Tenemos:
√
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 72/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
71 UNIVERSIDAD NACIONAL DE TRUJILLO
Comparamos:
||
Interpretación: El coeficiente β2 es individualmente significativo al
modelo de regresión lineal múltiple.
d.
Calcular R2 y R2Adj para este modelo. Comparar esos valores con los de R2 y R2
Adj para el
modelo de regresión lineal simple que relaciona la formación de catrato con el tiempo.
Comentar los resultados
d.1) R2
y R2
Adj para este modelo:
F. de V SC GL CM F Valor P
Regresión 4007.072 2 2003.536 87.601 6.316E-14
Error 754.744 33 22.871
Total 4761.816 35
Interpretación: Existe un 84.15% de variabilidad total en la formación de
catrato expresada por la variable X (cantidad de surfactante y tiempo) en el
modelo de regresión múltiple estimada.
( )
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 73/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
72 UNIVERSIDAD NACIONAL DE TRUJILLO
d.1) R2 y R2Adj para X2:
X2 Y
10 7.5
50 15
85 22
110 28.6
140 31.6
170 34
200 35
230 35.5
260 36.5
290 38.5
10 12.3
30 18
62 20.890 25.7
150 32.5
210 34
270 35
10 14.4
30 19
60 26.4
90 28.5
120 29
210 3530 15.1
60 26.4
120 27
150 29
20 21
40 27.3
130 48.5
190 50.4
250 52.5
60 34.490 46.5
120 50
150 51.9
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 74/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
73 UNIVERSIDAD NACIONAL DE TRUJILLO
n= 36 119.4 30.41
Sxy= 22791.1
Sxx= 233274.3
SCR = 2226.701
SCE = 2535.114
SCT = 4761.816
Hallamos R2 y R2Ajus
Interpretación: Existe un 46.8% de variabilidad total en la formación de catrato
expresada por el tiempo en el modelo de regresión múltiple estimada.
( )
Comentario de los resultados: Como se observa anteriormente el R2 y R2Ajus en el
Modelo de Regresión Lineal Múltiple es mayor que el de Modelo de Regresión Lineal,
por lo que se concluye que el Modelo de Regresión Lineal Múltiple es mayor debido a
que tiene una variable mas y dicha variable proporciona mas variabilidad además que
el Cuadrado Medio del Erros es menor.
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 75/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
74 UNIVERSIDAD NACIONAL DE TRUJILLO
e.
Determinar un intervalo de confianza de 95% para el coeficiente de regresión del tiempo
para los dos modelos de la parte d. Comentar las diferencias encontradas
∑
e.1) Para del Modelo de Regresión Lineal Múltiple
√
e.2) Para del Modelo de Regresión Lineal
Comentario de las diferencias encontradas:
Podemos observar que 1 en el Modelo de Regresión Lineal Simple tiene mayoramplitud que el Modelos de Regresión Lineal Múltiple; por lo cual podemos decir
que 1(MRLS) es más conveniente.
3.16. Demostrar que una forma equivalente de hacer la prueba de la significancia de una
regresión lineal múltiple es basar la prueba de R2 como sigue:
H0: β1=β2=…=βk
H1: al menos una β j≠0
Calcular lo siguiente:
Y rechazar H0 si el valor calculado de F0 > F (α,k,n-p), siendo p=k+1
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 76/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
75 UNIVERSIDAD NACIONAL DE TRUJILLO
DEMOSTRACION:
⁄
⁄ ⁄
Tenemos que p = k+1:
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 77/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
76 UNIVERSIDAD NACIONAL DE TRUJILLO
3.17. Suponer que se ha ajustado un modelo de regresión lineal con k=2 regresores, a n=25
observaciones, y que R2=0.9
a. Probar el significado de la regresión con α=0.05. Usar los resultados del problema
anterior
H0: β1=β2=…=βk = 0
H1: β j≠0 al menos una j
Estadístico de Prueba
() Se rechaza H0 si: F0 > F(α,p-1,n-p)
Datos:
k=2
p= k+1=3
n= 25
R2=0.9
α=0.05
Reemplazando:
Comparamos Fo > F
F0 > F(0.05,2,22)
99
> 3.443, se rechaza H0
Interpretación:
Se puede concluir que al menos una de los regresores X1 o X2 contribuye en el
Modelo de Regresión Lineal Múltiple en forma significativa.
7/17/2019 Laboratorio Estadística
http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 78/78
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
b.
¿Cuál es valor mínimo de R2 que haría llegar a la conclusión de que la regresión es
significativa si α=0.05? ¿Sorprende al lector la pequeñez de este valor de R2?
Datos:
k=2
p= k+1=3
n= 25
α=0.05
Reemplazando:
¿Sorprende al lector la pequeñez de este valor de R2?
Si puesto que este modelo tendría una significancia de tan solo 23.84%.