3 1 Error Estandar de La Estimaci n

15

Click here to load reader

Transcript of 3 1 Error Estandar de La Estimaci n

Page 1: 3 1 Error Estandar de La Estimaci n
Page 2: 3 1 Error Estandar de La Estimaci n

MEDIDAS DE VARIACIÓN

El análisis de regresión se usa con propósitos de predicción, la meta

es desarrollar un modelo estadístico que se puede usar para

predecir los valores de una variable dependiente o de respuesta

basados en los valores de al menos una variable independiente o

explicativa.

Para examinar que tan bien predice la variable independiente a la variable

dependiente en el modelo estadístico, es necesario desarrollar varias

medidas de variación: La suma de cuadrados total (SCT). La suma de

cuadrados de regresión (SCR) Suma de cuadrados de Error (SCE)

Profesor. Juan Díaz Valencia.

Page 3: 3 1 Error Estandar de La Estimaci n

REGRESIÓN Y CORRELACIÓN

ESTIMACIÓN DEL ERROR

Estudio de caso.

Una cadena de supermercados ha aumentado el porcentaje de mercadeo

con el incremento en el número de tiendas; los dueños nunca han empleado

un enfoque sistemático para la elección del lugar, esto se basó, en esencia,

en que se consideró un gran sitio o una buena renta. Ahora, la empresa con

un nuevo plan estratégico para abrir varias tiendas nuevas, le pidió al

director de proyectos y planeación que desarrollara un enfoque para

predecir las ventas anuales en todas las tiendas nuevas.

El director decidió examinar la relación entre el tamaño (en pies cuadrados)

de una tienda y sus ventas anuales (miles de dólares), para ello seleccionó

aleatoriamente una muestra de 14 tiendas.

Page 4: 3 1 Error Estandar de La Estimaci n

Tienda Área [pies2] Venta [anual] N° X Y

1 1726 3681

2 1642 3895

3 2816 6653

4 5555 9543

5 1292 3418

6 2208 5563

7 1313 3660

8 1102 2694

9 3151 5468

10 1516 2898

11 5161 10674

12 4567 7585

13 5841 11760

14 3008 4085

Modelo de regresión lineal

𝐘 = 𝐚 + 𝐛𝐗

Y = 1,6861x + 901,25

Coeficiente de Correlación

r = 0,9538

Coeficiente de Determinación.

R² = 0,9098

Coeficientes de regresión

b = 1,6861

a = 901,247

Mediante el método de mínimos

cuadrados el director de planeación

halla el siguiente modelo de regresión,

y el coeficiente de determinación.

Al interpretar la pendiente b = 1,686. significa que por cada incremento de una unidad en X, se estima que le valor promedio de Y aumenta 1686 dólares,

Page 5: 3 1 Error Estandar de La Estimaci n

Coeficiente de Determinación.

Page 6: 3 1 Error Estandar de La Estimaci n

Tienda Área [pies2] venta [anual] valor estimado SCR SCE

N° X Y Ŷ (Ŷ - Ῡ)2 (Y - Ŷ)2

1 1726 3681 3811,236 4063016,54 16961,4157

2 1642 3895 3669,612 4654014,79 50799,7505

3 2816 6653 5648,976 31667,1177 1008064,19

4 5555 9543 10266,93 19713612,7 524074,645

5 1292 3418 3079,512 7548297,82 114574,126

6 2208 5563 4623,888 1447306,62 881931,349

7 1313 3660 3114,918 7355001,34 297114,387

8 1102 2694 2759,172 9411130,38 4247,38958

9 3151 5468 6213,786 149658,67 556196,758

10 1516 2898 3457,176 5615727,25 312677,799

11 5161 10674 9602,646 14256042,1 1147799,39

12 4567 7585 8601,162 7696371,12 1032585,21

13 5841 11760 10749,126 24228027,5 1021866,24

14 3008 4085 5972,688 21245,811 3563365,99

106191120 10532258,6

Ῡ = 5826,928571

SCR =

106.191.119,76

SCE =

10.532.258,64

SCT =

116.723.378,41

Medidas de variación en la Regresión.

SCT = SCR + SCE.

R2 = 0,90976736

Suma de cuadrados total = Suma de cuadrados de regresión + Suma de cuadrados de error

Page 7: 3 1 Error Estandar de La Estimaci n

ERROR ESTÁNDAR DE LA ESTIMACIÓN.

La recta de regresión no es un pronosticador perfecto, al igual que no se

espera que todos los valores sean idénticos a su media aritmética, tampoco

puede pensarse que todos los datos estén justo sobre la recta de regresión.

Por lo tanto se hace necesario desarrollar un estadístico que mida la

variabilidad de los valores de Y pronosticados.

La desviación estándar alrededor de la recta de regresión la llamaremos

error estándar de la estimación. Representado por el símbolo SYX.

Calcule el error estándar de la estimación para el ejemplo de elección de

sitio. (en Excel)

Error típico 936,8500077

Page 8: 3 1 Error Estandar de La Estimaci n

Interpretación del error estándar de la desviación.

Representa una medida de variación alrededor de la recta de regresión

ajustada. Se mide en las unidades de la variable dependiente Y. la

interpretación del error estándar es similar al de la desviación estándar, esta

mide la variabilidad alrededor de la media aritmética, el error estándar de la

regresión mide la variabilidad alrededor de la recta de regresión ajustada.

El error estándar de la desviación se puede usar para determinar si existe

una relación estadísticamente significativa entre las dos variables y hacer

inferencias acerca de los valores pronosticados de Y.

• El error estándar nos permite deducir la confiabilidad de la ecuación de

regresión que hemos desarrollado.

• El error estándar de la estimación mide la variabilidad, o dispersión de los

valores observados alrededor de la línea de regresión.

Page 9: 3 1 Error Estandar de La Estimaci n

Inferencias acerca de la pendiente.

El objeto de este apartado es hacer inferencias acerca de la relación entre las variables de una población con base en los datos de la muestra.

Prueba t para la pendiente. Es posible determinar la existencia de relación significativa entre las variables X e Y probando si β1 (La pendiente de la población) es igual a cero. Si la hipótesis se rechaza, la conclusión es que existe evidencia de una relación lineal. Las hipótesis nula y alternativa se establecen de la siguiente manera:

H0 : β1 = 0 No hay relación lineal H1 : β1 ≠ 0 Hay relación lineal

Prueba de hipótesis para la pendiente de la población β1 mediante la prueba t. El estadístico t es igual a la diferencia entre la pendiente de la muestra y la pendiente hipotética dividida entre el error estándar de la pendiente Sb1.

Page 10: 3 1 Error Estandar de La Estimaci n

El estadístico de prueba sigue una distribución t con n – 2 grados de

libertad. Con relación al ejemplo de la selección del sitio, podemos probar

si existe una relación significativa entre el tamaño de la tienda y las ventas

anuales con un nivel de significancia α = 0,05

Donde b1 = + 1,6861 n = 14 Sb1 = 0,1533 (error estándar de la pendiente)

Por lo tanto, para probar la existencia de una relación a un nivel de

significancia de 0,05 se tiene:

Page 11: 3 1 Error Estandar de La Estimaci n

Prueba de hipótesis sobre la pendiente de la población con un nivel

de significancia α = 5% con 12 grados de libertad.

Consideraciones para la interpretación del estadístico t.

Si el valor t calculado > tn - 2 Entonces se rechaza H0

O si t calculado < - tn – 2. No se rechaza H0

Conclusión: como t = 11 > t12 = 2,1788 entonces podemos decir que

existe una relación lineal significativa entre la ventas anuales

promedio y el tamaño de la tienda.

Page 12: 3 1 Error Estandar de La Estimaci n

Prueba de la existencia de Correlación.

Recordemos que el coeficiente de correlación r mide la fuerza de relación

entre dos variables. Podemos generar la hipótesis que ρ es 0, por tanto las

hipótesis nula y alternativa son:

H0: ρ = 0 (NO hay correlación)

H1: ρ ≠ 0 (Existe correlación)

Aplicamos:

Para el ejemplo tenemos que t ≈ 10,64 si asumimos el nivel de significancia

de α = 0,05 se tiene que:

t = 10,64 > 2.1788 entonces rechazamos la hipótesis nula, así concluimos

que existe evidencia de una asociación entre las ventas anuales y el tamaño

de la tienda.

Page 13: 3 1 Error Estandar de La Estimaci n

MAT GEOM

X Y

1 5 4

2 4 3

3 5 2

4 5 4

5 3 1

6 3,5 3

7 3 3

8 4 4

9 4 3,5

10 3,5 2,5

11 3,5 3,5

12 5 4

13 4,5 4

14 4,5 3,5

15 4 4

16 3,8 4,5

17 3,8 3,5

18 4 3,5

19 2 1

20 2,5 2

21 3 2,5

22 4,5 3,8

Ejercicio 1. 1º construya l a recta de regresión 2° Si un estudiante obtiene una nota de 4,3 cuánto se espera que obtenga en geometría. 3° Calcule el coeficiente de correlación y determinación e interprételos. 4° Realice una prueba t y diga si existe una relación lineal significativa. Utilice un nivel de significancia del 2% y 5%. 5° Verifique si existe evidencia o no de correlación entre las variables. Utilice nivel de significancia de 2% y del 5%.

Page 14: 3 1 Error Estandar de La Estimaci n

Ejercicio 2.

A menudo se utiliza el tratamiento térmico para carburar partes metálicas como

los engranes, el espesor de la capa carburada se considera una característica

importante del engrane y contribuye a la confiabilidad general de la parte. Debido

a la naturaleza critica de esta característica, se lleva a cabo una prueba de

laboratorio en cada carga del horno. La prueba es destructiva, donde una parte

real se corta en forma transversal y se remoja en un químico durante cierto

tiempo. Esta prueba implica correr un análisis de carbón sobre una superficie del

paso del engranaje (parte superior de los dientes del engrane) y la raíz del

engrane (entre los dientes). Los datos son los resultados del análisis de carbón

del paso de engrane para 19 partes. (ver la siguiente página)

Page 15: 3 1 Error Estandar de La Estimaci n

Tiempo de

remojo

Paso del

engrane N°

Tiempo

de

remojo

Paso del

engrane

1 0,58 0,013 11 1,17 0,021

2 0,66 0,016 12 1,17 0,019

3 0,66 0,015 13 1,17 0,021

4 0,66 0,016 14 1,20 0,025

5 0,66 0,015 15 2,00 0,025

6 0,66 0,016 16 2,00 0,026

7 1,00 0,014 17 2,20 0,024

8 1,17 0,021 18 2,20 0,025

9 1,17 0,018 19 2,20 0,024

10 1,17 0,019

Ejercicio 2.

1º construya la recta de regresión

2° Si el tiempo de remojo es 1,18 en

cuánto se espera el paso del

engrane.

3° Calcule el coeficiente de

correlación y determinación e

interprételos.

4° Diga si existe una relación lineal

significativa.

5° Verifique si existe evidencia o no

de correlación entre las variables.

Utilice nivel de significancia de 2% y

del 5%.