Estadistica y pronostico para la toma de decisiones

33
Maestros Online www.maestronline.com Solicita una cotización a través de nuestros correos Maestros Online Estadística y pronóstico para la toma de decisiones Grupo de problemas Servicio de asesorías y solución de ejercicios Envía tus actividades a [email protected]

Transcript of Estadistica y pronostico para la toma de decisiones

Page 1: Estadistica y pronostico para la toma de decisiones

Maestros Online www.maestronline.com

Solicita una cotización a través de nuestros

correos

Maestros Online

Estadística y pronóstico para la

toma de decisiones Grupo de

problemas

Servicio de asesorías y solución de ejercicios

Envía tus actividades a [email protected]

Page 2: Estadistica y pronostico para la toma de decisiones

Maestros Online www.maestronline.com

Actividad 1: ¿Quién tienen mayor peso, los

hombres o las mujeres?

Instrucciones:

La estatura de una persona está relacionada con su peso, por lo que puede sugerirse, en

términos generales, que a mayor estatura de una persona esta tendrá más peso. Para tener

una idea de cómo es esta relación, realiza lo siguiente:

1. De manera individual pregunta a 10 personas diferentes la siguiente información:

a. Su género (hombre o mujer)

b. Su estatura en centímetros

c. Su peso en kilogramos

2. Con base en la información recolectada, determina:

a. ¿Quiénes presentan mayor estatura, hombres o mujeres?

b. ¿Quiénes presentan mayor peso, hombres o mujeres?

c. ¿Cuál es la mayor estatura?, ¿cuál la menor?

d. ¿Cuál es el promedio de las estaturas? ¿cuál el del peso?

e. ¿Cuál es la varianza del conjunto de datos?

f. Determina la varianza por género.

3. Comparte tus resultados en el foro del equipo.

4. Utilicen Excel para elaborar una base de datos donde se incluya la información de todos

los miembros del equipo.

5. Determinen lo siguiente:

a. El promedio general tanto de estatura como de peso.

b. Para ambas variables determinar la mediana.

c. Calcular la varianza y la desviación estándar.

6. Verifiquen lo anterior utilizando herramientas de análisis de Excel.

7. Al finalizar, reflexionen sobre las siguientes preguntas y preparen un documento que

integre las respuestas de todo el equipo a manera de conclusiones. Compartan el

documento en el foro.

a. ¿Cuál es el promedio general, tanto para peso como para estatura?

b. ¿Cuál es el promedio por género (hombre, mujer)?

c. ¿Cuál es la desviación estándar para todo el conjunto de datos?

d. ¿Cuál es la desviación estándar por género?

e. ¿Cuál de los dos géneros es el de mayor estatura?, ¿cuál el de mayor peso?

f. ¿Qué genero presenta mayor variabilidad en ambas características (estatura y peso)?

g. ¿En qué otras áreas podrían aplicar estos conceptos?

Page 3: Estadistica y pronostico para la toma de decisiones

Maestros Online www.maestronline.com

Realiza lo siguiente:

1. Determina cuál de las siguientes es una distribución de probabilidad. En caso de que no

sea función de probabilidad explicar por qué no lo es.

a.

x 1 2 3 4

p(x) 0.4 0.2 0.3 0.2

c.

x -2 -1 1 2

p(x) 0.1 0.2 0.6 0.1

e.

x 0 2 4 6

p(x) -0.1 0.3 0.1 0.5

g.

x 1 2 3 4

p(x) 0.4 0.2 0 .3 0.2

2. El gerente de una planta utiliza datos históricos para construir una función de distribución

de probabilidad de X, el número de empleados ausentes en un día dado; los datos se

presentan a continuación:

x 0 1 2 3 4 5 6 7

p(x) 0.001 0.025 0.350 0.300 0.200 0.090 0.029 0.005

Determinar lo siguiente:

a. P(X=1)

Page 4: Estadistica y pronostico para la toma de decisiones

Maestros Online www.maestronline.com

b. P(X>5)

c. P(X≥5)

d. P(X=6)

3. Supón que X representa el número de personas en una vivienda. La distribución de

probabilidad es como sigue:

X 1 2 3 4 5 6 7

p(x) 0.26 0.31 0.19 0.14 0.05 0.03 0.02

4.

a. ¿Cuál es la probabilidad de que una vivienda seleccionada al azar tenga menos de 3

personas?

b. ¿Cuál es la probabilidad de que una casa seleccionada al azar tenga más de 5

personas?

c. ¿Cuál es la probabilidad de que una vivienda seleccionada al azar tenga entre 2 y 4

(inclusive) personas? Determínese P (2≤X≤4).

Escribe con tus propias palabras el proceso de prueba de hipótesis y los intervalos de

confianza.

5. Una muestra aleatoria de 10 observaciones se extrajo de una población normal. Los datos

son los siguientes:

3 6 3 5 6 2 6 5 5 4

a. Establecer un intervalo de confianza al 90%.

b. Establecer un intervalo de confianza al 95%.

c. Establecer un intervalo de confianza al 99%.

5. Del experimento para determinar los grados centígrados necesarios para llevar el punto

de ebullición un litro de agua, se obtuvieron los siguientes resultados:

100.0 100.2 99.7 99.5 99.5 100.3

99.0 99.4 99.9 100.2 100.1 99.8

a. Prueba la hipótesis de que la media es igual a 100 (H0: μ = 100) contra la alternativa

de que la media poblacional es diferente a 100 (Ha: μ ≠ 100). El nivel de significancia

es del 1% (α = 0.01). Realiza todas las etapas de una prueba de hipótesis.

b. Establece intérprete el intervalo de confianza al 99% para la media de ebullición μ.

Page 5: Estadistica y pronostico para la toma de decisiones

Maestros Online www.maestronline.com

6. Por un período de varios años, un dentífrico ha recibido una puntuación media de 5.9, en

una escala de 7 puntos, en cuanto a la satisfacción general del cliente con el producto.

Debido a un cambio no anunciado en el producto, existe la preocupación de que quizás

haya cambiado la satisfacción del cliente. Supón que las puntuaciones para una muestra

de 25 clientes tienen una media de 5.60 y una desviación estándar de 0.87. ¿Indican

estos datos que la satisfacción del cliente es diferente de 5.9?

a. Prueba la hipótesis con α = 0.05.

b. Obtén un intervalo de confianza al 95% para la media μ.

Actividad 2: Nicotina en cigarrillos

Instrucciones:

1. De manera individual, escribe el proceso de la prueba de hipótesis.

2. Reúnanse en equipos de trabajo (foro, Skype, Google Docs, chat, etc.).

3. Comenten sobre el proceso de las pruebas de hipótesis.

4. Una muestra aleatoria de 50 jóvenes adultos se selecciona y a cada persona se le

pregunta cuántos minutos ven diariamente de deportes. La media muestral que se

encontró fue de = 64. Supón que σ = 20.

Prueben la hipótesis de que existe suficiente evidencia estadística para inferir que la

media poblacional es superior a 60 minutos. Utilicen un nivel de significancia de 0.05.

5. Repitan el ejercicio 4 con n =75

6. Repitan el ejercicio 4 con n =100

7. Repitan el ejercicio 4 con σ = 10.

8. Repitan el ejercicio 4 con σ = 40.

9. Repitan el ejercicio 4 con = 62.

10. Repitan el ejercicio 4 con = 68.

11. Realicen un resumen de los ejercicios 4 a 10 describiendo qué pasa al valor de la

estadística de prueba cuando pasa lo siguiente:

a. El tamaño de muestra se incrementa.

b. La desviación estándar disminuye.

c. El valor de se incrementa.

1. Describe con tus propias palabras qué significa una serie de tiempo.

2. Enlista y define las componentes de una serie de tiempo.

3. ¿Cuál de las cuatro componentes de una serie de tiempo se utilizaría para describir el

efecto de las ventas navideñas de una tienda departamental de menudeo?

4. ¿Por qué es más fácil pronosticar valores para una serie de tiempo que contiene un

componente estacional que uno que posee un componente cíclico?

5. Los datos que se presentan a continuación corresponden al número de autos de

pasajeros (en miles) en Francia durante los años 1970 a 2006.

Page 6: Estadistica y pronostico para la toma de decisiones

Maestros Online www.maestronline.com

Año 1970 1975 1979 1980 1981 1982 1983 1984 1985 1986

Númer

o de

autos

(miles)

1247

0

1552

0

1844

0

1913

0

1975

0

2030

0

2060

0

2080

0

2109

0

2150

0

Año 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996

Númer

o de

autos

(miles)

2197

0

2252

0

2301

0

2355

0

2381

0

2402

0

2438

5

2490

0

2510

0

2550

0

Año 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006

Númer

o de

autos

(miles)

2609

0

2681

0

2748

0

2806

0

2870

0

2916

0

2956

0

2990

0

3010

0

3040

0

6. Grafica el número de autos contra los años (utiliza Excel o cualquier paquete estadístico

como Minitab).

7. ¿Qué componentes de la series de tiempo parecen estar presentes en esta serie?

Actividad 3: ¿Existe relación entre el tamaño de la

casa y los metros de terreno? ¿Existe

Page 7: Estadistica y pronostico para la toma de decisiones

Maestros Online www.maestronline.com

autocorrelación en la serie de datos de los

CETES?

Instrucciones:

1. En forma individual define lo que significa los términos de:

a. Serie de tiempo

b. Componentes de una serie de tiempo

c. Correlación

d. Autocorrelación

2. En equipos (por Skype, chat, Google Docs, etc.) lleguen a una definición común e

indiquen en que situaciones de la vida diaria se pueden aplicar estos conceptos, den un

ejemplo de cada término.

3. Busquen información de 20 casas en venta en donde las variables son: Y (metros de

construcción) y X (metros de terreno); y realicen lo que se indica:

a. Realicen y describan el diagrama de dispersión

b. Calculen e interpreten el coeficiente de correlación muestral r

c. Respondan a la siguiente cuestión en un terreno urbano, ¿a mayor cantidad en metros

de construcción es mayor el precio de la vivienda?

4. Busquen información de los CETES a 28 DÍAS – SEMANAL, periodicidad diaria, datos del

Banco de México; consideren las últimas 20 cotizaciones de los CETES y realicen lo que

se indica:

a. Determina el coeficiente de autocorrelación r1

b. Determina la prueba la hipótesis de que:

i. Hipótesis nula: H0 : ρ1 = 0 (La autocorrelación es igual a cero)

ii. Hipótesis alternativa: Ha : ρ1≠ 0 (La autocorrelación es diferente de cero)

iii. Donde ρk es el coeficiente de autocorrelación poblacional en el lapso k

5. Den respuesta a la siguiente cuestión: ¿Qué significa el término autocorrelación? ¿Existe

autocorrelación entre los rendimientos de los CETES a 28 días?

6. Con los conceptos vistos y puestos en práctica den una respuesta justificada a cada una

de las siguientes cuestiones:

a. ¿Qué significa el coeficiente de correlación?

b. ¿Cómo se interpreta el coeficiente de correlación?

c. ¿Para qué sirve el coeficiente de autocorrelación?

¿Bajo qué condiciones es un promedio móvil simple apropiado para pronosticar?

Page 8: Estadistica y pronostico para la toma de decisiones

Maestros Online www.maestronline.com

1. Los datos de la demanda anual de bolsas de fertilizante de una empresa agrícola se

muestran en la siguiente tabla.

Año

t

Demanda de

fertilizante

(miles de bolsas)

Pronóstico

1 4 -

2 6 -

3 4 -

4 5 4.7

5 10

6 8

7 7

8 9

9 12

10 14

11 15

a. Grafica la serie de tiempo.

b. Encuentra el valor de pronóstico para la demanda de fertilizante para cada año,

comenzando por el año 4 por medio de un promedio móvil de k=3 años.

2. Aplica el suavizamiento exponencial con una constante de suavizamiento de α = 0.1 y un

valor inicial de 38 para pronosticar el valor del año 11 para el siguiente conjunto de datos.

Período

T

Yt Ŷt

1 38 38

2 43

3 42

Page 9: Estadistica y pronostico para la toma de decisiones

Maestros Online www.maestronline.com

4 45

5 46

6 48

7 50

8 49

9 46

10 45

3. Las ventas de equipos de cocina han aumentado durante los últimos cinco años.

Año Ventas Yt Ŷt

1 400 360

2 455

3 468

4 513

5 534

6

a. El gerente había pronosticado, antes de iniciar el negocio, que las ventas del primer

año serían de 360 equipos de cocina. Por medio de un suavizamiento exponencial con

α = 0.40, desarrolla los pronósticos para el periodo comprendido entre los años 2 y 6.

5. Las ventas trimestrales de una cadena de tiendas departamentales se registraron para los

años 1986-1989:

Año Trimestre Ventas

(millones)

Yt

Pronóstico

Ŷt

1986 1 18 18

2 33

Page 10: Estadistica y pronostico para la toma de decisiones

Maestros Online www.maestronline.com

3 25

4 41

1987 1 22

2 20

3 36

4 33

1988 1 27

2 38

3 44

4 52

1989 1 31

2 26

3 29

4 45

1990 1

a. Utiliza el suavizamiento exponencial con una constante de suavizamiento de 0.4 y un

valor inicial de 18 para pronosticar las ventas para el primer trimestre de 1990.

6. Para los siguientes valores de Yt y Ŷt de la siguiente tabla calcula la DAM, el ECM, el

EPAM y EPM.

Valor

observado

Yt

Pronóstico

Ŷt

166 173

179 186

195 192

214 211

220 223

Page 11: Estadistica y pronostico para la toma de decisiones

Maestros Online www.maestronline.com

6. Se utilizaron dos modelos de pronóstico para producir los valores futuros de una serie de

tiempo; estos valores (Ŷt) se muestran en la tabla siguiente, junto con los valores reales

observados (Yt).

Valores de pronóstico Ŷt

Valor observado Yt Modelo 1

Modelo 2

6.0 7.5 6.3

6.6 6.3 6.7

7.3 5.4 7.1

9.4 8.2 7.5

a. Calcula el DAM y el ECM para determinar cuál es más preciso.

8. Determina DAM y ECM para los siguientes pronósticos.

Valor

observado Yt

Pronóstico Ŷt

57 63

60 72

70 86

75 71

70 60

8. Se utilizaron tres técnicas de pronóstico para predecir los valores de una serie de tiempo.

Estos valores se dan en la siguiente tabla. Calculen el DAM y el ECM para cada técnica

para determinar cuál es el más preciso.

Valores de pronóstico Ŷt

Page 12: Estadistica y pronostico para la toma de decisiones

Maestros Online www.maestronline.com

Valor observado Yt Técnica

1

Técnica 2 Técnica 3

19 21 22 17

24 27 24 20

28 29 26 25

32 31 28 31

38 35 30 39

¿Cuánto tiempo dedica una persona en promedio a Internet?

Para tener una idea de esto, realiza lo siguiente:

1. Pregunta de manera individual a 10 personas del género masculino y a 10 personas del

género femenino la siguiente información:

a. Su edad

b. Tiempo que dedica diariamente a Internet

2. Con una calculadora de bolsillo y con base en esta información determina:

a. En promedio, ¿quién dedica más tiempo a Internet, hombres o mujeres?

b. ¿Cuál es el promedio de edad de las mujeres?, ¿de los hombres?

c. Para los géneros por separado determina la mediana de la edad y del tiempo

dedicado a Internet.

d. Para el total de datos determina la varianza y la desviación estándar del tiempo que

dedican a Internet y de la edad.

3. Utiliza Excel para elaborar una base de datos donde incluyas toda la información. Con una

calculadora de bolsillo contesta lo siguiente:

a. ¿Cuál es el promedio general de tiempo dedicado a Internet y de la edad?

b. ¿Cuál es la mediana para los datos en general, tanto para el tiempo dedicado a

Internet como de la edad?

c. ¿Cuál es la varianza y la desviación estándar de todos los datos para el tiempo

dedicado a Internet y para la edad?

4. Verifica lo anterior utilizando herramientas de análisis de Excel.

5. Para finalizar, reflexiona sobre las siguientes preguntas y prepara un documento con

respuestas a manera de conclusiones.

6. Busca información de TIIE 28 DÍAS - MENSUAL, Periodicidad mensual, datos del Banco

de México y realiza lo que se indica:

a. Considera las últimas 12 cotizaciones de la TIIE

b. Determina el coeficiente de autocorrelación r1

Page 13: Estadistica y pronostico para la toma de decisiones

Maestros Online www.maestronline.com

c. Determina la prueba la hipótesis de que:

Hipótesis nula: H0 : ρ1 = 0 (La autocorrelación es igual a cero)

Hipótesis alternativa: Ha : ρ1≠ 0 (La autocorrelación es diferente de cero)

Donde ρk es el coeficiente de autocorrelación poblacional en el lapso k

7. Busca información de TIIE 28 DÍAS - MENSUAL, Periodicidad mensual, datos del Banco

de México, considera las últimas 24 cotizaciones de la TIIE y realiza lo que se indica,

a. Determina el valor de pronóstico para el rendimiento del bono, comenzando en 4to

periodo, por medio de un promedio móvil de k= 3 meses.

b. Determina el valor de pronóstico para el rendimiento del bono para cada mes,

comenzando en el periodo 6, mediante un promedio móvil de k=5 meses.

c. Utiliza el suavizamiento exponencial con una constante de suavizamiento α = 0.2 y un

valor inicial igual a la primera lectura del TIIE 28 DÍAS.

d. Evalúa estos métodos de pronóstico por medio de Desviación Absoluta Media (DAM),

Error Cuadrático Medio (ECM), Error Porcentual Absoluto Medio (EPAM) y Error

Porcentual Medio (EPM).

e. Pronostica el rendimiento para el periodo 25 por medio de la mejor técnica.

Actividad 4: Obtención de la recta de regresión

ajustada por medio del método de mínimos

cuadrados.

Instrucciones:

Preparación para la actividad colaborativa (de forma individual)

1. Define los siguientes términos:

a. Análisis de la regresión simple.

b. Estimadores de mínimos cuadrados.

c. Intervalo de confianza.

d. Coeficiente de regresión.

e. Coeficiente de correlación.

f. Coeficiente de determinación.

2. Comparte tus definiciones a través del foro de grupo virtual que se estableció para el

desarrollo de la actividad.

Durante la actividad colaborativa

Page 14: Estadistica y pronostico para la toma de decisiones

Maestros Online www.maestronline.com

2. En equipos reporten al foro el desarrollo de los siguientes ejercicios y respuesta de las

preguntas planteadas:

a. En una compañía fabricante de helados se sospecha que el almacenar el helado a

temperaturas bajas durante largos periodos tiene un efecto lineal en la pérdida de

peso del producto. En la planta de almacenamiento de la compañía se obtuvieron los

siguientes datos:

Pérdida de peso (gr) Y 28 37 36 30 28 36 35

Tiempo (semanas) X 26 32 35 27 25 31 30

i. Ajusten e interpreten un modelo de regresión lineal simple a los datos.

ii. Prueben la significancia de la pendiente β1.

iii. Calculen e interpreten R2.

iv. Elaboren un intervalo de confianza del 90% para β1.

v. Pronostiquen la pérdida cuando el tiempo es de 33 semanas.

3. Con los conceptos vistos y puestos en práctica, den una respuesta justificada a cada una

de las siguientes cuestiones:

a. ¿Para qué utilizarías la regresión lineal simple en un problema de tu especialidad?

b. ¿Qué relación tiene con la correlación?

c. ¿Cómo medirías el ajuste del modelo de regresión lineal obtenido?

d. ¿Qué es el coeficiente de determinación?

e. ¿Por qué crees que se llama regresión lineal?

f. ¿Cuál es la relación de la prueba de hipótesis con el intervalo de confianza en la

regresión?

I. Realiza lo siguiente:

1. En un estudio de variables que afectan la productividad en el negocio de abarrotes al

menudeo, W. S. Good usa el valor agregado por hora de trabajo para medir la

productividad de tiendas de abarrotes al menudeo. Él define el “valor agregado” como

el “excedente [dinero generado por el negocio] disponible para pagar mano de obra,

muebles accesorios y equipo”. Los datos de acuerdo con la relación del valor

agregado por hora de trabajo Y y el tamaño X de la tienda de abarrotes descrita en el

artículo de Good para diez tiendas de abarrotes ficticias se muestran enseguida. Se

establecerá un modelo para relacionar Y con X.

Datos en relación con el tamaño de tienda y el valor agregado

Tienda Valor agregado

por hora de trabajo

Tamaño de la tienda

(miles de pies cuadrados)

Page 15: Estadistica y pronostico para la toma de decisiones

Maestros Online www.maestronline.com

Y X

1 6.08 23.0

2 5.40 14.0

3 5.51 27.2

4 5.09 12.4

5 4.92 33.9

6 3.94 9.8

7 6.11 22.6

8 5.16 17.5

9 5.75 27.0

10 5.60 21.1

a. Realiza un diagrama de dispersión de los datos para Y contra X.

b. Calcula las rectas de mínimos cuadrados para Y contra X.

c. Obtén una gráfica de residuales contra el valor ajustado de Y, ya sea por medio

de Minitab. Observa la gráfica. ¿Qué patrón parecen seguir los datos? Éste es un

ejemplo de análisis de residuales.

2. En un experimento con conejos se tomaron en cuenta las siguientes variables:

Y: Proporción del peso final al peso inicial.

X: Gramos diarios de alimento por kg de peso inicial.

Proporción de peso

final al

peso inicial

Y

Gramos diarios

de alimento por kg

de peso inicial

X

Proporción de peso final

al

peso inicial

Y

Gramos diarios de

alimento por kg de

peso

inicial

X

0.91 10 1.16 33

0.88 15 0.96 35

0.90 18 1.08 36

0.79 19 1.13 37

0.94 20 1.00 39

0.88 21 1.10 42

Page 16: Estadistica y pronostico para la toma de decisiones

Maestros Online www.maestronline.com

0.95 21 1.11 45

0.97 24 1.18 54

0.88 25 1.26 56

1.01 27 1.29 56

0.95 28 1.36 59

0.95 30 1.40 59

1.05 30 1.32 60

1.05 31 1.47 64

a. Realiza un diagrama de dispersión de los datos para Y contra X.

b. Calcula las rectas de mínimos cuadrados para Y contra X.

c. Prueba la hipótesis de que la pendiente es cero. Realiza todas las etapas de la

prueba de hipótesis (α = 0.01).

d. Calcula las predicciones Ŷ para los siguientes valores de X0: 0, 5, 15, 25, 30, 35.5,

39, 45, 60, 70, 80, 90.

Calcula el intervalo de confianza de los valores particulares de Y para los valores dados

de X0 del inciso anterior.

Realiza los siguientes ejercicios (utiliza Excel o un paquete de software estadístico como

Minitab).

3. Una empresa ha estado buscando los factores que influyen en la cantidad de acero

(en millones de toneladas) que puede vender cada año. La administración sospecha

que los siguientes son los factores principales: la tasa anual de inflación del país, el

precio promedio por tonelada de acero importado que acota los precios (en dólares) y

el número de automóviles (en millones) que los fabricantes de autos planean producir

ese año. Se recolectaron los datos de los últimos siete años:

Millones

de tons.

vendidas

Y

Tasa de

inflación X1

Cota de Importaciones

X2

Número de

automóviles (millones) X3

4.2 3.1 3.10 6.2

3.1 3.9 5.00 5.1

4.0 7.5 2.20 5.7

Page 17: Estadistica y pronostico para la toma de decisiones

Maestros Online www.maestronline.com

4.7 10.7 4.50 7.1

4.3 15.5 4.35 6.5

3.7 13.0 2.60 6.1

3.5 11.0 3.05 5.9

a. Estima la ecuación de regresión múltiple.

b. Interpreta los coeficientes de regresión estimados.

4. Se llevó a cabo un conjunto de ensayos experimentales para determinar una forma de

predecir el tiempo de cocimiento en minutos Y a varios niveles de amplitud del horno,

pies X1 y temperatura de cocción, grados Celsius X2. Los datos obtenidos fueron

registrados como se muestra a continuación:

Tiempo de

cocimiento

Y

Niveles de amplitud

del horno, pies X1

Temperatura

en grados Cº

X2

6.40 1.32 1.15

15.05 2.69 3.40

18.75 3.56 4.10

30.25 4.41 8.75

44.85 5.35 14.82

48.94 6.20 15.15

51.55 7.12 15.32

61.50 8.87 18.18

100.44 9.80 35.19

111.42 10.65 40.40

a. Estima e interpreta los coeficientes de la ecuación de regresión lineal múltiple.

b. Pronostica el tiempo de cocimiento cuando el nivel de amplitud del horno es de 5

pies y la temperatura de cocción es de 20 grados Celsius.

b. El supervisor de una empresa está examinando la relación existente entre la

calificación que obtiene un empleado en una prueba de aptitud, su experiencia previa

y el éxito en el trabajo. Se estudia y se pondera la experiencia de un empleado en

Page 18: Estadistica y pronostico para la toma de decisiones

Maestros Online www.maestronline.com

trabajos anteriores y se obtiene una calificación entre 2 y 12. La medida del éxito en el

empleo se basa en un sistema de puntuación que incluye producción total y eficiencia,

con valor máximo posible de 50. El supervisor tomó una muestra de seis empleados

con menos de un año de antigüedad, y obtuvo lo siguiente:

Evaluación

del

desempeño

Y

Resultado de la

prueba

de aptitud X1

Experiencia en

trabajos

anteriores (años) X2

28 74 5

33 87 11

21 69 4

40 93 9

38 71 7

46 97 10

a. Estima e interpreta los coeficientes de la ecuación de regresión lineal múltiple.

b. Si un empleado obtuvo 83 puntos en la prueba de aptitud y tenía una experiencia

en trabajos anteriores de 7 años, ¿qué evaluación de desempeño puede esperar?

Actividad 5: ¿Existe relación entre la cantidad de

Kilómetros y los caballos de fuerza y el peso

total?

Instrucciones:

Revisa la siguiente información y resuelve lo que se indica.

1. Se tomó una muestra de 20 automóviles con relación al número de kilómetros por litro (Y),

caballos de fuerza X1 y peso total en kg X2.

Kilómetros por litro, Y

Caballos de Fuerza,

X1

Peso en kg X2

Page 19: Estadistica y pronostico para la toma de decisiones

Maestros Online www.maestronline.com

19 67 1844

19 50 1998

17 62 1752

16 69 1980

16 66 1797

15 63 2199

15 90 2404

14 99 2611

13 63 3236

12 91 2606

11 94 2580

11 88 2507

11 124 2922

10 97 2434

9 114 3248

9 102 2812

8 114 3382

8 142 3197

7 153 4380

7 139 4036

a. Estima e interpreta los coeficientes de la ecuación de regresión lineal múltiple.

b. Si un vehículo tiene 92 caballos de fuerza y un peso de 1750 kg ¿cuál será el número

de kilómetros por litro que se esperaría?

3. En un experimento con conejos se hizo variar la cantidad de alimento administrado, y

además se les añadió 1 g diario de colesterol en la dieta durante varias semanas. La

cantidad de alimento X está expresado como gramos diarios por kg de peso al inicio del

experimento, y el colesterol Y al final del experimento en mg. Los datos se presentan a

continuación:

Cantidad de alimento, g

X

Colesterol, mg

Y

Cantidad de alimento, g

X

Colesterol, mg

Y

10 313 33 677

15 370 35 151

Page 20: Estadistica y pronostico para la toma de decisiones

Maestros Online www.maestronline.com

18 424 36 280

19 356 37 245

20 310 39 396

21 349 42 278

21 365 45 297

24 245 54 224

25 373 56 346

27 395 56 141

28 156 59 139

30 243 59 424

30 150 60 316

31 463 64 379

a. Estimen la ecuación de regresión.

b. Calculen las predicciones para los siguientes valores de X0: 11, 12, 15, 25, 30,

35.5, 39, 45, 60, 70, 80, 90.

c. Obtengan los intervalos de confianza al 99 para cada valor de Y para los

diferentes valores de X0.

Ejercicio 1

1. La energía eléctrica consumida Y cada mes por una planta química se considera

relacionada con la temperatura ambiente promedio en grados Fahrenheit X1, número de

días al mes X2, la pureza promedio del producto en porciento X3 y las toneladas obtenidas

del producto X4. Se dispone de los datos históricos del año anterior, lo cuales se presentan

enseguida:

Y

Temperatura en

grados Fahrenheit

X1

Días

X2

Porcentaje de

pureza

X3

Toneladas

de producto

X4

240 25 24 91 100

236 31 21 90 95

290 45 24 88 110

274 60 25 87 88

301 65 25 91 94

Page 21: Estadistica y pronostico para la toma de decisiones

Maestros Online www.maestronline.com

316 72 26 94 99

300 80 25 87 97

296 84 25 86 96

267 75 24 88 110

276 60 25 91 105

288 50 25 90 100

261 38 23 89 98

a. Estima e interpreta los coeficientes de la ecuación de regresión lineal múltiple.

b. Interpreta los coeficientes de regresión en el contexto del problema.

c. Prueba la significancia global del modelo de regresión múltiple; realiza todas las

etapas de una prueba de hipótesis.

d. Prueba la significancia de los coeficientes de regresión individuales; realiza todas las

etapas de una prueba de hipótesis para cada uno de los coeficientes.

e. Calcula e interpreta R2 en el contexto del problema.

f. Calcula el error estándar de estimación.

g. Pronostica la energía eléctrica consumida Y cuando la temperatura ambiente

promedio X1 es de 30, el número de días al mes X2 es de 25 grados Fahrenheit, la

pureza promedio del producto en porciento X3 es de 92 y las toneladas obtenidas del

producto X4 es de 95.

h. Calcula R2.

i. Construye un intervalo de confianza para las pendientes de la población β1, β2 , β3 y β4.

Ejercicio 2

2. Un negocio de ventas por catálogo de computadoras

personales, software y hardware mantiene un almacén centralizado para la distribución de

los productos ordenados. La administración examina el proceso de distribución y está

interesada en examinar los factores que afectan los costos. En la actualidad, se cobra una

pequeña cuota por manejo, independiente del monto de la orden. Se recolectaron datos

de los últimos 24 meses, que indican los costos de distribución Y, las ventas X1 y el

número de órdenes recibidas X2. Los resultados son los siguientes:

Costo de

Distribución

(miles de dólares)

Y

Ventas

(miles de

dólares)

X1

Órdenes

X2

Page 22: Estadistica y pronostico para la toma de decisiones

Maestros Online www.maestronline.com

52.95 386 4015

71.66 446 3806

85.58 512 5309

63.69 401 4262

72.81 457 4296

68.44 458 4097

52.46 301 3213

70.77 484 4809

82.03 517 5237

74.39 503 4732

70.84 535 4413

54.08 353 2921

62.98 372 3977

72.30 328 4428

58.99 408 3964

79.38 491 4582

94.44 527 5582

59.74 444 3450

90.50 623 5079

93.24 596 5735

69.33 463 4269

53.71 389 3708

89.18 547 5387

66.80 415 4161

Con base en los resultados obtenidos:

a. Estima e interpreta los coeficientes de la ecuación de regresión lineal múltiple.

b. Interpreta los coeficientes de regresión en el contexto del problema.

Page 23: Estadistica y pronostico para la toma de decisiones

Maestros Online www.maestronline.com

c. Prueba la significancia global del modelo de regresión múltiple; realiza todas las etapas de

una prueba de hipótesis.

d. Prueba la significancia de los coeficientes de regresión individuales. Realiza todas las

etapas de una prueba de hipótesis para cada uno de los coeficientes.

e. Calcula e interpreta R2 en el contexto del problema.

f. Calcula el error estándar de estimación.

g. Pronostica los costos de distribución mensuales promedio para el almacén cuando las

ventas son de 400,000 dólares y el número de órdenes es de 4,500.

h. Calcula R2ajustada.

i. Construye un intervalo de confianza para las pendientes de la población (β1 y β2).

Ejercicio 3

3. Una cadena de comida rápida ha experimentado un cambio importante en sus ventas

como resultado de una campaña de publicidad exitosa. En consecuencia, la gerencia

ahora necesita un nuevo modelo de regresión para sus ventas. Los siguientes datos se

recolectaron en las doce semanas posteriores al inicio de la campaña de publicidad.

Tiempo

Semanas

(X)

Ventas

(miles de dólares)

(Y)

1 4,618

2 3,741

3 5,836

4 4,367

5 5,118

6 8,887

7 19,746

8 34,215

9 50,306

10 65,717

11 86,434

12 105,464

a. Usa Excel o Minitab para determinar la ecuación que mejor se ajuste a sus ventas.

b. Encuentra el coeficiente de determinación e interprétalo en el contexto del problema.

Page 24: Estadistica y pronostico para la toma de decisiones

Maestros Online www.maestronline.com

c. ¿Estás satisfecho con el modelo como pronosticador de ventas Y? Explica. Realiza

todas las etapas de una prueba de hipótesis con α = 0.05.

d. Transforma la variable independiente X2, luego corre de nuevo el modelo con X y

X2 como variables explicativas. ¿Es este modelo cuadrático un mejor ajuste para los

datos? Explica. Realiza todas las etapas de una prueba de hipótesis con α = 0.05.

e. Encuentra el coeficiente de determinación e interprétalo en el contexto del problema.

Compáralo con el obtenido en el inciso b, ¿cuál modelo prefieres?, ¿por qué?

Revisa la siguiente información nutricional de las ensaladas:

1. Enseguida se presentan las siguientes variables que se registraron en diferentes tipos de

ensaladas. Las variables son:

a. Y: Calorías

b. X1: Grasa (g)

c. X2:Carbohidratos (g)

d. X3: Proteínas (g)

Ensalada

(porciones

de 100 g)

Grasa (g) X1 Carbohidratos (g) X2 Proteínas (g) X3 Calorías

Y

César 14.7 6.52 5.03 170

Atún 11.02 6.96 14.27 184

Atún con queso 14.72 6.87 14.44 217

Atún con huevo 12.93 6.96 13.71 196

Macarrones o pasta 10.63 22.98 3.76 202

Macarrones u otra pasta con pollo 13.34 15.00 10.11 221

Macarrones u otra pasta con atún 9.14 19.49 7.07 18.9

Ensalada de huevo 30.26 1.93 9.20 318

Ensalada de papas 8.20 11.17 2.68 143

Ensalada de papas con huevo 7.05 15.96 2.77 136

Ensalada de papas estilo alemán 1.24 16.66 2.52 88

Información obtenida de http://www.fatsecret.cl/.../ solo para fines educativos.

2. Estos datos se deben ingresar a Excel o Minitab y llevar a cabo lo siguiente:

a. Estima e interpreta en el contexto del problema los coeficientes de la ecuación de

regresión múltiple.

Page 25: Estadistica y pronostico para la toma de decisiones

Maestros Online www.maestronline.com

b. Prueben la significancia de los coeficientes de regresión individuales. Realicen todas

las etapas de una prueba de hipótesis para cada uno de los coeficientes.

c. Calculen e interpreten R2 en el contexto del problema.

d. Calculen el error estándar de estimación.

e. Estimen la cantidad promedio de calorías cuando el contenido de grasa es de 50 g, la

cantidad de carbohidratos es de 10 g y la cantidad de proteínas es de 8 g.

f. Calculen R2ajustada.

g. Construyan un intervalo de confianza para las pendientes de la población (β1, β2 y β3).

Ejercicio 1

1. Un negocio de ventas por catálogo de computadoras

personales, software y hardware mantiene un almacén centralizado para la distribución de

los productos ordenados. La administración examina el proceso de distribución y está

interesada en examinar los factores que afectan los costos. En la actualidad, se cobra una

pequeña cuota por manejo, independiente del monto de la orden. Se recolectaron datos

de los últimos 24 meses que indican los costos de distribución Y, las ventas X1 y el

número de órdenes recibidas X2. Los resultados son los siguientes:

Costo de

Distribución

(miles de dólares)

Y

Ventas

(miles de dólares)

X1

Órdenes

X2

52.95 386 4015

71.66 446 3806

85.58 512 5309

63.69 401 4262

72.81 457 4296

68.44 458 4097

52.46 301 3213

70.77 484 4809

82.03 517 5237

74.39 503 4732

70.84 535 4413

54.08 353 2921

62.98 372 3977

Page 26: Estadistica y pronostico para la toma de decisiones

Maestros Online www.maestronline.com

72.30 328 4428

58.99 408 3964

79.38 491 4582

94.44 527 5582

59.74 444 3450

90.50 623 5079

93.24 596 5735

69.33 463 4269

53.71 389 3708

89.18 547 5387

66.80 415 4161

a. Realiza una regresión múltiple.

b. Prueba la significancia del modelo de regresión múltiple; realiza todas las etapas de

una prueba de hipótesis.

c. Prueba la significancia de los coeficientes de regresión individuales. Realiza todas las

etapas de una prueba de hipótesis para cada uno de los coeficientes.

d. Determina el VIF para cada variable explicativa en el modelo. ¿Existe alguna razón

para sospechar que existe multicolinealidad?

Ejercicio 2

2. Una organización de consumidores desea desarrollar un modelo para predecir el

rendimiento de gasolina de automóvil, medido en cantidad de millas recorridas [millas por

galón (mpg)] de acuerdo a los caballos de fuerza del motor y el peso del auto en kg. Se

seleccionó una muestra de 50 modelos con los siguientes resultados:

mpg Y Caballos de fuerza X1 Peso X2

43.1 48 1985

19.9 110 3365

19.2 105 3535

17.7 165 3445

18.1 139 3205

Page 27: Estadistica y pronostico para la toma de decisiones

Maestros Online www.maestronline.com

20.3 103 2830

21.5 115 3245

16.9 155 4360

15.5 142 4054

18.5 150 3940

27.2 71 3190

41.5 76 2144

46.6 65 2110

23.7 100 2420

27.2 84 2490

39.1 58 1755

28 88 2605

24 92 2865

20.2 139 3570

20.5 95 3155

28 90 2678

34.7 63 2215

36.1 66 1800

35.7 80 1915

20.2 85 2965

23.9 90 3420

29.9 65 2380

30.4 67 3250

36 74 1980

22.6 110 2800

36.4 67 2950

27.5 95 2560

33.7 75 2210

Page 28: Estadistica y pronostico para la toma de decisiones

Maestros Online www.maestronline.com

44.6 67 1850

32.9 100 2615

38 67 1965

24.2 120 2930

38.1 60 1968

39.4 70 2070

25.4 116 2900

31.3 75 2542

34.1 68 1985

34 88 2395

31 82 2720

27.4 80 2670

22.3 88 2890

28 79 2625

17.6 85 3465

34.4 65 3465

20.6 105 3380

a. Realiza un modelo de regresión lineal múltiple.

b. Prueba la significancia del modelo de regresión múltiple; realiza todas las etapas de

una prueba de hipótesis.

c. Prueba la significancia de los coeficientes de regresión individuales. Realiza todas las

etapas de una prueba de hipótesis para cada uno de los coeficientes.

d. Determina el factor de inflación de varianza (VIF) para cada variable explicativa en el

modelo. ¿Existe alguna razón para sospechar que existe multicolinealidad?

Ejercicio 3

1. El director de operaciones de transmisión de una estación de televisión desea estudiar el

aspecto de las “horas de espera” en la que los artistas gráficos sindicalizados se les paga

por no realizar actividades. Las variables a considerar son:

a. Horas de espera (Y): número total de horas por semana

b. Personal presente total (X1): total semanal de días-persona los 7 días a la semana

Page 29: Estadistica y pronostico para la toma de decisiones

Maestros Online www.maestronline.com

c. Horas remotas (X2): número total de horas trabajadas por empleados fuera de la

planta central

d. Los resultados para un periodo de 26 semanas son:

Horas en espera

Y

Personal presente

X1

Horas remotas

X2

245 338 414

177 333 598

271 358 656

211 372 631

196 339 528

135 289 409

195 334 382

118 293 399

116 325 343

147 311 338

154 304 353

146 312 289

115 283 388

161 307 402

274 322 151

245 335 228

201 350 271

183 339 440

237 327 475

175 328 347

152 319 449

188 325 336

188 322 267

197 317 235

Page 30: Estadistica y pronostico para la toma de decisiones

Maestros Online www.maestronline.com

261 315 164

232 331 270

e. Ajusta un modelo de regresión lineal múltiple.

f. Prueba la significancia del modelo de regresión múltiple; realiza todas las etapas de

una prueba de hipótesis.

g. Prueba la significancia de los coeficientes de regresión individuales; realiza todas las

etapas de una prueba de hipótesis para cada uno de los coeficientes.

h. Determina el factor de inflación de varianza (VIF) para cada variable explicativa en el

modelo. ¿Existe alguna razón para sospechar que existe multicolinealidad?

Analiza y resuelve los siguientes ejercicios, sin olvidar incluir los procedimientos utilizados que

te llevaron a la respuesta.

Concluye con una reflexión sobre la utilización de la regresión y correlación en la vida

cotidiana. ¿Qué tipo de problemas pudieras resolver con los conocimientos adquiridos en este

módulo?

1. ¿Existe alguna relación entre el tiempo en minutos que se utiliza para llegar a un centro

comercial y la distancia desde la casa en donde tú vives? Entrevista a 20 compañeros y

pregúntales el tiempo que tardan en llegar al centro comercial y la distancia a su casa.

Después denomina a la variable tiempo en minutos como Y y a la distancia en km como X.

a. Contesta lo siguiente:

i. Realiza el diagrama de dispersión y describe el comportamiento de ambas

variables. ¿Qué clase de relación crees que existe entre estas dos variables? ¿A

mayor distancia es mayor el tiempo?

ii. Calcula la recta de regresión de mínimos cuadrados.

iii. ¿Existe evidencia que indique que a mayor distancia es mayor el tiempo en

llegar? Prueba la significancia de la recta de regresión con un nivel de

significancia α = 0.01.

iv. ¿Es significativa esta regresión? Realiza todas las etapas de una prueba de

hipótesis. Concluye en el contexto del problema.

v. Pronostica el tiempo en llegar al centro comercial si la distancia es de 3, 4 y 6

kilómetros de distancia.

vi. Calcula el coeficiente de correlación.

vii. Determina e interpreta el coeficiente de determinación en el contexto del

problema.

viii. Realiza un breve resumen de los hallazgos.

Page 31: Estadistica y pronostico para la toma de decisiones

Maestros Online www.maestronline.com

2. ¿Existe relación entre el peso de una persona y la medida de su cintura en centímetros?

Selecciona 10 personas del género masculino y 10 personas del género femenino y

pídeles que te den su peso en kilogramos y la medida de su cintura en centímetros.

Posteriormente denomina a la variable peso como Y y a la medida de la cintura como X.

a. Contesta lo siguiente:

i. Realiza el diagrama de dispersión y describe el comportamiento de ambas

variables. ¿Qué clase de relación crees que existe entre estas dos variables? ¿A

mayor medida de la cintura es mayor el peso?

ii. Calcula la recta de regresión de mínimos cuadrados. ¿Existe evidencia que

indique que a mayor medida de la cintura es mayor el peso? Prueba la

significancia de la recta de regresión con un nivel de significancia α = 0.01. ¿Es

significativa esta regresión? Realiza todas las etapas de una prueba de hipótesis.

Concluye en el contexto del problema.

iii. Pronostica el peso si las medidas de cintura son de 66, 80 y 86 centímetros.

iv. Calcula el coeficiente de correlación.

v. Determina e interpreta el coeficiente de determinación en el contexto del

problema.

vi. Realiza un breve resumen de los hallazgos.

3. Busca información de 20 casas en venta en donde las variables son Y (metros de

construcción) y X (metros de terreno), y realiza lo que se te indica:

a. Contesta lo siguiente:

i. Realiza el diagrama de dispersión y describe el comportamiento de ambas

variables.

ii. ¿Qué clase de relación crees que existe entre estas dos variables?

iii. Calcula la recta de regresión de mínimos cuadrados.

iv. Prueba la significancia de la recta de regresión con un nivel de significancia α =

0.01.

v. ¿Es significativa esta regresión? Explica. Concluye en el contexto del problema.

Realiza todas las etapas de una prueba de hipótesis.

vi. Pronostica los metros de construcción cuando los metros de terreno son de 90,

100 y 150 metros.

vii. Calcula el coeficiente de correlación.

viii. Determina e interpreta el coeficiente de determinación en el contexto del

problema.

ix. Realiza un breve resumen de los hallazgos.

4. Revisa la siguiente información tomada de la sección de avisos de ocasión.

Precio

(miles de pesos)

Metros de

terreno X1

Metros de

construcción X2

Número de

recámaras X3

Page 32: Estadistica y pronostico para la toma de decisiones

Maestros Online www.maestronline.com

Y

2700 288 378 4

1895 160 252 4

1397 230 252 4

1795 234 167 2

650 72 124 4

850 128 262 4

3875 188 246 4

4300 390 380 3

11850 885 775 4

11900 885 775 3

3250 150 233 3

6700 406 420 3

5499 320 390 4

4250 170 244 4

4250 170 233 3

470 160 127 3

500 90 73 2

550 91 73 2

650 110 90 2

550 90 74 2

620 172 76 2

1700 189 374 4

2330 300 330 4

1600 136 140 3

1100 144 290 3

Información obtenida de: http://www.avisosdeocasion.com solo para fines educativos.

Utiliza Excel o cualquier otro paquete estadístico como Minitab para realizar lo siguiente:

Page 33: Estadistica y pronostico para la toma de decisiones

Maestros Online www.maestronline.com

a. Estima el modelo de regresión múltiple e interpreta los coeficientes de la ecuación de

regresión lineal múltiple.

b. Prueba la significancia global del modelo de regresión múltiple; realiza todas las etapas de

una prueba de hipótesis.

c. Pronostica el precio para los siguientes datos:

Metros de

terreno

( X1 )

Metros de

construcción

(X2 )

Número de

recámaras

( X3 )

180 390 4

200 250 3

230 200 4

250 180 2

100 120 3

d. Prueba la significancia de los coeficientes de regresión individuales. Realiza todas las

etapas de una prueba de hipótesis para cada uno de los coeficientes.

e. Calcula el error estándar de estimación.

f. Construye un intervalo de confianza para las pendientes de la población (β1, β2 y β3).

g. Calcula e interpreta R2 en el contexto del problema.

h. Calcula R2ajustada.

i. Determina el Factor de Inflación de Varianza (VIF) para cada variable explicativa en el

modelo. ¿Existe alguna razón para sospechar que existe multicolinealidad?

j. Finalmente prepara un documento presentando un resumen de tus hallazgos.