ESTADISTICA INFERENCIAL II.pdf

40
ESTADISTICA INFERENCIAL II

Transcript of ESTADISTICA INFERENCIAL II.pdf

Page 1: ESTADISTICA INFERENCIAL II.pdf

ESTADISTICA INFERENCIAL II

ALBERTO GARCIA ESPINOSA

Page 2: ESTADISTICA INFERENCIAL II.pdf

OBJETIVOS GENERALES DEL CURSO

● Conocer y aplicar técnicas de diseño experimental, con el

objeto de tomar decisiones para analizar, evaluar y mejorar

procesos logísticos e industriales.

● Adquirir criterios y herramientas de diseño experimental para

planificar experimentos eficazmente en los procesos logísticos

e industriales.

● Desarrollar las habilidades para la aplicación de las

herramientas y procedimientos habituales del análisis

estadístico para la obtención de conclusiones válidas.

Page 3: ESTADISTICA INFERENCIAL II.pdf

OBJETIVOS GENERALES DEL CURSO

● Conocer y aplicar las series de tiempo en sistemas logísticos e

industriales para determinar los pronósticos para la planeación

de los recursos necesarios para responder a los cambios de la

demanda.

● Identificar, aplicar y analizar mediante técnicas de regresión,

para evaluar los procesos de soporte en la toma de decisiones

en la solución de problemas.

Page 4: ESTADISTICA INFERENCIAL II.pdf

TEMARIO

● UNIDAD I. Regresión lineal simple y múltiple.

● UNIDAD II. Diseño de experimentos de un factor.

● UNIDAD III. Diseño de bloques.

● UNIDAD IV. Conceptos básicos en diseños factoriales.

● UNIDAD V. Series de tiempo.

Page 5: ESTADISTICA INFERENCIAL II.pdf

FUENTES DE INFORMACION

● Douglas C. Montgomery, Design and Analysis of Experiments,

6th. Ed. Wiley 2004.

● Mendenhall W., Introducción a la probabilidad y la estadística,

Wadsworth, Inc., 1982.

● Murray R. Spiegel, Estadística, 2da. Ed. McGraw-Hill, 1991.

● Fuenlabrada Samuel, Probabilidad y estadística, McGraw-Hill,

México, 2004.

Page 6: ESTADISTICA INFERENCIAL II.pdf

CRITERIOS DE EVALUACIÓN

● Examen--------------------------------50%

● Asistencia-----------------------------10%

● Tareas----------------------------------10%

● Participaciones-----------------------10%

● Portafolio de evidencias-------------20%

Page 7: ESTADISTICA INFERENCIAL II.pdf

UNIDAD II. Diseño de experimentos de un factor

● 2.1 Familia de diseños para comparar tratamientos

● 2.2 El modelo de efectos fijos

● 2.3 Diseño completamente aleatorio y ANOVA

● 2.4 Comparaciones o pruebas de rangos múltiples

● 2.5 Verificación de los supuestos del modelo

● 2.6 Uso de un software estadístico

Page 8: ESTADISTICA INFERENCIAL II.pdf

UNIDAD II. Diseño de experimentos de un factor

Experimentos con un solo factor

En este tipo de diseño de experimento se considera un sólo factor de

interés y el objetivo es comparar más de dos tratamientos, con el fin

de elegir la mejor alternativa entre las varias que existen, o por lo

menos para tener una mejor comprensión del comportamiento de la

variable de interés en cada uno de los distintos tratamientos.

Puede ser de interés comparar tres o más máquinas, varios

proveedores, cuatro procesos, tres materiales, cinco dosis de un

fármaco, etc.

Es obvio que, al hacer tales comparaciones, existe un interés y un

objetivo claro.

Page 9: ESTADISTICA INFERENCIAL II.pdf

UNIDAD II. Diseño de experimentos de un factor

Ejemplo:

Una comparación de cuatro dietas de alimentación en la que se utilizan

ratas de laboratorio, se hace con el fin de estudiar si alguna dieta que

se propone es mejor o igual que las que ya existen; en este caso, la

variable de interés es el peso promedio alcanzado por cada grupo de

animales después de ser alimentado con la dieta que le toco.

Page 10: ESTADISTICA INFERENCIAL II.pdf

UNIDAD II. Diseño de experimentos de un factor

Por lo general, el interés del experimentador está centrado en comparar

los tratamientos en cuanto a sus medias poblacionales, sin olvidar

que también es importante compararlos con respecto a sus

varianzas. Así, desde el punto de vista estadístico, la hipótesis

fundamental a probar cuando se comparan varios tratamientos es:

H0 = µ1 = µ2 = ... µn

H1 = µi ≠ µj para algún i ≠ j

Con la cual se quiere decidir si los tratamientos son iguales

estadísticamente en cuanto a sus medias, frente a la alternativa de

que al menos dos de ellos son diferentes.

Page 11: ESTADISTICA INFERENCIAL II.pdf

UNIDAD II. Diseño de experimentos de un factor

La estrategia natural para resolver este problema es obtener una

muestra representativa de mediciones en cada uno de los

tratamientos, y construir un estadístico de prueba para decidir el

resultado de dicha comparación.

Se podría pensar que una forma de probar la hipótesis nula de es

mediante la prueba T de Student aplicadas a todos los posibles pares

de medias; sin embargo, esta manera de proceder incrementaría de

manera considerable el error tipo I (rechazar H0 siendo verdadera).

Page 12: ESTADISTICA INFERENCIAL II.pdf

UNIDAD II. Diseño de experimentos de un factor

Ejemplo:

En el caso de comparar varias máquinas, si cada máquina es manejada

por un operador diferente y se sabe que éste tiene una influencia en

el resultado, entonces, es claro que el factor operador debe tomarse

en cuenta si se quiere comparar a las máquinas de manera justa.

Un operador más hábil puede ver a su máquina (aunque ésta sea la

peor) como la que tiene el mejor desempeño, lo que impide una

comparación adecuada de los equipos.

Para evitar este sesgo habría dos maneras de anular el posible efecto

del factor operador:

Page 13: ESTADISTICA INFERENCIAL II.pdf

UNIDAD II. Diseño de experimentos de un factor

● Utilizando el mismo operador en las cuatro máquinas. Esta estrategia

no es aconsejable, ya que al utilizar el mismo operador, se elimina el

efecto del factor operador, pero restringe la validez de la

comparación a dicho operador, y es posible que el resultado no se

mantenga al utilizar otros operadores.

● Cada operador trabaje durante el experimento con cada una de las

máquinas, esta estrategia es más recomendable, ya que al utilizar

todos los operadores con todas las máquinas permite tener

resultados de la comparación que son válidos para todos los

operadores.

● Esta última de manera nulificar el efecto de operadores, recibe el

nombre de Bloqueo.

Page 14: ESTADISTICA INFERENCIAL II.pdf

UNIDAD II. Diseño de experimentos de un factor

Factores de bloqueo.

Son factores adicionales al factor de interés que se incorporan de

manera explícita en un experimento comparativo, para estudiar de

manera más adecuada y eficaz al factor de interés.

NOTA: Cuando se comparan varias máquinas, manejadas por

operadores diferentes, es pertinente incluir explícitamente al factor

operadores (bloques) para lograr el propósito del estudio. También se

podrían controlar el tipo de material, lotes, tipo de producto, día,

turno, etc. Se controlan factores que por conocimiento del proceso o

experiencia previa, se sabe que pueden afectar en forma sensible el

resultado de la comparación

Page 15: ESTADISTICA INFERENCIAL II.pdf

UNIDAD II. Diseño de experimentos de un factor

En el campo de la industria es frecuente hacer experimentos o pruebas

con la intención de resolver un problema o comprobar una idea

(conjetura, hipótesis); por ejemplo, hacer algunos cambios en los

materiales, métodos o condiciones de operación de un proceso,

probar varias temperaturas en una máquina hasta encontrar la que

de el mejor resultado o crear un nuevo material con la intención de

lograr mejoras o eliminar algún problema.

Sin embargo, es común que estas pruebas o experimentos se hagan

sobre la marcha, con base en el ensayo y error, apelando a la

experiencia y a la intuición, en lugar de seguir un plan experimental

adecuado que garantice una buena respuesta a las interrogantes

planteadas.

Page 16: ESTADISTICA INFERENCIAL II.pdf

UNIDAD II. Diseño de experimentos de un factor

Algo similar ocurre con el análisis de los datos experimentales, donde

más que hacer un análisis riguroso de toda la información obtenida y

tomar en cuenta la variación, se realiza un análisis informal, ¨intuitivo¨

Es tal el poder de la experimentación que, en ocasiones, se logra

mejoras a pesar de que el experimento se hizo con base en el

ensayo y error.

Sin embargo, en situaciones de cierta complejidad no es suficiente

aplicar este tipo de experimentación, por lo que es mejor proceder

siempre en una forma eficaz que garantice la obtención de las

respuestas a las interrogantes planteadas en un lapso corto de

tiempo y utilizando pocos recursos.

Page 17: ESTADISTICA INFERENCIAL II.pdf

UNIDAD II. Diseño de experimentos de un factor

El diseño estadístico de experimentos es precisamente la forma más

eficaz de hacer pruebas. El diseño de experimentos consiste en

determinar cuáles pruebas se deben realizar y de qué manera, para

obtener datos que, al ser analizados estadísticamente, proporcionen

evidencias objetivas que permitan responder las interrogantes

planteadas, y de esa manera clarificar los aspectos inciertos de un

proceso, resolver un problema o lograr mejoras.

Page 18: ESTADISTICA INFERENCIAL II.pdf

UNIDAD II. Diseño de experimentos de un factor

Algunos problemas típicos que pueden resolverse con el diseño y el

análisis de experimentos son los siguientes:

1. Comparar a dos o más materiales con el fin de elegir al que mejor

cumple los requerimientos.

2. Comparar varios instrumentos de medición para verificar si trabajan

con la misma precisión y exactitud.

3. Determinar los factores (las x vitales) de un proceso que tienen

impacto sobre una o más características del producto final.

Page 19: ESTADISTICA INFERENCIAL II.pdf

UNIDAD II. Diseño de experimentos de un factor

4. Encontrar las condiciones de operación (temperatura, velocidad,

humedad, por ejemplo) donde se reduzcan los defectos o se logre un

mejor desempeño del proceso.

5. Reducir el tiempo de ciclo del proceso.

6. Hacer el proceso insensible o robusto a oscilaciones de variables

ambientales.

7. Apoyar el diseño o rediseño de nuevos productos o procesos

8. Ayudar a conocer y caracterizar nuevos materiales.

Page 20: ESTADISTICA INFERENCIAL II.pdf

UNIDAD II. Diseño de experimentos de un factor

En general, cuando se requiere mejorar un proceso existen dos

maneras básicas de obtener la información necesaria para ello:

● Observar o monitorear vía herramientas estadísticas, hasta obtener

señales útiles que permitan mejorarlo; se dice que ésta es una

estrategia pasiva.

● La otra manera consiste en experimentar, es decir, hacer cambios

estratégicos y deliberados al proceso para provocar dichas señales

útiles.

Page 21: ESTADISTICA INFERENCIAL II.pdf

UNIDAD II. Diseño de experimentos de un factor

Al analizar los resultados del experimento se obtienen las pautas a

seguir, que muchas veces se concretan en mejoras sustanciales del

proceso.

En este sentido, experimentar es mejor que sentarse a esperar a que el

proceso nos indique por sí solo cómo mejorarlo.

El diseño de experimentos es un conjunto de técnicas activas, en el

sentido de que no esperan que el proceso mande las señales útiles,

sino que éste se ¨manipulan¨ para que proporcione la información

que se requiere para su mejoría.

Page 22: ESTADISTICA INFERENCIAL II.pdf

UNIDAD II. Diseño de experimentos de un factor

El saber diseño de experimentos y otras técnicas estadísticas, en

combinación con conocimientos del proceso, sitúan al responsable

del mismo como un observador perceptivo y proactivo que es capaz

de proponer mejoras y de observar algo interesante (oportunidades

de mejora) en el proceso y en los datos donde otra persona no ve

nada.

Page 23: ESTADISTICA INFERENCIAL II.pdf

2.1 Familia de diseños para comparar tratamientos

Los diseños experimentales más utilizados para comparar tratamientos

son:

1. Diseño completamente al azar (DCA)

2. Diseño en bloque completamente al azar (DBCA)

3. Diseño en cuadro latino (DCL)

4. Diseño en cuadro grecolatino (DCGL)

La diferencia fundamental entre estos diseños es el número de factores

de bloque que incorporan o controlan de forma explícita durante el

experimento.

Page 24: ESTADISTICA INFERENCIAL II.pdf

2.1 Familia de diseños para comparar tratamientos

La comparación de los tratamientos en cuanto a la respuesta media que

logran, en cualquiera de estos diseños, se hace mediante la

hipótesis:

H0 = µ1 = µ2 = ... µn

H1 = µi ≠ µj para algún i ≠ j

que se prueba con la técnica estadística llamada Análisis de Varianza

(ANOVA) con uno, dos, tres o cuatro criterios de clasificación,

dependiendo del número de factores de bloques incorporados al

diseño.

Page 25: ESTADISTICA INFERENCIAL II.pdf

2.1 Familia de diseños para comparar tratamientos

El modelo estadístico que describe el comportamiento de la variable

observada Y en cada diseño, incorpora un término adicional por cada

factor de bloqueo controlado.

Page 26: ESTADISTICA INFERENCIAL II.pdf

2.1 Familia de diseños para comparar tratamientos

De acuerdo con los modelos dados en la tabla, para cada diseño

comparativo se tienen al menos dos fuentes de variabilidad: los

tratamientos o niveles del factor de interés y el error aleatorio. Se

agrega una nueva fuente de variabilidad por cada factor de bloque

que se controla directamente.

Se observa que los diseños suponen que no hay efectos de interacción

entre los factores, lo cual sería lo deseable que ocurra; de no ocurrir

así, tal efecto se recarga al error y el problema de comparación no se

resuelve con éxito.

Un efecto de interacción entre dos factores hace referencia a que el

efecto de cada factor depende del nivel en que se encuentra el otro.

Page 27: ESTADISTICA INFERENCIAL II.pdf

2.2 El modelo de efectos fijos

El modelo de efectos fijos (es cuando se estudian todos los posibles

tratamientos) de análisis de la varianza se aplica a situaciones en las

que el experimentador ha sometido al grupo o material analizado a

varios factores, cada uno de los cuales le afecta sólo a la media,

permaneciendo la "variable respuesta" con una distribución normal.

Este modelo se supone cuando el investigador se interesa únicamente

por los niveles del factor presentes en el experimento, por lo que

cualquier variación observada en las puntuaciones se deberá al error

experimental.

Page 28: ESTADISTICA INFERENCIAL II.pdf

2.2 El modelo de efectos fijos

En caso que los tratamientos tengan efecto, las observaciones Yij se

podrán describir con el modelo estadístico lineal dado por:

La media global µ de la variable de respuesta no se considera una

fuente de variabilidad por ser una constante común a todos los

tratamientos, que hace las veces de punto de referencia con

respecto al cual se comparan las respuestas medias de los

tratamientos.

Page 29: ESTADISTICA INFERENCIAL II.pdf

2.2 El modelo de efectos fijos

Si la respuesta media de un tratamiento particular µ1 es ¨muy diferente¨

de la respuesta media global µ, es un síntoma de que existe un

efecto de dicho tratamiento, ya que como se verá más adelante,

. La diferencia que deben tener las medias entre sí para concluir que

hay un efecto (que los tratamientos son diferentes), nos lo dice el

análisis de varianza (ANOVA).

En la práctica puede suceder que los tratamientos que se desea

comparar sean demasiados como para experimentar con todos.

Cuando esto sucede es conveniente comparar sólo una muestra de

la población de tratamientos.

Page 30: ESTADISTICA INFERENCIAL II.pdf

2.3 Diseño completamente aleatorio y ANOVA

Muchas comparaciones, como las antes mencionadas, se hacen con

base en el diseño completamente al azar (DCA), que es el más

simple de todos los diseños que se utilizan para comparar dos o más

tratamientos, dado que sólo consideran dos fuentes de variabilidad:

los tratamientos y el error aleatorio.

Este diseño se llama completamente al azar porque todas las corridas

experimentales se realizan en orden aleatorio completo. De esta

manera, si durante el estudio se hacen en total N pruebas, éstas se

corren al azar, de manera que los posibles efectos ambientales y

temporales se vayan repartiendo equitativamente entre los

tratamientos.

Page 31: ESTADISTICA INFERENCIAL II.pdf

2.3 Diseño completamente aleatorio y ANOVA

El análisis de la varianza de un criterio (ANOVA de un criterio) es una

metodología para analizar la variación entre muestras y la variación

al interior de las mismas con varianzas, en lugar de rangos. Como

tal, es un método estadístico útil para comparar dos o más medias

poblacionales.

El objetivo del análisis de varianza en el DCA es probar las hipótesis de

igualdad de los tratamientos con respecto a la media de la

correspondiente variable de respuesta:

H0 = µ1 = µ2 = ... = µk

H1 = µ1 ≠ µ2 ≠ al menos para alguna

Page 32: ESTADISTICA INFERENCIAL II.pdf

2.3 Diseño completamente aleatorio y ANOVA

TAREA:

● Cálculo manual tradicional para ANOVA: requiere del cálculo de 2

estimaciones independientes para la varianza poblacional común σ².

Entre muestras (Método entre) y al interior de las muestras (Método

dentro).

● Cálculo simplificado y más práctico para ANOVA: notación de puntos.

● Diagramas de cajas simultáneos (box plots).

Page 33: ESTADISTICA INFERENCIAL II.pdf

2.4 Comparaciones o pruebas de rangos múltiples

El análisis de varianza es un procedimiento poderoso para probar la

homogeneidad de un conjunto de medias. Sin embargo, si

rechazamos la hipótesis nula (H0) y aceptamos la alterna (que no

todas las medias son iguales) aún no sabemos cuáles de las medias

poblacionales son iguales y cuáles son diferentes.

Cuando no se rechaza la H0: µ1 = µ2 = µ3, el objetivo del experimento

está cubierto y la conclusión es que los tratamientos no son

diferentes. Si por el contrario se rechaza H0, y por consiguiente se

acepta la H1: No todas las poblaciones tienen la misma media, es

necesario investigar cuáles tratamientos resultaron diferentes, o

cuáles provocan la diferencia.

Page 34: ESTADISTICA INFERENCIAL II.pdf

2.4 Comparaciones o pruebas de rangos múltiples

Estas interrogantes se responden probando la igualdad de todos los

posibles pares de medias, para lo cual se han propuesto varios

métodos, conocidos como métodos de comparaciones múltiples o

pruebas de rango múltiple.

La diferencia primordial entre los métodos radica en la potencia que

tienen para detectar las diferencias entre las medias. Se dice que

una prueba es más potente si es capaz de detectar diferencias más

pequeñas.

Page 35: ESTADISTICA INFERENCIAL II.pdf

2.4 Comparaciones o pruebas de rangos múltiples

Métodos de comparaciones múltiples o pruebas de rango múltiple:

a) Método de la diferencia mínima significativa de Fisher (método LSD).

b) Método de Tukey

c) Método de Duncan

d) Método de Dunnet

TAREA

Page 36: ESTADISTICA INFERENCIAL II.pdf

2.5 Verificación de los supuestos del modelo

La validez de los resultados obtenidos en cualquier análisis de varianza

queda supeditada a que los supuestos del modelo se cumplan.

Estos supuestos son:

A) Normalidad

B) Varianza constante (igual varianza de los tratamientos)

C) Independencia

Esto es, la respuesta (Y) se debe distribuir de manera normal, con la

misma varianza en cada tratamiento y las mediciones deben ser

independientes.

Page 37: ESTADISTICA INFERENCIAL II.pdf

2.5 Verificación de los supuestos del modelo

Normalidad

Un procedimiento gráfico para verificar el cumplimiento del supuesto de

normalidad de los residuos consiste en graficar los residuos en papel

o en la gráfica de probabilidad normal que se incluye casi en todos

los paquetes estadísticos. Esta gráfica del tipo X-Y tiene las escalas

de tal manera que si los residuos siguen una distribución normal, al

graficarlos tienden a quedar alineados en una línea recta; por lo

tanto, si claramente no se alinean se concluye que el supuesto de

normalidad no es correcto.

Cabe enfatizar el hecho de que el ajuste de los puntos a una recta no

tiene que ser perfecto, dado que el análisis de varianza resiste

pequeñas y moderadas desviaciones al supuesto de normalidad.

Page 38: ESTADISTICA INFERENCIAL II.pdf

2.5 Verificación de los supuestos del modelo

Varianza constante

Una forma de verificar el supuesto de varianza constante (o que los

tratamientos tienen la misma varianza) es graficado los predichos

contra residuos ( ), por lo general va en el eje horizontal y los

residuos en el eje vertical. Si los puntos en esta gráfica se distribuyen

de manera aleatoria en una banda horizontal (sin ningún patrón claro

y contundente), entonces es señal d que se cumple el supuesto de

que los tratamientos tienen igual varianza. Por el contrario, si se

distribuyen con algún patrón claro y contundente, como por ejemplo

una forma de corneta o embudo, entonces es señal de que no se

está cumpliendo el supuesto de varianza constante.

Page 39: ESTADISTICA INFERENCIAL II.pdf

2.5 Verificación de los supuestos del modelo

Independencia

La suposición de independencia en los residuos puede verificarse si se

grafica el orden en que se colectó un dato contra el residuo

correspondiente. De esta manera, si al graficar en el eje horizontal el

tiempo (orden de corrida) y en el eje vertical los residuos, se detecta

una tendencia o patrón no aleatorio claramente definido, esto es

evidencia de que existe una correlación entre los errores y, por lo

tanto, el supuesto de independencia no se cumple. Si el

comportamiento de los puntos es aleatorio dentro de una banda

horizontal, el supuesto se está cumpliendo.

Page 40: ESTADISTICA INFERENCIAL II.pdf

2.5 Verificación de los supuestos del modelo

La violación de este supuesto generalmente indica deficiencias en la

planeación y ejecución del experimento; asimismo, puede ser un

indicador de que no se aplico en forma correcta el principio de

aleatorización, o de que conforme se fueron realizando las pruebas

experimentales aparecieron factores que afectaron la respuesta

observada.

Por ello, en caso de tener problemas con este supuesto, las

conclusiones que se obtienen del análisis son endebles y por ello es

mejor revisar lo hecho y tratar de investigar por qué no se cumplió

con ese supuesto de independencia, a fin de reconsiderar la

situación.