disenio experimentos (1)

download disenio experimentos (1)

of 119

Transcript of disenio experimentos (1)

DISEO DE EXPERIMENTOS. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. Introduccin.(2 hrs). Diseo completamente al azar. (6) Diseo en bloques completos al azar.(4) Diseo en cuadro latino.(4) Arreglo de tratamientos en dos factores.(10) Arreglos de tratamientos multifactorial.(4) Arreglos factoriales dos a la k.(6) Confusin en los arreglos factoriales dos a la k.(6) Bloques incompletos.(4) Factoriales fraccionados.(4) Arreglos Ortogonales de Taguchi.(6) Metodologa de superficie de respuesta.(8).

INTRODUCCION 1. 2. 3. 4. 5. 6. Relacin entre investigacin y estadstica. Objetivo general de la experimentacin. Objetivo de un diseo experimental. Ingredientes de un diseo experimental. Variables y sus relaciones en un diseo experimental. Modelos estadsticos para establecer las relaciones entre variables en un diseo experimental. Relacin entre investigacin y estadstica: La investigacin es una actividad inherente a todo ser humano. En mayor o menor grado desde pequeos se nota la inquietud por investigar ciertos aspectos de inters. Por ejemplo, una de las formas de aprendizaje ms rudimentarias es la prueba y error, en donde la prueba realmente consiste en un experimento para investigar un cierto resultado. Las herramientas de investigacin en algunos casos se van

mejorando e incrementando, en otros no evolucionan y permanecen con las mismas tcnicas rudimentarias de investigacin. A nivel de actividad profesional, en todos los campos, debe ser una actividad de primordial importancia. Por ejemplo, para los mdicos, cada paciente es un sujeto de investigacin, cuyo objetivo es llegar a resolver un problema. Por otro lado, a nivel del campo de la medicina se lleva a cabo una labor muy intensa de investigacin para el desarrollo de nuevos frmacos, nuevas tcnicas quirrgicas, nuevos equipos en el diagnostico y tratamiento de enfermedades, etc. El desarrollo en todos los campos de actividad profesional se atribuyen en gran medida a la aplicacin de los resultados obtenidos a travs de la investigacin. La gran mayora de las investigaciones se llevan a cabo a travs de la aplicacin del mtodo cientfico que incluye los siguientes pasos: 1. 2. 3. 4. 5. 6. Establecer el problema. Formular la hiptesis. Disear el experimento o muestreo. Tomar las observaciones. Interpretar los datos. Concluir.

Este proceso lleva implcitos algunos pasos que son de naturaleza estadstica. Empezando por la formulacin de la hiptesis, punto de primordial importancia para el desarrollo de la investigacin. Una hiptesis estadstica debe incluir el juego de hiptesis que incluye: La hiptesis nula (Ho). La hiptesis alternativa (Ha). La hiptesis alternativa es la correspondiente a la hiptesis de trabajo del investigador, aplicada a una variable de inters, y por ello es la que direcciona el proceso de investigacin en lo referente a las evidencias que el investigador debe colectar y mostrar debidamente procesadas para apoyar su hiptesis.

La hiptesis alternativa es un enunciado en forma de una desigualdad que indica el conjunto de valores que el parmetro, correspondiente a la variable de inters, debe tomar para ser consistente con la hiptesis de trabajo. 1. En base a la desigualdad, las hiptesis alternativas se clasifican como: Ensayos bilaterales o de dos colas, cuando el signo de la desigualdad es diferente de () lo cual implica que la hiptesis alternativa va a ser apoyada en cualquiera de los dos extremos de los valores del parmetro. Este tipo de alternativa se establece siempre que no se tiene una clara idea de la direccin de cambio en el valor del parmetro. 2. Ensayos unilaterales o de una cola, que corresponden a una hiptesis de trabajo unidireccional, de tal manera que pueden ser de cola izquierda (). La hiptesis de cola izquierda implica que el extremo izquierdo de los valores del parmetro apoyan a la hiptesis de trabajo; esto es, entre mas pequeo el valor del parmetro mas consistentes son los resultados con la hiptesis de trabajo. De manera equivalente, en un ensayo de cola derecha, implicara que entre mas alto el valor del parmetro mas se favorece a la hiptesis de trabajo. Hay que hacer notar que la hiptesis alternativa siempre es establecida como una desigualdad, en la que como tal, nunca debe aparecer el signo de la igualdad, y debe ser establecida en trminos de la hiptesis de trabajo. La hiptesis nula es lo contrario a la hiptesis alternativa, por lo que siempre incluye el signo de la igualdad. De esta manera corresponde a la negacin de lo que el investigador desea probar en su investigacin, por lo que esta se considera como verdadera, hasta que se muestran suficientes evidencias que apoyan a la hiptesis de trabajo. La hiptesis nula es una hiptesis de consecuencias estadsticas definidas, es decir, es posible llegar a determinar que se espera del valor del parmetro si la hiptesis nula es verdadera. El mecanismo de una prueba de hiptesis puede ser descrito como una comparacin entre las evidencias colectadas y lo que se

espera bajo la hiptesis nula. Este mecanismo siempre conduce a una toma de decisin basada en probabilidades de riesgos de equivocarse. Para establecer los diferentes escenarios a que puede conducir una toma de decisin considere el siguiente cuadro, en donde las entradas son el estado de naturaleza, es decir lo que realmente es en relacin a la hiptesis nula, y por otro lado, la toma de decisin a que conduce la evidencia colectada: DECISION Rechazar Ho No Rechazar Ho. Ho Verdadera Error tipo I Confiabilidad Ho Falsa=Ha Verdadera Poder de la prueba Error tipo II

Las posibles decisiones a que puede conducir el mecanismo de una prueba de hiptesis son: 1. Rechazar Ho, cuando se tienen suficientes evidencias que apoyan a la hiptesis alternativa. Este tipo de decisin se considera el mas fuerte, ya que lleva a la implcito el hecho de que el investigador ha logrado confirmar su sospecha original mediante su trabajo de investigacin. El error tipo I esta relacionado con esta decisin al definirlo como: Rechazar Ho cuando Ho es verdadera. A la probabilidad de este error se le denota por la letra (alfa) y para propsitos de toma de decisin, el alfa de la prueba se establece a niveles muy bajos, tales como 0.10, 0.05 o 0.01. A este nivel de error tipo I fijado en la prueba se le llama nivel de significancia de la prueba. 2. No Rechazar Ho, cuando el investigador no ha logrado reunir los suficientes elementos que confirmen su hiptesis de trabajo. Es una decisin en la que la sospecha queda como tal, y si es razonable, queda abierta la posibilidad de seguirla investigando, con tcnicas mejoradas o de manera mas minuciosa que lleve a la coleccin de evidencias requeridas. El error tipo II esta relacionado con esta decisin al definirlo como: No Rechazar Ho cuando Ho es falsa. La probabilidad asociada a este error se le denota por (beta).

El mecanismo para llevar a cabo una prueba de hiptesis consiste de los siguientes pasos: 1. 2. 3. 4. 5. 6. 7. Establecer el juego de hiptesis. Establecer la estadstica de prueba. Determinar la distribucin de la estadstica de prueba bajo la hiptesis nula. Determinar el nivel de significancia y zona de rechazo. Calculo de la estadstica de prueba en base a la evidencia colectada. Toma de decisinConclusin-

Disear el experimento o muestreo: En estadstica se tienen dos metodologas para la coleccin de evidencias para probar una hiptesis, que son: 1. 2. Diseo experimental. Diseo de muestreo.

La coleccin de datos bajo un diseo experimental implica un proceso de control por parte del investigador con la finalidad de asociar datos a condiciones experimentales. El objetivo es determinar la relacin causa efecto. La coleccin de datos por muestreo es un examen de un sistema en operacin en el que el investigador no tiene oportunidad de asignar diferentes condiciones a los objetos de estudio. El objetivo bsico es la caracterizacin del sistema en base a las variables evaluadas. Entonces, el diseo experimental es una herramienta de metodologa estadstica para colectar los datos bajo condiciones controladas y a la vez construir, en base a la metodologa de coleccin, los modelos necesarios para analizar e interpretar los resultados. La interpretacin de resultados se lleva a cabo una vez que los datos colectados son procesados y sometidos al mecanismo de una prueba de hiptesis. La interpretacin comprende bsicamente la toma

de decisin y la conclusin, incluidas en el mecanismo de la prueba de hiptesis. De esta manera, en gran medida, el mtodo cientfico esta apoyado fuertemente por la metodologa estadstica, desde el planteamiento de las hiptesis, coleccin de los datos, procesamiento, interpretacin y conclusin. Objetivo general de la experimentacin: En trminos muy sencillos un experimento es una prueba o ensayo que conduce a un resultado cuantificable. En trminos prcticos es una manipulacin deliberada de un proceso con el propsito de medir el impacto del cambio en una o mas variables de entrada sobre una o mas variables de salida. Formalmente, el experimento es definido como una operacin llevada a cabo bajo condiciones controladas para descubrir un efecto desconocido, probar una hiptesis o ilustrar una ley conocida. En general, los experimentos son llevados a cabo para explorar, estimar o confirmar. Objetivo de un diseo experimental: El diseo de experimentos o diseo estadstico de experimentos es una disciplina basada en principios estadsticos, y construida a travs de aos de experiencia en la ciencia y la ingeniera. Implica el proceso de diseo y planeacion del experimento, de tal forma que datos apropiados puedan ser colectados y posteriormente ser analizados por mtodos estadsticos para llegar a conclusiones validas y objetivas. Los principales beneficios de la experimentacin diseada es que la informacin critica es obtenida mas rpido, econmica y confiable de lo que seria si se aplicara un enfoque no planeado. El DOE o SDE permite al investigador entender un proceso y determinar como las variables de entrada (factores) afectan a las variables de salida

(respuesta). Es un enfoque sistemtico para la optimizacin de procesos. En general el DOE puede ser usado para: 1. 2. 3. 4. 5. 6. 7. Estudiar el efecto de varios factores sobre el comportamiento del producto o proceso. Entender la relacin entre las variables de entrada y las variables de salida. Identificar las condiciones optimas de un proceso que maximizan o minimizan la respuesta. Reducir la variabilidad en las caractersticas de un producto. Mejorar la confiabilidad del producto. Reducir costos de manufactura. Acortar el tiempo de desarrollo de productos o procesos.

Variables y sus relaciones en un diseo experimental: En todo experimento debemos definir la unidad experimental, como el material mnimo requerido para aplicar los tratamientos (las causas) y evaluar las respuestas (los efectos). Tambin debemos definir los tratamientos como cada una de las diferentes condiciones experimentales que van a ser evaluadas en el experimento. Las variables en un diseo experimental se clasifican fundamentalmente en dos grandes grupos de acuerdo su rol en la unidad experimental: 1. 2. Variables de entrada. Variables de salida.

Las variables de entrada son todas aquellas variables a las que esta expuesta la unidad experimental. Comprende los siguientes grupos de variables: 1. 2. 3. 4. 5. Factores experimentales. Factores de bloqueo. Factores de ruido. Variables deliberadamente controladas. Variables no controladas.

Factores experimentales:

Los factores experimentales son aquellas variables del proceso que deliberadamente son manipuladas en un experimento para investigar su impacto sobre las variables de respuesta. Cada uno de los valores de estas variables incluidos en un experimento se denomina los niveles del factor. Si el experimento incluye solo un factor (experimento unifactorial), entonces cada uno de los niveles se constituye en un tratamiento. Si el experimento incluye varios factores (experimento multifactorial), entonces la combinacin de los niveles de todos y cada uno de los factores incluidos ser lo que se constituya como un tratamiento. Los factores experimentales se clasifican de acuerdo a varios criterios: De acuerdo a la naturaleza de los niveles los factores se clasifican en: 1. 2. Cualitativos o categricos. Cuantitativos o continuos.

Los cualitativos o categricos son aquellos factores donde la escala de los niveles es puramente nominal. Para este tipo de factores el inters se centra en la comparacin de los promedios, para seleccionar el mas adecuado. Al graficar estos promedios no existe un orden nico de los niveles y por lo tanto nunca deben usarse lneas continuas o de puntos en su representacin, siendo lo mas conveniente una grafica de barras. Los factores cuantitativos son aquellos cuyos niveles se expresan en una escala numrica, siendo el principal objetivo del anlisis el describir un modelo de respuesta de acuerdo a los niveles de este factor. Su representacin grafica mas adecuada es a travs de puntos o lneas. De acuerdo a la forma de seleccin de los niveles del factor, se clasifican como: 1. 2. Factores fijos. Factores aleatorios.

Los factores fijos son aquellos en los que la seleccin de los niveles esta basada en el inters del investigador, quien decide cuales son los que deben incluirse en el experimento. Para este tipo de factores las conclusiones estn restringidas al rango de niveles seleccionados, para factores continuos, o estrictamente para los niveles seleccionados en caso de los factores cualitativos.

Los factores aleatorios son aquellos en donde los niveles del factor se seleccionan de una poblacin de niveles de una manera aleatoria. Para este tipo de factores el inters esta centrado en investigar la variabilidad que genera el cambio en los niveles de este factor. Para los experimentos multifactoriales, los factores se clasifican de acuerdo a la relacin que guardan los niveles de los factores en: 1. Factores cruzados, en los que los niveles de dos factores son independientes, es decir, los niveles de un factor se pueden combinar sin ninguna restriccin con los niveles del segundo factor, generando as una estructura factorial de tratamientos. 2. Factores anidados, en los que los niveles de un factor de jerarqua inferior depende de los niveles de un factor de jerarqua superior, generando as una estructura jerrquica. Factores de bloqueo: Cuando fuentes de variacin extraas e indeseables pueden ser identificadas, podemos disear el experimento de tal forma que eliminemos su influencia. La idea es arreglar las unidades experimentales en grupos o bloques de unidades uniformes en los valores de la variable de bloqueo, asignando luego, al azar, los tratamientos dentro de cada bloque. La variabilidad entre bloques es considerada en el anlisis, lo que conduce a una mejora en la precisin del experimento. Cuatro criterios son frecuentemente usados para bloquear unidades experimentales: Proximidad de unidades experimentales; caractersticas fsicas de las unidades experimentales que tengan un impacto fuerte en las variables de respuesta; tiempo; administracin de tareas en el experimento. Factores de Ruido: Son las variables que solo pueden controlarse durante la fase experimental, ya que resulta difcil o costoso tratar de controlarlas durante la etapa de produccin normal. Variables deliberadamente controladas: Conjunto de variables en un experimento que se caracterizan por tomar un valor constante durante la etapa experimental, debido al control que ejerce el investigador sobre estas.

Variables no controladas: Conjunto muy grande de variables que se les permite variar sin control durante un experimento. Algunas pueden ser monitoreadas y llegar a convertirse en covariables. Otras puede ser que no sean medibles o accidentalmente ignoradas y este grupo es el que origina el error experimental. En cualquier caso, el impacto que tienen sobre las variables de respuesta debe ser mnimo. Si sucede que una variable de este grupo cambia a la par con los niveles de un factor experimental, esto ocasiona una confusin, ya que el anlisis no puede separar el efecto en el cambio simultaneo de ambas variables. Si el investigador no esta consciente de este cambio simultaneo de variables, entonces la variable no controlada va a enmascarar el efecto del factor experimental. Las covariables deben reunir dos caractersticas: Guardar una relacin lineal con las variables de respuesta y que no deben ser impactadas por los tratamientos. Estas variables, que pueden ser del ambiente fsico o de las mismas unidades experimentales, son analizadas conjuntamente con la respuesta para mejorar la precisin del experimento. Las variables de salida es el conjunto de variables que se van a evaluar en la unidad experimental, una vez que el tratamiento haya impactado, para determinar los efectos de tratamiento. Las respuestas se seleccionan en base a dos criterios: Las respuestas que son sensibles a los factores experimentales que se estn investigando y las respuestas que son de importancia econmica. Componentes de un diseo experimental: Dos caractersticas de todo diseo experimental son: 1. 2. Repeticin. Aleatorizacion.

La repeticin se refiere a que cada condicin experimental debe ser aplicada de manera independiente, al menos a dos unidades experimentales. A travs de las repeticiones en un tratamiento se evala la consistencia del tratamiento en lo que se refiere a su efecto. Si los resultados en una variable de inters son muy similares entre si, entonces el efecto del tratamiento es muy consistente. Una medida de esta consistencia es el grado de dispersin que

tienen las repeticiones de un tratamiento con respecto a su media de tratamiento, medida de variabilidad dentro de tratamiento que es conocida como el error experimental. Adems, el nmero de repeticiones repercute en la estimacin de la varianza de la media de tratamiento. La aleatorizacin se refiere al proceso de asignacin de tratamientos a las unidades experimentales. El objetivo de este mecanismo de asignacin es distribuir en forma aleatoria las diferencias entre unidades experimentales, de tal manera que ninguno de los tratamientos se favorezca o se perjudique con alguna asignacin tendenciosa generada a base del juicio del investigador. A travs de un diseo experimental se pretende entonces probar una hiptesis acerca del efecto de los tratamientos bajo condiciones controladas. Para tal fin todo diseo experimental consta de dos componentes: 1. Arreglo geomtrico de las unidades experimentales. Este componente se enfoca a mejorar la precisin de las estimaciones reduciendo variabilidad de unidades experimentales dentro de tratamientos. El mecanismo para definir arreglos geomtricos es el manejo de las variables de bloqueo y el sistema de aleatorizacion. Los principales arreglos geomtricos son: El diseo completamente al azar, el diseo en bloques al azar y el diseo en cuadro latino. 2. Arreglo de tratamientos. Este componente se enfoca a generar la estructura de los tratamientos adecuada a la hiptesis que se desea probar. Las estructuras bsicas son: Estructuras unifactoriales y estructuras multifactoriales. En las multifactoriales podemos distinguir las estructuras factoriales, estructuras jerrquicas y en parcelas divididas. Modelos para establecer las relaciones entre variables en un diseo experimental: En diseo de experimentos todo el anlisis de resultados se lleva a cabo mediante el ajuste de modelos. Estos modelos, en general se establecen como: RESPUESTA = INDEPENDIENTES + ERROR En Las variables independientes deben distinguirse aquellas que son fijas de las que son aleatorias. Las fijas se agrupan dentro de la parte sistemtica del modelo y las aleatorias en lo que se considera la parte aleatoria del modelo,

dentro de la cual se puede ubicar el error, por lo que la estructura del modelo quedara como: RESPUESTA = SISTEMTICA + ALEATORIA En la parte sistemtica se incluira entonces los factores experimentales y los factores de bloqueo, en tanto que en la parte aleatoria se incluiran los efectos aleatorios y el error experimental. EL DISEO COMPLETAMENTE AL AZAR Es el arreglo geomtrico ms simple, en el que se supone que tanto las unidades experimentales como el ambiente fsico en el que se lleva a cabo el experimento son totalmente homogneos, uniformes, sin cambio, lo cual representara un ambiente controlado y un material experimental estable. Bajo estas condiciones ideales solo quedara por definir los factores experimentales y sus niveles para determinar los tratamientos o condiciones experimentales que van a ser investigadas. Por esta razn, el nico efecto incluido en el modelo bajo este diseo, es precisamente el efecto de los tratamientos, que sera la nica fuente de variacin identificable en este experimento. Como puede ser sospechado, difcilmente se van a cubrir los requisitos para poder aplicar este diseo, por lo que en la prctica solo se recomienda para condiciones muy controladas, como es el caso de experimentos de laboratorio. Aleatorizacion: Ya que las unidades experimentales y las condiciones fsicas en las que se va a llevar a cabo el experimento son muy homogneas, entonces el mecanismo de asignacin de tratamientos a las unidades experimentales es completamente al azar, lo cual se puede lograr mediante la aplicacin de cualquier mtodo de sorteo aleatorio. Puede ser mediante el uso de nmeros aleatorios, mediante seleccin aleatoria de nmeros asociados a unidades experimentales y aplicacin secuencial de tratamientos. Si en realidad las unidades experimentales son muy homogneas, entonces cualquier nmero de subgrupos generados al azar van a ser tambin muy similares, lo cual asegura una comparacin muy justa de los tratamientos. Este diseo, es una generalizacin, para comparar ms de dos tratamientos, de la

comparacin de dos medias mediante la prueba de t para muestras independientes. Datos en el diseo completamente al azar: Los datos en un diseo completamente al azar solo tienen un criterio de clasificacin, correspondiente a los tratamientos. Para identificar a cada una de las observaciones, se requieren entonces de dos subndices ligados a la letra que representa la variable de respuesta; de acuerdo al modelo estadstico Yij = + i + repeticin dentro de cada tratamiento. Yij corresponde al valor de la variable de respuesta en la repeticin j del tratamiento i. es la media general del experimento. i ij ij

El subndice i esta asociado al tratamiento y el subndice j esta asociada a la

es el efecto del tratamiento i. es el error experimental en la repeticin j del tratamiento i.

i=1,2,,t; j=1,2,,r Lo cual indica que en el experimento hay t tratamientos, y en cada tratamiento r es el numero de repeticiones, cuando el numero de repeticiones es el mismo en cada tratamiento; entonces el experimento esta balanceado. Cuando el numero de repeticiones varia de tratamiento a tratamiento, el diseo experimental ser desbalanceado y el subndice j llegara a un numero diferente para cada tratamiento, lo cual puede ser indicado con j=1,2,,ri . Hiptesis que se desea probar: La hiptesis que se desea probar es la referente al efecto de los tratamientos. La hiptesis estadstica es: Ho: Todos los efectos de tratamientos son iguales a cero. Ho: 1= 2== t=0 Ha: Al menos uno de los efectos de tratamiento es diferente de cero. Para expresarla en trminos de los parmetros del modelo tendra que ser una hiptesis mltiple, que por el momento no es de inters llegar a detallar. Lo importante en este punto es recordar que la hiptesis nula es de consecuencias estadsticas definidas. En este caso la consecuencia de la hiptesis nula, es que el modelo estadstico se reduce a:

Yij = +

ij

Al que se le llama el modelo reducido. Para probar esta hiptesis el razonamiento que se sigue es evaluar la magnitud de los errores en ambos modelos y determinar que tanto impacto tienen los efectos de tratamiento. Si la reduccin en los errores es importante, entonces el efecto de los tratamientos se declara significativo. Por el contrario, si la magnitud de los errores prcticamente es la misma en ambos modelos, esto significa que los efectos de tratamiento no contribuyen a explicar la respuesta, y por lo tanto son declarados no significativos. Anlisis de los datos: El anlisis de los datos de un diseo experimental siempre se lleva a cabo mediante la tcnica del anlisis de varianza. Para aplicar esta tcnica se requiere del ajuste de los dos modelos al mismo conjunto de observaciones, el completo y el reducido bajo la hiptesis nula, para despus comparar la magnitud de los errores obtenida en ambos modelos. El ajuste de un modelo consiste en estimar sus parmetros, es decir todos aquellos componentes del modelo que no incluyan la secuencia completa de subndices usada en la variable de respuesta. En otras palabras, el nico componente que no se estima en el ajuste del modelo es el que corresponde al error experimental. En el ajuste del modelo se deben tener en cuenta las siguientes caractersticas tanto del conjunto de observaciones como del modelo que se desea ajustar: 1. Numero total de observaciones: Corresponde al numero total de valores en el diseo experimental. Vamos a denotar este numero con la letra n. 2. Numero de parmetros independientes en el modelo que se ajusta: Parmetros independientes son aquellos que no estn sujetos a las restricciones impuestas por la definicin de los parmetros. Por ejemplo el modelo reducido solo tiene un parmetro, que es independiente; en el modelo completo del diseo completamente al azar se impone la restriccin de i=1

i

= 0, por lo que el numero de

parmetros independientes seria t-1. A estos faltara sumar el parmetro , por lo que entonces serian t parmetros independientes.

3.

Grados de libertad para el modelo ajustado: Se refiere al numero de componentes independientes en el conjunto de datos despus de haber ajustado un modelo. Los grados de libertad se van reduciendo a medida que se introducen mas componentes en un modelo. Estos grados de libertad son los que permiten estimar la varianza del error, por lo que se recomienda en general que no deben ser inferiores de 10 a 12 en el modelo completo. Se estiman como:

G.L. = n parmetros independientes en el modelo. Para el modelo completo de un diseo completamente al azar se tiene: G.L. = n t Para el modelo reducido se tienen: G.L.= n 1 Al revisar la estructura del modelo reducido y el modelo completo se puede deducir que los resultados de las diferencias entre el modelo reducido menos el modelo completo se pueden atribuir al termino que corresponde al efecto de los tratamientos. Entonces: G.L.Trat = t 1 Estos grados de libertad son de particular importancia, ya que indican el numero de parmetros independientes en un modelo ajustado al conjunto de datos, tomando como variables independientes los tratamientos. Si el factor es cuantitativo, entonces los grados de libertad indican el grado mximo de polinomio en el modelo de regresin; si se trata de un factor cualitativo, entonces los grados de libertad en los tratamientos indica el numero mximo de comparaciones independientes entre los niveles del factor. Con esta informacin podemos empezar a generar la tabla de anlisis de varianza, que resume el ajuste de modelos y sus comparaciones. Para el diseo completamente al azar, las fuentes de variacin bsicas que se incluyen son: Tratamientos Error Total.

El total corresponde al ajuste del modelo reducido. De esta manera cuando requiramos los grados de libertad del total, sern los grados de libertad al ajustar el modelo reducido, esto es n-1. El error corresponde al ajuste del modelo completo. Cuando hablemos de los grados de libertado en un diseo completamente al zar, entonces se calcularan como n t. Hasta aqu el anlisis de varianza solo requiere de la informacin de cuantas observaciones comprende el conjunto de datos y cuantos tratamientos van a ser incluidos. Para el resto del anlisis se requiere ya del procesamiento de los datos y ajuste de los modelos. Ajuste de modelos por mnimos cuadrados ordinarios: Los modelos de anova se ajustan por mnimos cuadrados ordinarios, llamados as porque el ajuste se lleva a cabo bajo las suposiciones convencionales de anlisis, esto es, suponiendo normalidad, independencia y homogeneidad de varianzas en el componente de error. Una supocisin adicional es la aditividad de los componentes del modelo. Los pasos para llevar a cabo el ajuste son los siguientes: 1. Definir el modelo que se va a ajustar. 2. Definir las restricciones que se imponen en los parmetros del modelo. 3. Obtener la expresin para el error experimental despejando este termino del modelo que se vaya a ajustar. 4. Obtener la expresin para la suma de cuadrados de los errores. 5. Derivar la expresin de la suma de cuadrados de los errores con respecto a cada uno de los parmetros del modelo. 6. Igualar a cero las derivadas, para generar las ecuaciones normales de mnimos cuadrados. 7. De las ecuaciones normales de mnimos cuadrados se despejan los estimadores de los parmetros. Vamos a considerar el modelo reducido del diseo completamente al azar para ejemplificar los pasos del ajuste de un modelo: 1. Modelo que se va a ajustar: Yij = + ij

2. 3. 4. 5. 6. 7.

Restricciones en los parmetros: No hay restricciones. Error experimental: S.C.E. = i jij 2 ij

= Yij -

= i j(Yij )2

Derivada de la S.C.E. con respecto al parmetro : 2 i j(Yij )(-1). Ecuacin normal de mnimos cuadrados: -2 i j(Yij ) = 0 Estimador del parmetro: Media general de las observaciones.

Este proceso de estimacin es para obtener las expresiones algebraicas de los estimadores de mnimos cuadrados ordinarios y solo es necesario desarrollarlo cuando estas se desconozcan, ya que si se tienen a la mano, pues solo restara aplicarlas al conjunto particular de observaciones. Por otro lado si se tiene un paquete estadstico disponible, lo nico que hara falta es cargar adecuadamente los datos y darle correctamente las instrucciones para que genere los estimadores y todo el anlisis completo. Por estas razones vamos a enfocar la atencin al manejo del paquete para captura y anlisis de resultados mas que a la teora para generar estimaciones. Sumas de cuadrados en la tabla de anlisis de varianza: Una vez que los estimadores de los parmetros del modelo han sido obtenidos, pueden obtenerse los valores ajustados para cada una de las observaciones, a los que se les denominan los valores predichos. Por diferencia de los observados menos los predichos se obtienen los residuales o errores estimados para cada una de las observaciones. Al elevar al cuadrado cada uno de los residuales se obtienen solo cantidades positivas, que al sumarlas generan las sumas de cuadrados de los errores para el modelo ajustado. En cuanto a las sumas de cuadrados de los errores de un modelo ajustado se deben hacer las siguientes observaciones: a). Mientras mas reducido sea el modelo ajustado, esto es, mientras menor sea el numero de parmetros que contiene, la suma de cuadrados de los errores tendera a ser mayor. b). Cada suma de cuadrados de los errores tiene asociados un cierto numero de grados de libertad, que como ya se discuti, se calculan por la diferencia del numero de observaciones menos el numero de parmetros independientes que se van a estimar

c).

La suma de cuadrados de los errores refleja, en general, que tan

separados estn los valores observados de los valores ajustados por el modelo. d). Al comparar las sumas de cuadrados de los errores de un modelo reducido contra un modelo completo, la diferencia puede ser atribuida a los componentes que aparecen en el modelo completo pero que no aparecen en el modelo reducido. As entonces en el diseo completamente al azar, la diferencia entre el modelo reducido Yij= + ij ij

y el modelo completo Yij=+ i +

se puede atribuir al efecto de los tratamientos, y esta suma de cuadrados tiene asociados t-1 grados de libertad. Hasta aqu podemos construir la tabla de anlisis de varianza para un diseo completamente al azar, con las siguientes columnas: Fuente de variacin Tratamientos Error Total Grados de libertad t-1 n-t n-1 Suma de cuadrados Diferencia. S.C.E. modelo completo S.C.E. modelo reducido

Estadstica de prueba en el anlisis de varianza: A partir de estas columnas en el anlisis de varianza, que fueron generadas en base a la informacin colectada de los datos y del ajuste de los modelos, se calcula otra columna encabezada por el titulo de cuadrados medios, que contiene el estimador de varianza para cada fuente de variacin. Como cualquier varianza, estas cantidades se calculan como el cociente de la suma de cuadrados entre sus grados de libertad. Finalmente, la estadstica de prueba que se utiliza en el anlisis de varianza es una F, el cociente de dos varianzas, a partir de la cual se va a poder tomar una decisin acerca de la hiptesis planteada en trminos de los efectos de tratamientos. La F calculada es el cociente del cuadrado medio de tratamientos entre el cuadrado medio del error. En los paquetes estadsticos una columna adicional es agregada a la tabla de anlisis de varianza para mostrar el valor de probabilidad, es decir, la probabilidad de obtener un valor de F mayor o igual a la F calculada. Con este nico valor es posible llegar a una decisin acerca de la hiptesis, al

compararlo con el nivel de significancia de la prueba. Las decisiones basadas en este criterio son: Rechazar Ho si el valor de probabilidad es menor o igual al nivel de significancia de la prueba. No rechazar Ho si el valor de probabilidad es mayor que el nivel de significancia de la prueba. Ejemplo numrico 1: Observaciones de la produccin de una reaccin qumica tomada a diferentes temperaturas fue registrada como sigue:150 150 150 200 200 200 250 250 250 300 300 300 77.4 76.7 78.2 84.1 84.5 83.7 88.9 89.2 89.7 94.8 94.7 95.9

La primer columna representa los niveles de temperatura que se incluyeron en el experimento y la segunda columna los valores correspondientes a la produccin de la reaccin qumica. Como puede ser observado, se realizaron tres repeticiones por cada uno de los cuatro niveles de temperatura. Para empezar un anlisis exploratorio del comportamiento de los datos, siempre es recomendable graficar las observaciones contra los niveles del factor bajo estudio. En este caso la grafica resulta ser

100

95

90 Serie1 85

80

75 100

150

200

250

300

350

Dos patrones son los que deben ser observados en una grafica exploratoria: 1. La tendencia o patrn general de las observaciones. Debe ser identificado el comportamiento de los datos de acuerdo a los niveles del factor bajo estudio. Aqu observamos que a medida que aumenta la temperatura la produccin de la reaccin tambin aumenta de manera muy consistente, esto es, que se tiene un comportamiento lineal de la produccin con respecto a los niveles de temperatura. 2. Observaciones que se salen del patrn general de tendencia: En estas graficas exploratorias tambin pueden ser identificadas aquellas observaciones que no siguen el patrn de comportamiento. Estas observaciones deben ser cuidadosamente tratadas y checadas, pues en la gran mayora de las ocasiones son resultado de un error, ya sea en el experimento, a la hora de registrar, o inclusive capturar la informacin. En este ejemplo, como puede ser observado en la grafica, todas las observaciones siguen el mismo comportamiento de tendencia lineal. El anlisis de los datos consiste de los siguientes puntos, que corresponden a los de una prueba de hiptesis:

1. Establecer las hiptesis: Ho: Todos los efectos de tratamiento son iguales a cero. Ha: al menos uno de los efectos de tratamiento es diferente de cero. 2. Llevar a cabo la tabla de anlisis de varianza.Anlisis de varianza de un factor ANLISIS DE VARIANZA Origen de las Suma de Grados de variaciones cuadrados libertad Entre grupos 510.456667 3 Dentro de los grupos 2.66 8 Total 513.116667 11

Promedio de los Probabilida Valor crtico cuadrados F d para F 170.152222 511.736007 1.7736E-09 4.06618056 0.3325

3. Cantidades bsicas del anova: 3.1 3.2 3.3 Coeficiente de determinacin R-cuadrado: Desviacin estndar del error: Probabilidad de un valor mayor de F:

El coeficiente de determinacin R-cuadrado es el porcentaje de variacin explicado por el efecto de los tratamientos. Se calcula como una regla de tres directa, en la que la suma de cuadrados del total es al 100 % como la suma de cuadrados de tratamientos es al coeficiente de determinacin. Para nuestro ejemplo: 513.116667 510.456667 R-Cuadrado = 510.456667100 513.116667 Lo que significa que el 99.48 % de la variacin en el conjunto de observaciones esta siendo explicado por la variacin en la temperatura y solo el 0.52 % se debe a los factores de error. La varianza del error lo constituye el cuadrado medio del error y la desviacin del error se calcula como la raz cuadrada de la varianza, siendo en este caso S = 0.5679 La probabilidad mayor de un valor de F es lo que se denomina el valor de P o nivel de significancia observado, valor que nos permite tomar una decisin sobre la hiptesis acerca del efecto de los tratamientos. En este caso el valor es 100% Coeficiente de determinacin = 99.4816

P = 1.7736E-09 Aun cuando parece mayor que uno, el componente E-09 indica que hay ocho cero antes de la parte entera, lo que representa un valor muy inferior al 0.05 que consideramos como nivel de significancia de la prueba, por lo cual la hiptesis nula es rechazada, y por lo tanto se concluye que los tratamientos si tienen un efecto significativo sobre la respuesta. Ya que se trata de un factor cuantitativo, la mejor manera de investigar el efecto de los tratamientos es a travs de una regresin polinomial, checando hasta que nivel de tendencia llega a ser significativa. Ejemplo numrico 2: Los datos siguientes se refieren a las perdidas de peso de ciertas piezas mecnicas (en miligramos) debidas a la friccin cuando tres diferentes lubricantes se utilizaron en condiciones controladas. El lubricante C es el que se ha estado usando en el proceso, y ahora se desea evaluar dos nuevas posibilidades, el lubricante A y el lubricante B.Lubricante A A A A A A A A B B B B B B B B C C C C C C C C Desgaste 12.2 11.8 13.1 11 3.9 4.1 10.3 8.4 10.9 5.7 13.5 9.4 11.4 15.7 10.8 14 12.7 19.9 13.6 11.7 18.3 14.3 22.8 20.4

Anlisis exploratorio:

Mediante una grafica de barras con su error estndar, podemos determinar el comportamiento de desgaste y la variabilidad en el conjunto de observaciones.

Promedios de desgaste20 18 16 14 12 10 8 6 4 2 0 A B Tipo de lubricante C

Como puede observarse en la grafica, los patrones de dispersin dentro de cada lubricante son muy parecidos (por la similitud en las barras de error estndar). Puede observarse tambin que el lubricante de mayor valor en la respuesta es el C, seguido en orden decreciente por el lubricante B y el de mas baja respuesta en promedio el lubricante A. Planteamiento de la hiptesis: Ho: Las medias de desgaste por friccin bajo los tres lubricantes empleados son iguales. Ha: Al menos una media de desgaste asociada a un lubricante es diferente. Modelo estadstico para este conjunto de datos: Bajo la Ha el modelo es el correspondiente a un diseo completamente al azar: Yij = + i + es la media general del desgaste. i ij ij

Yij corresponde al valor del desgaste en la repeticin j del tratamiento i. es el efecto del lubricante i. es el error experimental en la repeticin j del lubricante i.

i=1,2,3 j=1,2,,8

Desgaste (mgs)

Anlisis de varianza para probar la hiptesis:ANLISIS DE VARIANZA Origen de las Suma de Grados de variaciones cuadrados libertad Entre grupos 230.585833 2 Dentro de los grupos 276.80375 21 Total 507.389583 23 Promedio de los Probabilida Valor crtico cuadrados F d para F 115.292917 8.74681521 0.00172472 3.46680011 13.181131

R-Cuadrado = 0.4544 Lo que significa que los lubricantes explican el 45 % de la variacin en el conjunto de datos. El 55 % se debe a factares no considerados en la investigacin. Desviacin estndar = 3.6306 que es el promedio del error en nuestro conjunto de datos bajo el modelo completo. Error estndar del la media = 1.2836 Lo que viene a confirmar el patrn de similitud en la variacin de desgaste dentro de cada lubricante, al obtener un error estndar muy similar a partir del anlisis de varianza, con los ya obtenidos para cada lubricante por separado. Valor de P = 0.0017 Que por ser menor al nivel de significancia de la prueba (0.05) se toma la decisin de rechazar Ho y concluir que las medias de desgaste en los tres lubricantes no son iguales. Esto implica que el lubricante entonces si tiene un impacto en el nivel de desgaste, por lo cual debemos investigar el patrn de variacin entre lubricantes y poder llegar a tomar una decisin acerca de cual lubricante es el mas conveniente para conservar las piezas de la maquinaria. MTODOS PARA IDENTIFICAR PATRONES DE VARIACIN POR TRATAMIENTOS El mtodo para factores cuantitativos es la regresin y para factores cualitativos es la comparacin de medias. Ambos procedimientos se pueden llevar a cabo por sus mtodos muy particulares o bien, bajo condiciones muy especificas, ambos se pueden llevar a cabo por medio de los contrastes ortogonales. Vamos a revisar primero los mtodos especficos para cada tipo de factor y posteriormente se discutir el enfoque general de contrastes ortogonales.

REGRESIN: La regresin es una metodologa de anlisis estadstico muy general, que aplica cuando se quiere investigar la relacin que guardan una variable dependiente con una o mas variables independientes. La regresin es muy extensa, y aqu solo nos limitaremos, en este punto, a la regresin lineal de tipo polinomial en una variable independiente. Los modelos de regresin polinomial se caracterizan por la potencia en la variable independiente. Como se muestra en la siguiente tabla los modelos de mas importancia son: Grado Lineal Cuadrtico Modelo Yij=o + 1Xij + ij Yij = o + 1 Xij + 2 X2ij + Descripcin Lnea Parbola

ij

La estructura general del modelo polinomial consiste en que la variable de respuesta se describe a travs de un intercepto (o) valor en la variable de respuesta cuando la variable independiente es igual a cero y una serie de trminos aditivos que consisten en el producto de la pendiente (i) multiplicada por la variable independiente elevada a la potencia i. La pendiente o tasa de cambio es el cambio en la variable de respuesta por unidad de cambio en la variable independiente. De esta manera, estos polinomios pueden ser generalizados a cualquier grado. Es conveniente, aclarar desde aqu, que el ajuste de estos modelos va a estar limitado por el nmero de niveles en la variable independiente en el conjunto de datos. El gado de polinomio mximo va a estar dado por el numero de grados de libertad en los tratamientos, que corresponde exactamente a los parmetros, quitando el intercepto, que se incluyen en el modelo- As un modelo lineal puede ajustarse a un conjunto de datos con dos niveles en la variable independiente, un cuadrtico requiere mnimo tres niveles en la variable independiente para poder ser ajustado, etc. Esto implica, que un modelo mas all de ese grado no podr ser ajustado, con lo que no es posible llegar a determinar si en realidad dicho modelo ajusta bien al conjunto de datos. Por esta razn se recomienda que cuando sospechemos de un modelo polinomial de grado p, el numero de niveles en la variable independiente sea al menos p+2, para que de esta manera tengamos

posibilidad de llevar a cabo un prueba de falta de ajuste. Esta prueba consiste en comparar que tan bien se ajusta el modelo propuesto contra un modelo de grado ms alto. Cada grado que aumenta la ecuacin polinomial de regresin, se le asocia un grado de libertad, de los correspondientes a los tratamientos. De esta manera, los grados de libertad que quedan despus de ajustar una ecuacin polinomial de un cierto grado, se asocian a lo que se conoce como falta de ajuste, con la que se prueba si alguna de las tendencias incluidas en esta podra llegar a ser significativa, con lo cual se anulara el modelo propuesto. Esta es la forma de checar si el modelo requiere de mas parmetros de los que se estn considerando. Ejemplo numrico 3. Continuando con el ejemplo numrico 1, podemos investigar el efecto de los tratamientos al ajustar una regresin lineal al conjunto de datos:Coeficiente Error Estadstico Probabilida Inferior Superior s Estandar t d 95% 95% 60.2633333 0.74439685 80.9559223 2.0211E-15 58.6047138 61.9219529 0.11653333 0.00321082 36.2940036 5.9937E-12 0.10937919 0.12368748

Intercepto Temperatur

En este ajuste podemos observar que ambos parmetros son estadsticamente diferentes de cero, ya que al probar: Ho: 1 = 0 vs. Ha 1 0 P = 5.99 E-12, que para todo propsito practico es igual a cero, y por lo tanto se rechaza Ho, y se concluye que la pendiente es diferente de cero. Su valor estimado es de 0.1165 con un error estndar de 0.0032, lo que indica que la produccin aumenta 0.1165 unidades por cada grado de incremento en la temperatura. Por cada 100 grados de aumento, la produccin aumenta 11.65 unidades. Con este valor ya tenemos evaluado el cambio que sufre la variable dependiente por un cambio en la independiente. Ya no es necesario establecer comparaciones de medias para saber si son estadsticamente diferentes, pues esto de antemano y se sabe. Ho: 0 = 0 vs. Ha 0 0 P = 2.02 E-15, que tambin es menor del nivel de significancia de la prueba, y por lo tanto se rechaza Ho, concluyendo que el intercepto es diferente de cero, con un valor estimado de 60.26 con un error estndar de 0.74444, lo que debera interpretarse como el valor de la produccin cuando la temperatura fuera igual a cero. Aprovechando el ejemplo,

debemos comentar que esta interpretacin seria correcta siempre y cuando la tendencia en la produccin se mantuviera constante como la que se encontr de 150 a 350 grados, lo cual es poco creble, y en todo caso, no se tiene la evidencia suficiente de que as sea. Entonces, queda en entredicho la interpretacin que se pueda dar a este valor. Al aplicar la formula encontrada de la ecuacin de regresin dada por Produccin = 60.26 + 0.1165*Temperatura Se determinan los valores esperados bajo el modelo de regresin ajustado, y al graficarlos sobrepuestos contra la temperatura, resulta la curva ajustada.

100 95 Produccion 90 85 80 75 100

Curva ajustada

Observados Esperados

150

200

250

300

350

Temperatura

Junto con la ecuacin de regresin ajustada, los paquetes tambin proporcionan el anlisis de varianza de la regresin, como a continuacin se muestraANLISIS DE VARIANZA Grados de libertad Regresin 1 Residuos 10 Total 11 Suma de cuadrados 509.250667 3.866 513.116667 Promedio de los cuadrados F 509.250667 1317.2547 0.3866 Valor crtico de F 5.9937E-12

Si se observa el valor de P coincide con el que ya se haba calculado para el parmetro de la pendiente, debido a que la hiptesis que se prueba con este abalisis de varianza es exactamente la misma, acerca de la pendiente. Entonces lo importante de este anlisis de varianza es conectarlo con el

anlisis de varianza para probar el efecto de los tratamientos. Para tal fin debemos considerar los siguientes clculos: G.L.Trat G.L.Reg.Lin = 3 1 = 2 que representan los grados de libertad asociados a la tendencia cuadrtica y cbica que pueden ser ajustados a este conjunto de datos por haber 4 niveles en la variable independiente. S.C.Trat S.C.Reg.Lin = 510.4566 509.2507 = 1.2059 que corresponde a la suma de cuadrados debida a la tendencia cuadrtica mas la suma de cuadrados debida a la tendencia cbica. Esta suma de cuadrados con los dos grados de libertad asociados, se le conoce como falta de ajuste. Esta informacin puede ser anexada en una tabla de anova con separacion de tendencias por efecto de los tratamientos.ANLISIS DE VARIANZA Origen de las Suma de Grados de variaciones cuadrados libertad Entre grupos 510.456667 3 Separacion Tendencia Lineal 509.2507 1 Falta de Ajuste 1.2059 2 Dentro de los grupos Total 2.66 513.116667 8 11 Promedio de los cuadrados 170.152222 Probabilida Valor crtico d para F 1.7736E-09 4.06618056 0.000000 0.224166 5.3176 4.4589

F 511.736007

509.2507 1531.581053 0.6029 1.813230 0.3325

Con la prueba acerca de la falta de ajuste se concluye que el modelo ajustado a los datos no requiere de mas parmetros. Por lo que finalmente se puede sugerir el modelo lineal encontrado es el que mejor ajusta a este conjunto de observaciones. Prueba de separacin de medias: Es un mtodo que se aplica despus de que el anlisis de varianza detecta diferencias entre tratamientos, con la finalidad de llegar a determinar, especficamente, cuales son las medias de tratamientos que son diferentes, hasta llegar a formar grupos de tratamientos con medias iguales. Se han propuesto una variedad de pruebas con este fin, algunas mas sensibles, otras mas estrictas, generando conclusiones diferentes y que en algunas ocasiones no se pueden explicar de manera sencilla, mucho menos interpretar.

En este punto vamos a considerar solo uno de los mtodos, que es el de uso mas frecuente en la literatura cientfica, conocido como la prueba honesta de Tukey. Este procedimiento fue diseado para experimentos balanceados, donde cada tratamiento tiene un numero de repeticiones igual a r. El procedimiento para aplicar la prueba de Tukey consiste de los siguientes pasos: 1. Calcular el error estndar de las medias. Recordar que se calcula como la raz cuadrada del cociente del cuadrado medio del error entre el numero de repeticiones. Por ser balanceado el experimento, este error estndar es el mismo para todas las medias de los tratamientos. 2. Obtener el valor critico del rango estudentizado de acuerdo al nivel de significancia (), numero de tratamientos (t) y grados de libertad en el error ( ), representado por q(, t, ). Este valor es obtenido de la tabla de rangos estudentizados que se localiza en los apndices de la mayora de los libros de diseo de experimentos. 3. 4. 5. Obtener el valor HSD (diferencia significativa honesta) como el producto del error estndar por el rango estdentizado. Calcular la diferencia entre todas las posibles parejas de medias de tratamientos. Declarar diferencia significativa entre las medias de los tratamientos cuando el valor absoluto de la diferencia sea estrictamente mayor que el valor del HSD. De otro modo, las medias de los tratamientos se declaran estadsticamente iguales. Para facilitar el calculo e interpretacin de las comparaciones, las medias se ordenan de menor a mayor; se arma una tabla de doble entrada donde el criterio de clasificacin tanto por hileras como por columnas van a ser las medias ordenadas de los tratamientos. En cada cuadro de la tabla se calcula la diferencia entre la media de hilera y la de columna, y se establece la decisin. Finalmente se hacen los grupos de medias iguales y sus interconexiones, a travs de superndices alfabticos o lneas verticales uniendo las medias de los tratamientos que corresponden a cada grupo. Cuando el experimento esta desbalanceado, entonces secalcula

la media

armnica del nmero de repeticiones por tratamiento y esta se usa para

calcular el error estndar de las medias de los tratamientos. La media armnica del numero de repeticiones se calcula por rh = t/ i(1/ri) Ejemplo numrico 4. Llevar a cabo el procedimiento de la prueba honesta de Tukey en los datos del ejemplo numerico2, referente a las marcas de lubricantes. A continuacin se muestra una tabla con la media y varianza de cada uno de los tratamientos.Grupos A B C Cuenta 8 8 8 Suma 74.8 91.4 133.7 Promedio Varianza 9.35 12.8542857 11.425 9.53642857 16.7125 17.1526786

Llevando a cabo el procedimiento de la prueba honesta de Tukey, encontramos: 1. Error estndar de las medias de tratamiento = 1.2836 2. Rango estudentizado = q(.05,3,21) = 3.58 3. HSD(.05,3) = 4.5953 4. Parejas de medias: C=133-7 A=74.8 C-A=58.9 * B=91.4 C-B=42.3 * C=133.7 C-C=0 Conclusin: Estadsticamente las tres medias son diferentes entre si, por lo que la seleccin optima del lubricante esta basada en aquella que genera el menor desgaste de piezas de la maquinaria; de esta manera se seleccionara el lubricante A. Contrastes ortogonales: Un contraste en estadstica es una combinacin lineal de las medias de los tratamientos definida por la suma de productos de las medias de tratamiento por un coeficiente. Estos coeficientes deben cumplir con la caracterstica de que su suma es igual a cero, de tal manera que para algunas medias sus coeficientes asociados son positivos y para otras son negativos. Las reglas de asignacin de los coeficientes va a depender de la tendencia que se desee encontrar o de la comparacin de medias que se A=74.8 A-A=0 B=91.4 B-A=16.6 * B-B=0

desee hacer. Cada contraste tendr asociado un grado de libertad, debido a que la comparacin que se lleva a cabo es entre dos grupos de tratamientos, lo que llevan el signo positivo contra los que llevan el signo negativo. De esta manera el numero de posibles contrastes ortogonales en un conjunto de datos corresponde exactamente a los grados de libertad para los tratamientos. Dos contrastes sern ortogonales si la suma de los productos de sus correspondientes coeficientes es igual a cero. Esto implica que la covarianza entre los dos contrastes es igual a cero, y por lo tanto los contrastes van a ser independientes. En este sentido la ortogonalidad implica independencia. Si todos los contrastes formulados son ortogonales entre si, entonces esto llevara a que la suma de cuadrados acumulada en todos los contrastes ortogonales corresponda exactamente a la suma de cuadrados de los tratamientos. La suma de cuadrados asociada a un contraste se calcula por el cuadrado de la combinacin lineal de las medias multiplicada por el numero de repeticiones y dividida por la suma de los cuadrados de los coeficientes de la combinacin lineal. Esta suma de cuadraos siempre lleva asociada un solo grado de libertad. Si se aplican contrastes no ortogonales, entonces existir covarianza entre ellos y esto implica que la informacin contenida en ellos esta relacionada en un cierto grado, con lo cual se considera que la informacin contenida en los datos esta siendo sobreutilizada. Esto se va a reflejar en el hecho de que el acumulado de la suma de cuadrados de los contrastes no ortogonales no cerrara a la suma de cuadrados de los tratamientos. Contrastes ortogonales para el calculo de tendencias: Los contrastes ortogonales pueden ser usados para estimar las sumas de cuadrados asociadas a los diferentes componentes de un modelo polinomial, siempre y cuando los datos experimentales tengan las siguientes dos caractersticas: 1. Experimento balanceado, lo que es un requisito general para aplicar contrastes. 2. Los niveles del factor deben estar igualmente espaciados Si alguna de estas caractersticas no se da en el conjunto de datos, se recomienda aplicar la tcnica de la regresin para llevar a cabo la

separacin de la suma de cuadrados de tratamientos en las diferentes tendencias. La siguiente tabla muestra los coeficientes de las combinaciones lineales para cada una de las diferentes tendencias que se pueden ajustar a un conjunto de datos de acuerdo al nmero de niveles del factor. Los coeficientes estn en orden creciente del factor.Numero Trats 2 3 4 Primer Nivel -1 -1 1 -3 1 -1 -2 2 -1 1 Segndo Nivel 1 0 -2 -1 -1 3 -1 -1 2 -4 Tercer Nivel 1 1 1 -1 -3 0 -2 0 6 Cuarto Nivel

5

Tendencia Lineal Lineal Cuadrtica Lineal Cuadrtica Cbica Lineal Cuadrtica Cbica Cuarto

Quinto Nivel

3 1 1 1 -1 -2 -4

2 2 1 1

Ejemplo numrico 5. Aplicar contrastes ortogonales al ejemplo numrico 1. Vamos a llevar a cabo los clculos en Excel y mostrarlos en la siguiente tabla. Como puede ser observado los niveles se acomodan en orden creciente y as tambin las medias por nivel. De la tabla de coeficientes se seleccionan los correspondientes a 4 tratamientos.Nivel medias Lineal Cuadrtica Cbica Contr Lin Contr Cuadr Contr Cubico 150 77.4333333 -3 1 -1 -232.3 77.4333333 77.4333333 200 250 300 84.1 89.2666667 95.1333333 -1 1 3 -1 -1 1 3 -3 1 -84.1 89.2666667 285.4 58.2666667 -84.1 89.2666667 95.1333333 -0.8 252.3 -267.8 95.1333333 2.2

En la tabla estn contenidos los clculos del coeficiente por la media y en la ultima columna su correspondiente suma. A partir de estos clculos podemos determinar la suma de cuadrados correspondientes a cada uno de los contrastes: Para la tendencia lineal: S.C.Tend. Lineal = 3*(58.2666667)2/20 = 509.250667 Para la tendencia cuadrtica: S.C.Tend Cuadr = 3*(-0.8)2/4 = 0.48

Para la tendencia Cbica: S.C.Tend Cubica = 3*(2.2)2/20 = 0.726 Como puede ser comprobado, las sumas de cuadros para la tendencia lineal coincide con la suma de cuadrados de la regresin lineal, y el acumulado de la suma de cuadrados de la regresin cuadrtica y cbica coincide con la suma de cuadrados de la falta de ajuste. Se pudiera hacer el cuestionamiento acerca de la importancia de tener diferentes mtodos para realizar un mismo calculo. Aparte de la simplicidad de los contrastes, otra gran ventaja es que puede ser utilizado para analizar los arreglos factoriales de tratamientos que se vern posteriormente. Mediante la tcnica de contrastes ortogonales van a poder ser separadas las sumas de cuadrados en componentes con un solo grado de libertad, sin importar la naturaleza de los factores que se estn investigando. Contrastes ortogonales para comparacin de medias: Para factores

cualitativos, la aplicacin de los contrastes ortogonales es mas especifica para cada problema. Se requiere de un conocimiento mas o menos profundo de lo que son los tratamientos para poderlos agrupar. La idea de los contrastes para factores cualitativos es ir formando dos grupos de comparacin, cada uno de los cuales va estar formado por uno o ms tratamientos con alguna caracterstica comn. Cada uno de los grupos se irn separando en otros dos grupos de comparacin, en base a otra caracterstica de los tratamientos, y este proceso continuara hasta que al final los contrastes comparen un tratamiento contra otro. Ejemplo de aplicacin conceptual 1: Suponga que se esta llevando a cabo una investigacin para seleccionar un ingrediente proteico en la elaboracin de un alimento para mascotas. Se prueban tres fuentes de protena: Carne de res, carne de cerdo y soya. Lleve a cabo la comparacin de los tratamientos por contrastes ortogonales: Los contrastes ortogonales que pueden planearse para estas tres fuentes son: 1. 2. Protena de origen animal (cerdo y res) contra protena de origen vegetal (soya). Protena de origen animal (res) contra protena de origen animal (cerdo).

Ejemplo de aplicacin conceptual 2: Supngase que se esta llevando a cabo una investigacin en la que se desea evaluar diferentes fuentes de carnes no convencionales en la elaboracin de un producto carnico de bajo costo. El producto tradicional se elabora con carne de cerdo, y se desea investigar fuentes no convencionales que incluyen: Caballo, burro, gallina y pavo. Planear las comparaciones demedias por contrastes ortogonales. Los contrastes ortogonales que pueden planearse para estos tratamientos son: 1. 2. 3. 4. Testigo (cerdo) contra el promedio de los tratamientos (caballo, burro, gallina y pavo). Carnes de mamferos (caballo y burro) contra carnes de aves (gallina y pavo). Caballo contra burro. Gallina contra pavo.

Una vez que los contrastes ortogonales han sido planeados, debemos checar el requisito de que el experimento este balanceado, y si es as debemos obtener los coeficientes para cada uno de los contrastes. La mecnica para el calculo de los coeficientes es la siguiente: 1. Los coeficientes de un grupo llevaran signo positivo y los del grupo contrastante llevaran signo negativo. Esta es una seleccin completamente arbitraria. 2. El valor del coeficiente de un grupo ser igual al numero de tratamientos que tiene el grupo contrastante. Ejemplo numrico 6. Analice el ejemplo numrico 2 usando contrastes ortogonales. El ejemplo de los lubricantes y desgaste de las piezas consiste de tres tratamientos, cada uno con 8 repeticiones. El A y B son lubricantes nuevos y disponibles que se pueden usar en el proceso, y el lubricante C que es el que convencionalmente se utiliza en el proceso. Entonces podemos generar los siguientes contrastes con sus coeficientes y clculos requeridos para determinar las pruebas de significancia:Lubricante Media C vs (A B) A vs. B C vs (A B) A 9.35 1 1 9.35 B 11.425 1 -1 11.425 C 16.7125 Suma -2 -12.65 0 -2.075 -33.425

A vs. B

9.35

-11.425

0

A partir de las cantidades en la tabla podemos calcular las sumas de cuadrados correspondientes a cada contraste: Contraste convencional vs. Nuevas alternativas: S.C. = 8*(-12.65)2/6 = 213.3633 Contraste alternativa A vs. Alternativa B: S.C. = 8*(-2.075)2/2 = 17.2225 Estas sumas de cuadrados pueden ser agregadas a la tabla de anlisis de varianza para completar las pruebas de significancia:ANLISIS DE VARIANZA Origen de las variaciones Entre grupos C vs. A B A vs. B Dentro de los grupos Total Suma de cuadrados 230.585833 213.363333 17.222500 276.80375 507.389583 Grados de libertad 2 1 1 21 23 Promedio de los cuadrados F 115.292917 8.74681521 213.363333 16.1872773 17.222500 1.3066026 13.181131

El valor de P para el contraste C vs. A B resulto en 0.00061447 que es menor del 0.05, por lo que se concluye que este contraste es significativo, es decir, existe diferencia entre el lubricante convencional y las nuevas alternativas. El valor de P para el contraste C vs. A B resulto en 0.26587522 que es mayor del 0.05, por lo que se concluye que este contraste no es significativo, es decir, no existe diferencia entre el lubricante las nuevas alternativas. Para la seleccin del aceite entre las nuevas alternativas, se requiere de un criterio adicional, pues en cuanto a la variable medida, el desgaste de las piezas, no existe una diferencia. El criterio adicional puede ser el econmico, ecolgico, o algn otro en el que uno de ellos tuviera ventaja. DISEO EN BLOQUES COMPLETOS AL AZAR Cuando las unidades experimentales no son homogneas en alguna de las variables identificadas como de impacto importante sobre la respuesta, o bien, las condiciones fsicas en que se lleva a cabo el experimento no son totalmente

uniformes, entonces se puede emplear un diseo en bloques para asegurar comparaciones mas justas entre los tratamientos. La idea de un bloque en diseo de experimentos se refiere a un conjunto de unidades experimentales que tienen valores muy similares en cuanto a la variable de bloqueo, o bien que estn bajo condiciones experimentales muy similares. Una variable de bloqueo es una caracterstica de las unidades experimentales o del ambiente fsico donde se lleva a cabo el experimento, que se ha identificado como de impacto importante en la variable de respuesta. Esto es, valores diferentes en la variable de bloqueo, tienen efecto sobre la variable de respuesta. Por esto, si no se controlan a travs del diseo de experimentos, puede enmascarar el efecto de los tratamientos. Una variable de bloqueo debe ser seleccionada de acuerdo al tipo de experimento que se este llevando a cabo y a las variables de respuesta que se estn evaluando. A menudo las unidades de equipo de prueba o maquinas son diferentes en sus caractersticas de operacin y constituyen un factor tpico que es necesario controlar. Lotes de materia prima, personas o tiempo son posibles fuentes de variacin que pueden ser controladas mediante un arreglo geomtrico en bloques al azar. Por ejemplo, si se desea evaluar las caractersticas organolpticas en pasta de manzana para pasteles, elaborados con diferentes edulcorantes; se debe considerar como variables importantes que las impactan, a la variedad de la manzana, el nivel de madurez del fruto, o inclusive la regin de donde se cosecho. Todas estas variables pudieran ser controladas como variables de bloqueo, para obtener una estimacin ms pura del efecto de los tratamientos. Una condicin que debe conservarse para que este diseo sea valido, es que no debe haber un efecto cruzado entre las variables de bloqueo y las variables de respuesta. Esto implica que el efecto de un tratamiento se modifica por los bloques de manera proporcional en todos los tratamientos. Esto permite identificar diferencias de tratamientos, independientemente del bloque. En un diseo en bloques completos al azar cada bloque generado debe contener un numero de unidades experimentales igual al numero de tratamientos, ya que cada bloque debe contener a todos los tratamientos. Los bloques en este diseo constituyen las repeticiones del experimento.

Para poder llevar a cabo el arreglo geomtrico en bloques al azar, es necesario conocer el valor de la variable de bloqueo en cada una de las unidades experimentales, para poder agruparlas en base a esta informacin y construir los bloques, que deben quedar con valores muy similares en la variable(s) de bloqueo. Es necesario tambin saber que la variable de bloqueo no tiene un efecto cruzado con la variable de respuesta que se esta evaluando, esto es, el valor de la variable de bloque no modifica el efecto de los tratamientos. Ventajas del diseo en bloques con respecto al diseo completamente al azar: 1. Con un agrupamiento efectivo, el diseo en bloques puede generar resultados sustancialmente mas precisos de los que arrojara un diseo completamente al azar de tamao comparable. En otras palabras, el error experimental se puede controlar a niveles mas bajos con el diseo en bloques. 2. La variabilidad de las unidades experimentales, o de las condiciones fsicas donde se lleva a cabo el experimento, puede ser deliberadamente introducida para ampliar el rango de validez de los resultados experimentales sin sacrificar precisin. Desventajas del diseo en bloques comparado con el diseo completamente al azar: 1. Los grados de libertad para el error experimental no son tan grandes como en un diseo completamente al azar. Un grado de libertad es perdido para cada bloque despus del primero. 2. Mas suposiciones son requeridas para el modelo (varianza constante de bloque a bloque y no efecto cruzado de bloque y tratamiento) que para un diseo completamente al azar. Aleatorizacion: Una vez que los bloques han sido formados, con unidades experimentales lo mas parecido posible en cuanto a la variable de bloqueo, cada bloque se considera como un grupo muy homogneo de unidades experimentales, pero con un alto grado de variacin entre bloques. La forma de asignar tratamientos a las unidades experimentales es al azar e independientemente dentro de cada bloque.

Modelo estadstico: El modelo completo de un diseo en bloques al azar contiene los efectos de tratamiento (como en el completamente al azar) y el de los bloques, dado por Yij = + i + j + I=1,2,,t; j=1,2,,b Yij Es la variable de repuesta en el bloque j y el tratamiento i. Es la media general del experimento. i ij

Es el efecto del tratamiento i. es el error experimental en el bloque j y el tratamiento i.

j Es el efecto del bloque j.ij

Hiptesis del investigador: La hiptesis que se desea probar bajo este arreglo experimental es: Ho: No hay efecto de tratamientos ( i = 0 para toda i). Ha: al menos un efecto de tratamiento es diferente de cero. En relacin al efecto de los bloques, debemos ser claros de que no se deseaba investigar su efecto, solo se empleo como una forma de controlar la variabilidad en las unidades experimentales, con la finalidad de hacer mas sensible el experimento, es decir, poder detectar efecto de tratamientos cuando verdaderamente existan. De esta manera, no se plantea una hiptesis asociada el efecto de los bloques. Tampoco es posible probarla, ya que prcticamente no se tienen repeticiones de bloques. Cabe hacer mencin que si se tuvieran repeticiones de bloques, entonces el experimento dejara de ser bloques para convertirse en un arreglo de tratamientos factorial, y en este caso la variable de bloqueo ya pasara a ser un factor. ANOVA en el diseo en bloques al azar: El anlisis de varianza en un diseo en bloques al azar debe incluir las fuentes de variacin de tratamientos y la fuente de variacin de bloques, adems del error y total. Debe considerarse las restricciones en los parmetros, dadas por: 1. 2. Para los efectos de tratamientos: i

=0

Para los efectos de los bloques: j = 0

El arreglo en un diseo en bloques completos al azar y que no tenga datos perdidos, siempre tendr un numero de observaciones igual al producto del

numero de bloques por el numero de tratamientos (n = t b). Entonces el anova se construye como Fuente de variacin Bloques Tratamientos Error Total Grados de libertad b-1 t-1 (t-1)(b-1) n-1 Suma de cuadrados Diferencia (1) Diferencia (2). S.C.E. modelo completo S.C.E. modelo reducido

Los paquetes estadsticos en general reportan dos tipos de sumas de cuadrados en un anova, denominadas las secuenciales y las ajustadas. Estos nombres hacen referencia a la forma en que cada una es calculada. En el caso de las secuenciales, son calculadas mediante la diferencia en sumas de cuadrados de los errores de modelos conteniendo trminos adicionales, empezando con el modelo reducido y hasta llegar al modelo completo. As para un diseo en bloques al azar la secuencia de modelos serian: 1. 2. 3. Yij = + ij ij ij

Yij = + j +

Yij = + i + j +

La suma de cuadrados secuencial para bloques seria la suma de cuadrados del error en el modelo (1) menos la suma de cuadrados del error en el modelo (2). La suma de cuadrados secuencial para tratamientos seria la suma de cuadrados del error en el modelo (2) menos la suma de cuadrados del error en el modelo (3). En estas sumas de cuadrados, la de tratamientos seria ajustada por la presencia de los bloques, ya que se calculo como la diferencia con respecto a un modelo conteniendo el efecto de los bloques. Los modelos requeridos para el calculo de las sumas de cuadrados ajustadas serian: 1. 2. 3. 4. Yij = + ij ij ij ij

Yij = + j + Yij = + i +

Yij = + i + j +

La suma de cuadrados ajustada por efecto de los tratamientos se calcula por la diferencia en la suma de cuadrados de los errores del modelo 3 menos la suma de cuadrados del error del modelo 4. La suma de cuadrados ajustada para los

efectos de tratamiento se calculara por la diferencia en las sumas de cuadrados de los errores del modelo (2) menos la del modelo (4). Cuando el diseo esta balanceado estas sumas de cuadrados coinciden. Las diferencias se presentan cuando el diseo esta desbalanceado, y en este caso se deben considerar para la prueba de hiptesis las sumas de cuadrados ajustadas. Ejemplos Numricos. 1. Una compaa constructora desea probar la eficiencia de 3 tipos de aislantes diferentes. Ya que el rea sobre la que la compaa construye se caracteriza por diferencias importantes en el clima, la compaa ha dividido, en base a esta caracterstica, el rea en 4 regiones geogrficas. Dentro de cada regin geogrfica usa aleatoriamente cada uno de los tres aislantes y registra la perdida de energa como un ndice. Valores mas pequeos del ndice corresponden a perdidas mas bajas de energa.Aislante 1 2 3 R.G. 1 19.2 11.7 6.7 R.G. 2 12.8 6.4 2.9 R.G. 3 16.3 7.3 4.1 R.G. 4 12.5 6.2 2.8

La hiptesis que se desea probar es: Ho: No hay diferencias en el valor promedio del ndice de perdida de energa en los tres aislantes. ( Ho: i = 0 para toda i). Ha: Al menos el promedio del ndice de perdida de energa para uno de los aislantes es diferente (Ha: al menos una i 0). Una grafica para explorara las caractersticas de los datos es muy recomendable. En este caso conviene graficar las observaciones de los tres aislantes para cada regin por separado, para determinar si el efecto de los tratamientos es proporcional en todos los bloques.

25

20Podemos observar el comportamiento muy homogneo de los aislantes en cada una de las regiones geogrficas, lo cual implica que no existe un efecto cruzado de regin con aislante, con lo que se cumple uno de los requisitos fundamentales para aplicar el diseo en bloques. Se puede del aislante 2 y el de menor perdidas de energa es el aislante 3. El siguiente paso es llevar a cabo el anlisis de varianza para probar la hiptesis acerca del efecto de los tratamientos.Origen de Promedio las Suma de Grados de de los Probabilida variaciones cuadrados libertad cuadrados F d Aislantes 253.595 2 126.7975 170.898914 5.1342E-06 Regiones 55.6358333 3 18.5452778 24.9955073 0.00086444 Error 4.45166667 6 0.74194444 Total 313.6825 11

15 observar que el aislante 1 es el de mayores perdidas de energa, seguido

Perdida de energia

10

5 El nivel de significancia para el efecto de los aislantes es 5.13E-6, que es unvalor menor de 0.05 (PFc 2.71088984 0.00848296 2.71088984 0.00689471 2.71088984 6.718E-08

1 1 1 1 1

180.200056 180.200056 119.118656 4.35124348 7.1267E-10 3.81633333 3.81633333 2.52273228 4.35124348 0.12790015 0.20166667 0.20166667 0.13330885 4.35124348 0.71885832 1.33333333 1.33333333 0.88138083 4.35124348 0.35902438 0.21333333 0.21333333 0.14102093 4.35124348 0.71122148 20 30.2555556 1.51277778 35 281.876389

El efecto de tratamientos detectado por el anlisis de varianza en la prueba de tratamientos con los 5 grados de libertad, es debida solamente a la diferencia que existe entre los tratamientos con nitrgeno y el testigo, pues la significancia de los contrastes ortogonales solo resulto menor de .05 para este contraste, no detectndose ningn otro contraste como significativo, lo

que indica que en cuanto a la variable de respuesta evaluada, todos los fertilizantes tienen el mismo efecto. CUADROS LATINOS AUMENTADOS: Una desventaja de este arreglo geomtrico es que cuando el numero de tratamientos es pequeo, esto trae como consecuencia un escaso numero de grados de libertad para el error. Por ello se recomienda, fundamentalmente en estos casos, aumentar el diseo en cuadro latino a travs de repeticiones completas de los cuadros, que puede estar asociada a algn otro factor de bloqueo, diferente al empleado para definir las hileras y columnas, por ejemplo, aos en que se lleva a cabo el experimento, sitios en que se lleva a cabo el experimento, etc. Debemos distinguir fundamentalmente tres tipos de cuadros latinos repetidos: 1. Con hileras y columnas comunes en cada repeticin del cuadro. Sucede con hileras y columnas lo mismo que con los tratamientos, son los mismos niveles en cada repeticin, por lo que las repeticiones se asocian mas comnmente a tiempo. El modelo para este arreglo es el del cuadro latino convencional con el efecto aditivo de repeticiones. Yijkl = + i + l(ijk)

+ j + k + ijkl

En este caso, entonces, solo se agrega la fuente de variacin de repeticin en el anova con (r-1) grados de libertad, siendo r el numero de repeticiones de cuadros latinos completos. Cada una de las fuentes de variacin en el modelo (hileras, columnas y tratamientos) contribuyen con (t-1) grados de libertad. El numero total de observaciones es ahora rt , por lo que los grados de libertad para el total son (rt-1) quedando para el error la diferencia definida por (t-1)[r(t+1)-3]. Con tres repeticiones en un cuadro latino con tres tratamientos, los grados de libertad en el error aumenta 9 veces en comparacin con una sola repeticin. Ejemplo numrico 2. Considere la situacin experimental en una industria en la que se estn probando tres tipos de soldadura (tratamientos) y se controlan como variables de bloqueo el fundente (columnas) y el operador que lleva a cabo el proceso (hileras), en dos maquinas soldadoras diferentes (repeticiones). La variable de respuesta

es la resistencia de las piezas soldadas a la separacin de piezas. Los resultados se muestran en la siguiente tabla.R1 Fund 1 A = 14.0 C = 9.5 B = 11.0 R1 Fund 2 B = 16.5 A = 17.0 C = 12.0 R1 Fund 3 C = 11.0 B = 15.0 A = 13.5 R2 Fund 1 C = 10 A = 12.0 B = 13.5 R2 Fund 2 B = 16.5 C = 12.0 A = 18.0 R2 Fund 3 A = 13.0 B = 14.0 C = 11.5

Op 1 Op 2 Op 3

El resultado del anlisis de varianza es mostrado:F.V. Modelo Repeticion Fundentes Operadores Tratamientos Error Total G.L. 1 2 2 2 S.C. 7 90.7222222 0.05555556 41.3333333 0.25 49.0833333 10 13.7777778 17 104.5 C.M. Fc Ft Pr>Fc 0.844876514 0.000976563 0.914011146 0.000505808

0.05555556 0.04032258 4.9646027 20.6666667 15 4.10282102 0.125 0.09072581 4.10282102 24.5416667 17.8125 4.10282102 1.37777778

La interpretacin de resultados es que los tratamientos tienen un efecto significativo. Las medias de los tratamientos son:Media de Tratamiento Totales Observaciones Trat A 87.5 6 14.5833333 B 86.5 6 14.4166667 C 66 6 11

Donde se observa que el tratamiento C es el de menor respuesta, en tanto que el A y B son de valores muy similares y mas altos que el del tratamiento C. Lleve a cabo la prueba de separacin de medias de Tukey para reportar las diferencias y llevar a cabo la toma de decisin y recomendacin de la soldadura. 2. Con una variable de bloqueo con diferentes niveles en las repeticiones y la otra variable de bloqueo con niveles comunes en las diferentes repeticiones. Supngase ahora que se desean probar los mismos 3 tipos de soldadura, pero el experimento se desea de resultados lo mas rpido posible, por lo que un numero de operadores diferentes van a ser empleados en cada repeticin, usando los mismos fundentes para todas las repeticiones. En este caso los operadores van a estar asociados a cada repeticin, por lo que este factor se cataloga como anidado dentro de repeticin. Conviene entonces en este apartado revisar el anlisis de los factores jerrquicos. En este ejemplo articular, el factor de jerarqua superior es la repeticin y el de jerarqua inferior son los operadores. La

estimacin de los efectos del factor de jerarqua superior se llevan a cabo de la manera acostumbrada, pero los efectos del factor de jerarqua inferior se llevan a cabo dentro de cada nivel del factor de jerarqua superior. En este ejemplo tenemos que llevar a cabo la estimacin de cada operador dentro de cada repeticin del cuadro latino, ya que en cada uno los operadores sern diferentes (media de operador menos la media de repeticin). Esto implica que en cada repeticin se debern estimar (t-1) parmetros independientes, por lo que los grados de libertad para esta fuente de variacin sern r(t-1). El modelo estadstico es similar al del cuadro latino con repeticiones con factores de bloqueo comunes, con la nica diferencia de que ahora debe ser especificado el anidamiento de una de las fuentes de bloqueo. Yijkl = + i + l(ijk)

+ j(i) + k + ijkl

Los grados de libertad en el error para este modelo van a estar definidos por (t-1)(rt 2). El incremento en los grados de libertad en el error es menor bajo este arreglo, por la mayor cantidad de parmetros independientes que deben ser estimados. Ejemplo numrico 3. A continuacin se muestran los datos del segundo experimento en la industria referente a la soldadura con diferentes operadores en cada repeticin. Una tabla de anlisis de varianza es mostrada enseguida de los datos. En dicha tabla se observa una significancia para todos los efectos. Las medias de los tipos de soldadura son requeridos para seleccionar el mejor nivel. Los valores resultaron ser: Media A = 296 , Media B = 253.3, Media C = 210.6 Por lo que la mejor soldadura es la del tipo A.

Rep 1

Rep 2

Rep 3

Operador 1 Operador 2 Operador 3 Operador 4 Operador 5 Operador 6 Operador 7 Operador 8 Operador 9

Fundente 1 B = 265 A =350 C = 258 B = 220 A = 319 C = 175 B = 159 A = 262 C = 198

Fundente 2 A = 311 C = 284 B = 305 A = 276 C = 232 B = 254 A = 205 C = 168 B = 237

Fundente 3 C = 249 B = 330 A = 351 C = 189 B = 264 A = 307 C = 142 B = 246 A = 283

F.V. Modelo Repeticion Oper(Rep Fund Tratamiento Error Total

G.L.

S-C. 12 84904.2222

C.M.

Fc

Ft

P > Fc

2 6 2 2

36140.5185 14565.7778 1344.51852 32853.4074

18070.2593 134.60819 3.73889183 7.2122E-10 2427.62963 18.0837932 2.847726 7.4259E-06 672.259259 5.00776446 3.73889183 0.02287974 16426.7037 122.365087 3.73889183 1.3582E-09

14 1879.40741 134.243386 26 86783.6296

Conviene llevar a cabo la prueba de separacin de medias de Tukey para mostrar las diferencias significativas entre los tratamientos y poder establecer la recomendacin. 3. Con hileras y columnas con diferentes niveles en cada repeticin del cuadro. Considere ahora la situacin en que lo nico que es comn en las repeticiones del cuadro latino son los tratamientos, usando diferentes niveles del factor hilera y del factor columna en cada una de las repeticiones. Esto implica que tanto hileras como columnas estn anidadas dentro de cada repeticin. geomtrico es Yijkl = + i + l(ijk)

El modelo estadstico para este arreglo

+ j(i) + k(i) + ijkl

En base a este modelo los grados de libertada para el error experimental quedan definidos por la expresin (t-1)(rt-r-1) . Como puede sospecharse, por el numero de parmetros a estimar, este es el cuadro latino repetido que tiene un menor incremento en los grados de libertad en el error, ya que la estimacin de efectos de hilera y columna se llevan a cabo dentro de cada repeticin. Ejemplo numrico 4. Como un ejemplo considere la situacin en la que se estn probando cuatro diferentes tratamientos (A, B, C, D) para mejorar el valor nutricional de subproductos agrcolas para la alimentacin del ganado. Se dispone de dos zonas climticas, cada una de las cuales produce cuatro diferentes tipos de subproductos agrcolas que se pueden someter a los mismos tratamientos, y en cada zona climtica son usados 4 diferentes

animales en los que se prueba el subproducto tratado. La variable a medir es el porcentaje de disgestibilidad. Los resultados se muestran a continuacin: S U B P R O D U C T O S ANIMAL1 2 3 4 5 6 7 8 1 C = 0.2 B = 0.28 D = 0.34 A = 0.32 5 B = 0.29 D = 0.28 C = 0.28 A = 0.3 2 A = 0.24 C = 0.19 B = 0.23 D = 0.22 6 A = 0.25 B = 0.18 D = 0.23 C = 0.19 3 D = 0.2 A = 0.22 C = 0.21 B = 0.16 7 C = 0.18 A = 0.21 B = 0.2 D = 0.24 4 B = 0.27 D = 0.28 A = 0.28 C = 0.27 8 D = 0.28 C = 0.25 A = 0.28 B = 0.25

Se requiere en primer lugar la estimacin de los efectos de acuerdo al modelo establecido: Media general: 0.24375 Efecto de la repeticin: Media de repeticin Media general. Efecto de la repeticin 1 = 0.000625 Efecto de la repeticin 2 = - 0.000625 Efectos de hilera en la repeticin 1: Media de la hilera Media Repeticin 1 Efecto de la hilera 1 (Repeticin 1) = 0.016875 Efecto de la hilera 2 (Repeticin 1) = -0.001875 Efecto de la hilera 3 (Repeticin 1) = 0.020625 Efecto de la hilera 4 (Repeticin 1) = -0.001875 Efectos de hilera en la repeticin 2: Media de la hilera Media Repeticin 2 Efecto de la hilera 5 (Repeticin 2) = 0.006875 Efecto de la hilera 6 (Repeticin 2) = -0.013125 Efecto de la hilera 7 (Repeticin 2) = 0.004375 Efecto de la hilera 8 (Repeticin 2) = 0.001875 Recalcamos que una estimacin de efectos anidados consiste en la estimacin separada de los efectos en cada nivel del factor de jerarqua superior. Efectos de columna en repeticin 1: Media de la columna Media repeticin 1 Efecto de la Columna 1 (Repeticin 1) = 0.040625 Efecto de la Columna 2 (Repeticin 1) = -0.024375

Efecto de la Columna 3 (Repeticin 1) = -0.046875 Efecto de la Columna 4 (Repeticin 1) = 0.030625 Efectos de columna en repeticin 2: Media de la columna Media repeticin 2 Efecto de la Columna 5 (Repeticin 2) = 0.044375 Efecto de la Columna 6 (Repeticin 2) = -0.030625 Efecto de la Columna 7 (Repeticin 2) = -0.035625 Efecto de la Columna 8 (Repeticin 2) = 0.021875 Efecto de los Tratamientos: Media de tratamiento Media general. Efecto del tratamiento 1 = 0.01875 Efecto del tratamiento 2 = -0.01125 Efecto del tratamiento 3 = -0.0225 Efecto del tratamiento 4 = 0.015 En base a estos efectos estimados se pueden deducir los grados del libertad, las sumas de cuadrados de los efectos, el modelo completo y el modelo reducido, es decir, se puede derivar todo el anlisis de varianza. Vamos a repasar primero los grados de libertad asociados a los efectos incluidos en el modelo. Como regla general, los grados de libertad del efecto corresponde al numero de parmetros independientes estimados para dicho efecto. Entonces: Para repeticiones es un grado de libertad, ya que se estimaron dos efectos de repeticin, pero su suma es igual a cero, de tal forma que independientes solo se estima uno. Para hileras anidadas en repeticiones, se tienen 4 estimaciones en la repeticin uno y otras 4 en la repeticin dos, pero, en cada caso su suma es cero, por lo que solo quedan 3 estimaciones independientes en cada repeticin, y as, los grados de libertad para hileras en repeticin son 6. Para columnas anidadas en repeticin, se tiene una situacin equivalente a la de hileras, 4 estimadores de columnas en cada repeticin, pero solo tres independientes en cada caso, por lo que los grados de libertad de columnas anidadas en repeticin son tambin 6. Para tratamientos es una situacin diferente, ya que los tratamientos son comunes en ambas repeticiones, para calcular los estimadores de los efectos se juntan ambas repeticiones y se obtienen solo 4 estimadores, de los cuales,

por ser su suma igual a cero, se consideran 3 independientes, que son los grados de libertad de los tratamientos. Los grados de libertad para el total siempre se calculan como el numero total de observaciones menos una, por lo que en este caso, cada repeticin del cuadro latino incluye 44=16 observaciones en cada repeticin, y por ser dos repeticiones, entonces el numero total de observaciones son 32. Los grados de libertad del total son entonces 31. Aplicando la expresin derivada para grados de libertad especifica para este tipo de cuadro latino aumentado (hileras y columnas diferentes en cada repeticin) se obtienen 15 grados de libertad. Las sumas de cuadrados asociadas a cada uno de los efectos se obtiene mediante los efectos estimados, elevados al cuadrado y sumados sobre todas las observaciones. La tabla de anlisis de varianza para estos datos es mostrada:F.V Modelo Repeticion Hileras(rep) Colum(rep) tratamientos Error Total 1 6 6 3 15 31 G.L. 16 S.C. 0.0536625 0.0000125 0.0000125 0.02377179 4.54307712 0.87952229 0.0038375 0.00063958 1.2163233 2.790465 0.35123807 0.0401375 0.00668958 12.72187 2.790465 3.8579E-05 0.009675 0.003225 6.13312203 3.28738211 0.00621636 0.0078875 0.00052583 0.06155 C.M. Fc Ft Pr > Fc

Los valores de significancia indican una diferencia estadstica entre tratamientos, por lo que es necesario aplicar la prueba de Tukey a las medias de los tratamientos para determinar cuales medias son diferentes. Las medias de los tratamientos son: A = 0.2625 B = 0.2325 C = 0.22125 D = 0.25875 Prueba de separacin de medias de Tukey: Ordenar las medias de mayor a menor: A = 0.2625 D = 0.25875

B = 0.2325 C = 0.22125 Construir una tabla de diferencia de medias: A A D B C D A-D=0.00375 B A-B=0.03000 D-B=0.02625 C A-C=0.04125 D-C=.0375 B-C=0.01125

Valor HSD: Diferncia honesta significativa de Tukey: Error estndar de la media = 0.008107 Valor critico de la tabla de Tukey = 4.08 HSD = 0.0081074.08 = 0.033 Declaracion de diferencias significativas: A-D < HSD , No significativa A-B < HSD , No significativa A-C > HSD , Significativa D-B < HSD , No significativa. D-C > HSD , Significativa. B-C < HSD , No significativa. Separacin de medias: A = 0.2625a D = 0.25875a B = 0.2325ac C = 0.22125c Los tratamientos A y D estadsticamente iguales son los que incrementaron mas la respuesta. El tratamiento C es el de mas baja respuesta y estadsticamente es igual al tratamiento B, que por estar en valor intermedio, tambin es estadsticamente igual an los tratamientos A y D. ARREGLOS DE TRATAMIENTOS: Los arreglos de tratamientos se refieren al conjunto de tratamientos que deben ser incluidos en un experimento para poder llevar a cabo las hiptesis que se plantean en la investigacin. De esta manera, si la hiptesis establece solo los efectos de tratamientos referentes a un solo factor, entonces el arreglo de tratamientos requerido es un arreglo unifactorial.

Por otro lado, si las hiptesis que se desean probar se refieren a dos o mas factores, entonces el arreglo a seleccionar es un arreglo multifactorial, que puede ser un arreglo factorial o un arreglo en parcelas divididas. El arreglo factorial es seleccionado cuando el tamao de la unidad experimental es el mismo para cualquiera de los factores que se desean probar. Bajo este arreglo se aleatorizan independientemente los niveles de cada uno de los factores a las unidades experimentales. De manera equivalente, se pueden formular todas las posibles combinaciones de los niveles de los factores y considerarlas como tratamientos, llevando a cabo una aleatorizacion experimentales. El arreglo de parcelas divididas es seleccionado cuando el tamao de la unidad experimental requerido para probar los niveles de un factor es mas grande (factor de parcela principal) comparado con el tamao de la unidad experimental para probar otro factor (factor de subparcela). En estos arreglos de tratamientos las unidades experimentales para probar el factor de parcela principal son aleatorizados de acuerdo a algn arreglo geomtrico seleccionado. Posteriormente la parcela principal ya tratada con el nivel del factor de parcela principal es dividida (de ah su nombre) en un numero de subunidades igual al numero de niveles del factor de subparcela, el cual es asignado de ma