ANALISIS DE LA VARIANZA PARTE...

47
AN ´ ALISIS DE LA VARIANZA PARTE TERCERA Marzo 2013

Transcript of ANALISIS DE LA VARIANZA PARTE...

Page 1: ANALISIS DE LA VARIANZA PARTE TERCERAalfonsotrigueros.com/wp-content/uploads/2013/03/presentacion3a.pdf · Los factores con niveles aleatorios los encontraremos, ademas de en los

ANALISIS DE LA VARIANZA

PARTE TERCERA

Marzo 2013

Page 2: ANALISIS DE LA VARIANZA PARTE TERCERAalfonsotrigueros.com/wp-content/uploads/2013/03/presentacion3a.pdf · Los factores con niveles aleatorios los encontraremos, ademas de en los

Indice general

1. INTRODUCCION . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12. CALCULO DE LAS ESPERANZAS MEDIAS

CUADRATICAS (EMC) . . . . . . . . . . . . . . . . . . . . . . . . . . 23. MODELOS ALEATORIOS Y MODELOS MIXTOS . . . . . . . . . . 7

3.1. Modelo Aleatorio con un factor . . . . . . . . . . . . . . . . . . . . . . 83.2. Modelo Aleatorio con dos factores . . . . . . . . . . . . . . . . . . . . 143.3. Modelo Mixto con dos factores . . . . . . . . . . . . . . . . . . . . . . 22

4. DISENO CON FACTORES JERARQUIZADOS . . . . . . . . . . . . 245. DISENO EN PARCELAS DIVIDIDAS(“SPLIT-PLOT”) . . . . . . . 33BIBLIOGRAFIA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

Page 3: ANALISIS DE LA VARIANZA PARTE TERCERAalfonsotrigueros.com/wp-content/uploads/2013/03/presentacion3a.pdf · Los factores con niveles aleatorios los encontraremos, ademas de en los

1. INTRODUCCION

En los modelos considerados en las partes primera y segunda, los niveles delos factores eran fijos. Se suponıa, que el investigador estaba interesado, pre-cisamente, en los efectos de los factores para los niveles seleccionados y en losde sus interacciones. En consecuencia, las conclusiones estaban circunscritas,exclusivamente, a la influencia de dichos factores para esos niveles fijos. Sinembargo, se da con frecuencia el caso de que el objetivo del experimento esextender las conclusiones de los resultados obtenidos a un mayor numero deniveles que los utilizados en el experimento. En este caso, los niveles selec-cionados se consideran muestras aleatorias de un colectivo mucho mas amplio(infinito) de posibles niveles. De hecho, el investigador no esta, propiamente,interesado en los niveles escogidos.

Los efectos de un factor A con niveles aleatorios ya no seran valores fijosτi = µi−µ tales que

∑τi = 0. El efecto de un factor con niveles aleatorios se

asimila a una distribucion Normal con media cero y varianza = σ2τ . Para losniveles seleccionados, no se cumple ahora

∑τi = 0. Un modelo cuyos factores

tengan sus niveles fijos se denomina Modelo fijo. Cuando sus factores tenganniveles aleatorios sera un Modelo aleatorio y cuando coexistan factores conniveles fijos y factores con niveles aleatorios tendremos un Modelo mixto.

Los factores con niveles aleatorios los encontraremos, ademas de en losdisenos factoriales, en otros tipos de diseno que veremos en el capıtulo 4(Disenos anidados) y en el capıtulo 5 (Disenos de Parcelas divididas o “Split-Plot”). En un modelo aleatorio, a los efectos tales como σ2τ , se les denominaComponentes de la Varianza.

Page 4: ANALISIS DE LA VARIANZA PARTE TERCERAalfonsotrigueros.com/wp-content/uploads/2013/03/presentacion3a.pdf · Los factores con niveles aleatorios los encontraremos, ademas de en los

2 Analisis de la varianza

Anticipamos, ahora, respecto de los disenos anidados (o jerarquizados)que cuando un factor Bj esta anidado en otro factor Ai ambos factores nointeraccionan ya que los “j” niveles de B son distintos para cada nivel “i” delfactor A, empleandose la notacion Bj(i).

2. CALCULO DE LAS ESPERANZAS MEDIAS

CUADRATICAS (EMC)

El calculo de las EMC, tal como se planteo en la parte segunda (pag. 25),es muy laborioso. Por ello, se utilizan algoritmos que simplifican mucho suobtencion. Ası, las EMC de los terminos de cualquier modelo, constituıdospor los efectos de los diferentes factores y de sus interacciones, ası como losde las variables bloque que intervengan en disenos equilibrados, las calcu-laremos, mediante un algoritmo discutido por Bennet-Franklin y otrosque recogemos a continuacion. Los factores pueden ser de tipo fijo o aleatorio(“random”) y los disenos: factoriales,anidados y “Split-Plot”. El calculo delas EMC de los distintas fuentes de variacion es indispensable paraefectuar correctamente los test “F” que determinaran si la influencia decada uno de los efectos es significativa.

El algoritmo consta de dos partes, en la primera se elabora una tabla decoeficientes y en la segunda se calculan los valores de las EMC.

La tabla de coeficientes es una tabla de doble entrada en la que las filas sonlos distintos efectos y las columnas los subındices i, j, k ... correspondientes acada factor. Encima de los subındices se situan, tambien, el nº de niveles decada factor y una indicacion relativa a si el factor es fijo (F) o aleatorio (Rde “random”). Por ejemplo, para un diseno mixto con tres factores de nivelesa=3; b=2; c=4; replicado con l = 2, dos factores fijos y uno “random”, conel factor “random” anidado en uno de los fijos, el modelo sera:

Yijkl = µ+ τi + βj + νk(i) + (τβ)ij + (βν)jk(i) + εijkl donde τi, βj son fijosy νk(i) es “random”.

Page 5: ANALISIS DE LA VARIANZA PARTE TERCERAalfonsotrigueros.com/wp-content/uploads/2013/03/presentacion3a.pdf · Los factores con niveles aleatorios los encontraremos, ademas de en los

Analisis de la varianza, parte tercera 3

La tabla para el calculo de la EMC tiene la siguiente estructura:

F F R RFuentes 3 2 4 2Variabilidad i j k l EMCτiβjνk(i)(τβ)ij(βν)jk(i)ε(ijk)l

Notese que, en el modelo, el factor anidado no interacciona con el factorprincipal y que en la tabla, el subındice indicativo del orden de lareplicacion se considera anidado en los otros tres subındices:

Las reglas para cumplimentar las casillas de la tabla son:

a) Se distingue, para cada fuente de variabilidad, entre subındices activos ypasivos. Por ejemplo, en τi el subındice“i”es activo y en νk(i) el subındice“i”es pasivo. En (βν)jk(i) los subındices“j”,“k”son activos y“i”es pasivo.

En ε(ijk)l los subındices “i”,“j”,“k” son pasivos y el subındice “l” es activo.Resumiendo, los subındices entre parentesis seran pasivos y losque esten fuera de parentesis activos.

b) Subındices pasivos en las filas:

Se coloca un uno en las casillas en las que coincidan un subındicepasivo de la fila con el mismo subındice en la columna con independen-cia de que el factor sea fijo o “random”. De la aplicacion de esta reglaresulta:

F F R R3 2 4 2

F. Variabilidad i j k l EMCτiβjνk(i) 1(τβ)ij(βτ)jk(i) 1

ε(ijk)l 1 1 1

Page 6: ANALISIS DE LA VARIANZA PARTE TERCERAalfonsotrigueros.com/wp-content/uploads/2013/03/presentacion3a.pdf · Los factores con niveles aleatorios los encontraremos, ademas de en los

4 Analisis de la varianza

c) Subındices activos en las filas:

En las casillas en las que coinciden un subındice activo de la fila conel mismo subındice en las columnas se coloca un cero si el factor es fijoy un uno si el factor es “random”:

F F R R3 2 4 2

F. Variabilidad i j k l EMCτi 0βj 0τk(i) x 1(τβ)ij 0 0(βν)ik(i) x 0 1

ε(ikj)l x x x 1

Nota: El signo x indica que la casilla ya ha sido rellenada en una etapaanterior

d) En las casillas pendientes aun de rellenar, se coloca el numero corre-spondiente a los niveles de los diversos subındices:

F F R R3 2 4 2

F. Variabilidad i j k l EMCτi x 2 4 2βj 3 x 4 2νk(i) x 2 x 2(τβij x x 4 2(βν)jk(i) x x x 2

ε(ijk)l x x x x

En conclusion, tras la aplicacion de las reglas a), b), c) y d) resulta:

F F R R3 2 4 2

F. Variabilidad i j k l EMCτi 0 2 4 2βj 3 0 4 2νk(i) 1 2 1 2(τβ)ij 0 0 4 2(βν)jk(i) 1 0 1 2

ε(ijk)l 1 1 1 1

Page 7: ANALISIS DE LA VARIANZA PARTE TERCERAalfonsotrigueros.com/wp-content/uploads/2013/03/presentacion3a.pdf · Los factores con niveles aleatorios los encontraremos, ademas de en los

Analisis de la varianza, parte tercera 5

Para el calculo de las Esperanzas Medias cuadraticas (EMC) se aplicanlas siguientes reglas:

a) La EMC de cada efecto se determinara atendiendo a los subındices pre-sentes en el mismo. Por ejemplo, el subındice “i” para el efecto τi y a lossubındices “i”, “j” para el efecto (τβ)ij.

b) La EMC de cada efecto tiene varios sumandos correspondientes a losdiferentes efectos que contienen todos los subındices del efecto consid-erado. Por ejemplo, la EMC del efecto τi estara compuesta por un ter-mino correspondiente al propio efecto τi, un termino correspondiente alefecto νk(i), un termino del efecto (τβ)ij, un termino del efecto (βν)jk(i)y uno del efecto ε(ijk)lya que todos contienen el subındice “i”.

Para el calculo de la EMC del efecto (τβ)ij habrıa que tener en cuenta

un termino del propio efecto (τβ)ij, un termino del efecto (βν)jk(i) yotro termino del efecto de error ε(ijk)l. No existiran, pues, sumandoscorrespondientes a aquellos efectos que no contienen todos los subındicesdel efecto en cuestion como es el caso de βj en el calculo de la EMC deτi.

c) Para proceder al calculo de los diferentes sumandos, se ocultan previ-amente las columnas de la tabla que contienen los subındices activosdel efecto considerado. Por ejemplo, se ocultara la primera columna denumeros para el calculo de los sumandos del efectos τi y la primera ysegunda columnas de numeros para el calculo de los sumandos del efecto(τβ)ij.

d) Teniendo en cuenta tan solo las columnas de numeros no ocultas, cadatermino de la suma sera la varianza correspondiente afectada por uncoeficiente equivalente al producto de los numeros visibles de la tabla.Por ejemplo, la EMC del efecto τi, tendrıa sus terminos afectados porel coeficiente 2 · 4 · 2 = 16 correspondiente a la primera fila, 2 · 1 · 2 = 4de la tercera fila, 0 · 4 · 2 = 0 de la cuarta fila, 0 · 1 · 2 = 0 de la quintafila y 1 · 1 · 1 = 1 de la sexta fila. En definitiva, tendremos:

EMC(τi) = 16 ·∑τ 2i

3− 1+ 4σ2ν + σ2

Observese que se han anulado los terminos correspondientes a los efec-tos (τβ)ij, (βν)jk(i) que, en principio, debieran figurar pero que hanresultado afectados por coeficientes nulos al realizar el correspondiente

Page 8: ANALISIS DE LA VARIANZA PARTE TERCERAalfonsotrigueros.com/wp-content/uploads/2013/03/presentacion3a.pdf · Los factores con niveles aleatorios los encontraremos, ademas de en los

6 Analisis de la varianza

producto. Notese, tambien, que la varianza del efecto fijo tiene la expre-

sion

∑τ 2i

a− 1y la de los efectos “random” las notaciones σ2ν y σ2.

Para el efecto (τβ)ij, la correspondiente EMC tendrıa (tras ocultarlas dos primeras columnas) los coefientes 4 · 2 = 8 correspondientes

a

∑(τβ)ij

(3− 1)(2− 1); 1 · 2 = 2 al termino σ2βν y 1 · 1 = 1 al termino de error

σ2. En conclusion:

EMC(τβ)ij = 8 ·∑

(τβ)ij(3− 1)(2− 1)

+ 2σ2βν + σ2

Los terminos correspondientes a los efectos fijos se suelen simplificar con

la notacion Ø. Ası, 8 ·∑

(τβ)ij(3− 1)(2− 1)

= 8Øτβ

De la misma manera, calculamos las EMC de los restantes efectos.

e) El numero de g.d.l. asociado con cualquier efecto equivale al producto delnumero de niveles menos uno de los subındices fuera de parentesis(activos) y del numero de niveles correspondientes a los subındicesdentro de parentesis (pasivos). Ası, para el efecto (βν)jk(i), los g.d.l

seran: (2− 1) · (4− 1) · 3 = 9.

Con todo lo dicho, la tabla completa sera:

��9

��9

��9��9

��9

F F R R3 2 4 2

Fuente Variabilidad g.d.l. i j k l EMCτi 2 0 2 4 2 σ2 + 4σ2ν + 16øτβj 1 3 0 4 2 σ2 + 2σ2βν + 24øβνk(i) 9 1 2 1 2 σ2 + 4σ2ν(τβ)ij 2 0 0 4 2 σ2 + 2σ2βν + 8Øτβ

βνjk(i) 9 1 0 1 2 σ2 + 2σ2βνε(ijk)l 24 1 1 1 1 σ2

Anadiremos, finalmente, que cuando exista algun factor de tipo “ran-dom”, sus interaciones con otros factores seran tambien“random”. Noteseque un factor anidado en otro nunca interacciona con ese factor. Porejemplo, νk(i) no interacciona con τi pero que, sin embargo, puede inter-accionar con otros factores, por ejemplo, en la interaccion βνjk(i) inter-actua νk(i) con βj.

Page 9: ANALISIS DE LA VARIANZA PARTE TERCERAalfonsotrigueros.com/wp-content/uploads/2013/03/presentacion3a.pdf · Los factores con niveles aleatorios los encontraremos, ademas de en los

Analisis de la varianza, parte tercera 7

Sobre el significado de las flechas en la columna EMC trataremos a con-tinuacion. Para determinar si un efecto tiene influencia estadısticamentesignificativa sobre la variable de respuesta es preciso efectuar el test Fque consiste en el cociente de la media cuadratica (MC) del efecto encuestion entre la MC del efecto cuya EMC difiera solamente en el ter-mino correspondiente a su propia varianza. Por ejemplo, para saber siel efecto τi es estadısticamente significativo efectuaremos el cociente desu MC entre la MC de νk(i) dado que la EMC de τi es σ2 + 4σ2ν + 16φτ y

la de νk(i) es σ2 + 4σ2ν y difiere solo de ella en el termino 16φτ . La teorıaestadıstica nos define que dicho ratio sigue una distribucion F de Fisher-Snedecor con 2 y 9 g.d.l. Si su valor supera el valor crıtico de F para elnivel de significacion escogido (por ejemplo α = 5 %), concluiremos queel efectos del factor τi es significativo.

Recordemos que si tenemos dos muestras de tamanos n1 y n2 obtenidas,respectivamente, de dos colectivos con distribucionesN(µ1, σ1) yN(µ2, σ2)

siendo s1, s2 estimas de σ1, σ2; se cumple que el estadısticos21σ

22

s22σ21

sigue

una distribucion Fn1−1,n2−1.

Bajo la hipotesis nula (HO) de que φτ = 0, el ratio de las dosEMC sera 1:

σ22σ21

=EMC τi

EMC νK(i)=σ2 + 4σ2ν + 16φτ

σ2 + 4τ 2ν= 1

Entoncess21s22

seguira una distribucion zn1−1,n2−1

3. MODELOS ALEATORIOS Y MODELOS MIXTOS

Como desarrollo de lo hasta aquı expuesto, vamos a considerar dosModelos Aleatorios (con uno y dos factores) y un Modelo Mixto.

Page 10: ANALISIS DE LA VARIANZA PARTE TERCERAalfonsotrigueros.com/wp-content/uploads/2013/03/presentacion3a.pdf · Los factores con niveles aleatorios los encontraremos, ademas de en los

8 Analisis de la varianza

3.1. Modelo Aleatorio con un factor

Para un Diseno factorial con un unico factor A con infinitos niveles delos que se han seleccionado al azar p niveles y efectuado para cada nivel “r”repeticiones, el modelo sera:

yij = µ+ τi + εij

yij : Son los valores obtenidos para la variable de respuesta. El subındice“i” indica los niveles seleccionados del factor: 1,2...p. El subındice “j” serefiere al numero de orden en las “r” repeticiones.

µ : Valor medio de la variable de respuesta.

τi : El efecto τi es una variable aleatorıa que se supone conforme con unadistribucion Normal de media cero y desviacion tıpica στ que repre-sentaremos por N(0, στ).

εij : Termino residual que suponemos conforme con una distribucion normalN(0, σ).

Veıamos (pagina 7 de la Parte Primera) que la Esperanza media cuadraticapara el modelo con un factor de niveles fijos era:

σ2 +r∑i=p

i=1 τ2i

p− 1= σ2 + rφτ

En el modelo con un factor aleatorio, el calculo de las Esperanzas mediascuadraticas lo efectuaremos mediante el algoritmo de la pag 2 elaborandola correspondiente tabla segun lo expuesto en el punto 2:

R Rk r

Fuente Variabilidad g.d.l. i j EMCτi p-1 1 r σ2 + rσ2τεj(i) p(r-1) 1 1 σ2

Notese que, en la tabla, el subındice indicativo de la replicacion “j” seconsidera anidado en el subındice “i”.

Page 11: ANALISIS DE LA VARIANZA PARTE TERCERAalfonsotrigueros.com/wp-content/uploads/2013/03/presentacion3a.pdf · Los factores con niveles aleatorios los encontraremos, ademas de en los

Analisis de la varianza, parte tercera 9

Para efectuar el contraste de la hipotesis nula (H0) de que στ = 0, pro-cedemos segun lo indicado en la pag 7 sabiendo que, bajo dicha hipotesis, el

ratioEMC τi

EMC εj(i)=σ2 + rσ2τ

σ2= 1 y que, entonces, al cociente de las medias

cuadraticas seguira una distribucion F de Fisher-Snedecor con (p-1) y p(r-1)grados de libertad. En consecuencia, si el cociente de las medias cruadraticases > Fα,p−1,p(r−1) rechazaremos la hipotesis nula concluyendo que στ 6= 0.

La tabla de Analisis de la Varianza final sera:

Fuente Variacion Suma de Cuadrados g.d.l. Medias Cuadraticas EMC

τi r∑i=p

i=1 (yi − y)2 p-1r∑i=p

i=1 (yi − y)2

p− 1σ2 + rσ2τ

εij∑i=p

i=1

∑j=rj=1 (yij − yi)

2 p(r-1)

∑i=pi=1

∑j=rj=1 (yij − yi)

2

p(r − 1)σ2

Para estimar los parametros σ2 y σ2τ se igualan los valores de las EMC conlas medias cuadraticas obteniendo:

σ2 = MCεij

σ2 + rσ2τ = MCτ i −→ σ2τ =MCτi −MCεij

r

La varianza total de las observaciones vendra dada por σ2yij = σ2τ + σ2.

A los valores σ2τ y σ2 se les denomina Componentes de la Varianza

Ejemplo de Modelo con un factor aleatorio

Con objeto de cuantificar la influencia de la variabilidad entre lotes enun suministro de “pellets” de mineral de Fe, se ha realizado un experimentoconsistente en seleccionar aleatoriamente cinco lotes. Sobre cada lote se hantomado tres muestras para determinacion de la ley en Fe. Los 15 ensayos hansido efectuados por el mismo analista en el orden completamente aleatorizadoindicado en la pag 13 y con los resultados en ella indicados.

Los calculos se han efectuado con el programa estadısticoSTATGRAPHICS y la discusion de resultados, calculos y conclusiones serecogen en las paginas 9 a 13.

Page 12: ANALISIS DE LA VARIANZA PARTE TERCERAalfonsotrigueros.com/wp-content/uploads/2013/03/presentacion3a.pdf · Los factores con niveles aleatorios los encontraremos, ademas de en los

10 Analisis de la varianza

Discusion de resultados

El modelo ANOVA al que se ajustan los resultados obtenidos es:

%Fe = µ+ τi + εij

%Fe : Valores obtenidos para la variable de respuesta.

µ : Valor medio.

τi : Efectos del factor “Lotes” que se supone N(0, στ)

εij : Termino residual segun una distribucion N(0, σ)

El unico factor considerado: “Lotes” es aleatorio con, teoricamente, in-finitos niveles de los que han sido seleccionados, al azar, cinco de ellos.

La tabla de Analisis de la Varianza (pags. 11 y 12) muestra que el efectodel factor “lotes”, con un elevado valor para el contraste F con 4 y 10g.d.l (F=56,93), es significativo.

La EMC para τi, que segun lo indicado en la pag. 8, equivale aEMC(τi) =σ2+rσ2τ = σ2+3σ2τ se iguala a la Media Cuadratica del efecto τi mientrasque σ2 se iguala a la Media Cuadratica residual:

σ2 +3σ2τ = 0,808373σ2 = 0, 0142

}De aquı se deduce el valor σ2τ = 0, 264724 que coincide con el indicadopara los componentes de la Varianza al final de la pag 11.

La variabilidad total de los resultados obtenidos viene dada por:

Varianza ( % Fe) = σ2τ + σ2 = 0, 278924

La mayor parte de esta variabilidad viene representada por σ2τ = 0, 264724que supone un 94,9 % de la variabilidad total.

CONCLUSION

El efecto del factor “lotes” es significativo. como accion correctora sedesprende solicitar del Proveedor la reduccion de la variabilidad entrelotes.

Page 13: ANALISIS DE LA VARIANZA PARTE TERCERAalfonsotrigueros.com/wp-content/uploads/2013/03/presentacion3a.pdf · Los factores con niveles aleatorios los encontraremos, ademas de en los

Analisis de la varianza, parte tercera 11

Page 14: ANALISIS DE LA VARIANZA PARTE TERCERAalfonsotrigueros.com/wp-content/uploads/2013/03/presentacion3a.pdf · Los factores con niveles aleatorios los encontraremos, ademas de en los

12 Analisis de la varianza

Page 15: ANALISIS DE LA VARIANZA PARTE TERCERAalfonsotrigueros.com/wp-content/uploads/2013/03/presentacion3a.pdf · Los factores con niveles aleatorios los encontraremos, ademas de en los

Analisis de la varianza, parte tercera 13

Page 16: ANALISIS DE LA VARIANZA PARTE TERCERAalfonsotrigueros.com/wp-content/uploads/2013/03/presentacion3a.pdf · Los factores con niveles aleatorios los encontraremos, ademas de en los

14 Analisis de la varianza

3.2. Modelo Aleatorio con dos factores

En un Diseno factorial con dos factores A y B de infinitos niveles cada uno,se seleccionan, respectivamente, “p” y “q” niveles. Se efectuan “r” repeticioneslo que supone un total de “p q r” experimentos elementales y el siguientemodelo:

yijk = µ+ τi + βj + (τβ)ij + εijk

yijk : Valores obtenidos para la variable de respuesta. El subındice “i” indicalos niveles seleccionados del factor A: 1, 2, ... p. El subındice“j” se refierea los niveles seleccionados para el factor B:1,2,...q y el subındice “k” alnumero de orden en las “r” repeticiones.

µ : Valor medio de la variable de respuesta.

τi : Efecto del factor aleatorio A que se supone conforme con una distribu-cion N(0, στ)

βj : Efecto del factor aleatorio B que se supone conforme con una distribu-cion N(0, σβ)

(τβ)ij : efecto de la interaccion de los factores A y B que se supone conforme

con N(0, στβ).

εijk : Termino residual conforme con una distribucion N(0, σ)

En el modelo con dos factores, el calculo de las Esperanzas medias cuadrati-cas lo efectuaremos segun lo siguiente:

Page 17: ANALISIS DE LA VARIANZA PARTE TERCERAalfonsotrigueros.com/wp-content/uploads/2013/03/presentacion3a.pdf · Los factores con niveles aleatorios los encontraremos, ademas de en los

Analisis de la varianza, parte tercera 15

Las flechas indican la forma de efectuar los contrastes “F” para determi-nar cuales son las fuentes de variabilidad estadısticamente significativas. Porejemplo, para el contraste del factor A se calculara el cociente entre la mediacuadratica de dicho factor (inicio de la flecha) y la media cuadratica del efectoτβij (final de la flecha). El numerador del contraste “F” tendrıa (p-1) g.d.ly el denominador (p-1)(q-1) g.d.l. El contraste para el factor B se realizarade forma similar utilizando, tambien, como denominador la media cuadraticadel efecto τβij (final de la flecha) mientras que el contraste para el efecto dela interaccion AB se efectua mediante el cociente de la media cuadratica delefecto τβij (inicio de la flecha) y de la media cuadratica del error (final de laflecha).

La varianza total de las observaciones vendra dada por:

V arYijk = σ2τ + σ2β + σ2τβ + σ2

La tabla de Analisis de la Varianza quedara:

Tabla de Analisis de la Varianza para dos factores aleatorios

Fuente de Variacion Suma de Cuadrados g.d.l Medias Cuadraticas Ratios F

Factor A SCA (p-1) MCA =SCA

p− 1

MCA

MCAB

Factor B SCB (q-1) MCB =SCB

q − 1

MCB

MCAB

Interaccion AB SCAB (p-1)(q-1) MCAB =SCAB

(p− 1)(q − 1)

MCAB

MCRESIDUAL

Residual SCRESIDUAL pq(r-1) MCRESIDUAL =SCRESIDUAL

pq(r − 1)

Total SCTOTAL pqr-1

Observese que para calcular los ratios “F” han sido utilizados como de-nominadores las medias cuadraticas indicadas en la pag. 14.

Page 18: ANALISIS DE LA VARIANZA PARTE TERCERAalfonsotrigueros.com/wp-content/uploads/2013/03/presentacion3a.pdf · Los factores con niveles aleatorios los encontraremos, ademas de en los

16 Analisis de la varianza

Para estimar los valores de los diferentes componentes de la varianzaigualamos las medias cuadraticas a las EMC correspondientes:

σ2 = MCRESIDUAL

σ2 + rσ2τβ = MCAB −→ σ2τβ =MCAB −MCRESIDUAL

r

σ2 + qrσ2τ + rσ2τβ = MCA −→ σ2τ =MCA −MCAB

qr

σ2 + prσ2β + rσ2τβ = MCB −→ σ2β =MCB −MCAB

pr

EJEMPLO de Modelo con dos factores aleatorios

En la variabilidad registrado para la ley en Fe de un suministro de mineralse considera que los factores de influencia son la variabilidad existente en-tre lotes y la introducida por los operarios que intervienen en los ensayos.A fin de cuantificar la influencia de cada factor, se ha disenado un experi-mento consistente en seleccionar 4 lotes y 3 equipos de operarios entre las,teoricamente, infinitas posibilidades existentes.

Los ensayos se han replicado dos veces con lo que el numero total deensayos ha sido 4x3x2=24.

El experimento ha sido realizado siguiendo el orden completamentealeatorizado indicado en la pag. 21. La discusion de resultados, calculos yconclusiones se recogen en las paginas 16 a 20.

Page 19: ANALISIS DE LA VARIANZA PARTE TERCERAalfonsotrigueros.com/wp-content/uploads/2013/03/presentacion3a.pdf · Los factores con niveles aleatorios los encontraremos, ademas de en los

Analisis de la varianza, parte tercera 17

Discusion de resultados

El modelo ANOVA es: % Fe = µ+ τi + βj + (τβ)ij + εijk

%Fe : Valores obtenidos para la variable de respuesta.

µ : Valor medio.

τi : Efecto del factor Lotes que se supone N(0, στ)

βj : Efecto del factor Operarios que se supone N(0, σβ)

(τβ)ij : Interaccion de los factores Lotes y Operarios segun N(0, στβ)

εijk : Termino residual segun N(0, σ).

La tabla de Analisis de la Varianza (pag 19) indica que los efectos delos factores “Lotes” y “Operarios” son significativos con elevados valorespara el contraste F (F=35,95 y F=41,39 respectivamente). El efecto dela interaccion no es estadısticamente significativo (F=2,29; p=0,1046).Para efectuar los contrastes “F” se han tomado como denominadores lasmedias cuadraticas indicadas por las flechas en las paginas 17 y 19.

Las EMC de acuerdo con lo reflejado en las paginas 14 y 19 son:

Para el calculo de los componentes de la varianza, las anteriores EMCse igualan a las respectivas Medias cuadraticas y σ2 se iguala a la Mediacuadratica residual (pag 19:)

σ2 + 2σ2τβ + 6σ2τ = 74, 6288σ2 + 2σ2τβ + 8σ2β = 85, 933σ2 + 2σ2τβ = 2, 07602σ2 = 0, 906617

Page 20: ANALISIS DE LA VARIANZA PARTE TERCERAalfonsotrigueros.com/wp-content/uploads/2013/03/presentacion3a.pdf · Los factores con niveles aleatorios los encontraremos, ademas de en los

18 Analisis de la varianza

Resolviendo el sistema de ecuaciones resultan los siguientes valores paralos componentes de la varianza:

σ2 = 0, 906617σ2τβ = 0, 58470σ2β = 10, 4821σ2τ = 12, 0921

Estos valores coinciden con los indicadores al final de la pag. 19

La Varianza total de la ley en Fe sera:

V arianza( %Fe) = σ2τ + σ2β + σ2τβ + σ2 = 24, 065517

La participacion del factor “Lotes” supone un 50,2 % y el del factor“Operarios” un 43,6 % de la variabilidad total.

CONCLUSION

Son estadısticamente significativos los efectos de los factores aleatorios“Lotes” y “Operarios” que aportan, respectivamente, un 50,2 % y un 43,6 %de la variabilidad presente en los resultados para la ley de Fe.

Page 21: ANALISIS DE LA VARIANZA PARTE TERCERAalfonsotrigueros.com/wp-content/uploads/2013/03/presentacion3a.pdf · Los factores con niveles aleatorios los encontraremos, ademas de en los

Analisis de la varianza, parte tercera 19

Page 22: ANALISIS DE LA VARIANZA PARTE TERCERAalfonsotrigueros.com/wp-content/uploads/2013/03/presentacion3a.pdf · Los factores con niveles aleatorios los encontraremos, ademas de en los

20 Analisis de la varianza

Page 23: ANALISIS DE LA VARIANZA PARTE TERCERAalfonsotrigueros.com/wp-content/uploads/2013/03/presentacion3a.pdf · Los factores con niveles aleatorios los encontraremos, ademas de en los

Analisis de la varianza, parte tercera 21

Page 24: ANALISIS DE LA VARIANZA PARTE TERCERAalfonsotrigueros.com/wp-content/uploads/2013/03/presentacion3a.pdf · Los factores con niveles aleatorios los encontraremos, ademas de en los

22 Analisis de la varianza

3.3. Modelo Mixto con dos factores

Consideraremos ahora un Diseno factorial con dos factores A y B en elque el factor A es fijo y el factor B es un factor aleatorio. El efecto de lainteraccion AB se considera, tambien, aleatorio. La ecuacion del modelo serasimilar a la del punto 3.2:

Yijk = µ+ τi + βj + (τβ)ij + εijk

Yijk : Valores obtenidos para la variable de respuesta. El subındice “i” indicalos niveles existentes para el factor A: 1,2...p. El subındice “j” indicalos q niveles seleccionados para el factor B:1,2...q y el subındice “k” elnumero de orden en las “r” repeticiones.

µ : Valor medio de la variable de respuesta.

τi : Efecto del nivel “i” del factor A. Se cumple∑τi = 0

βj : Efecto del factor aleatorio segun un distribucion N(0, σβ)

(τβ)ij : Efecto de la interaccion AB que se supone conforme con N(0, στβ). Esteefecto es, tambien, aleatorio.

εijk : Termino residual con distribucion N(0, σ)

Aplicando el algoritmo de Bennet-Franklin obtendremos las Esperanzasmedias cuadraticas (EMC):

Observese que, segun lo indicado por las flechas, para el calculo de los con-trastes “F” los denominadores son distintos que para el caso con dos factores

Page 25: ANALISIS DE LA VARIANZA PARTE TERCERAalfonsotrigueros.com/wp-content/uploads/2013/03/presentacion3a.pdf · Los factores con niveles aleatorios los encontraremos, ademas de en los

Analisis de la varianza, parte tercera 23

aleatorios de la pag 14. El contraste de βj lo realizaremos tomando comodenominador de media cuadratica residual en vez de la media cuadratica dela interaccion.

Tabla de Analisis de la Varianza

Fuentes de Variacion Suma de Cuadrados g.d.l Medias Cuadratica Ratios “F”

Factor A SCA (p-1) MCA =SCA

p− 1

MCA

MCAB

Factor B SCB (q-1) MCB =SCB

q − 1

MCB

MCRESIDUAL

Interaccion AB SCAB (p-1)(q-1) MCAB =SCAB

(p− 1)(q − 1)

MCAB

MCRESIDUAL

Residual SCRESIDUAL pq(r-1) MCRESIDUAL =SCRESIDUAL

pq(r − 1

Total SCTOTAL pqr-1

Para estimar los valores de los componentes de la varianza, igualamos lasmedias cuadraticas a las correspondientes EMC:

σ2 = MCRESIDUAL

σ2 + prσ2β = MCB −→ σ2β =MCB −MCRESIDUAL

pr

σ2 + rσ2τβ = MCAB −→ σ2τβ =MCAB −MCRESIDUAL

r

La varianza total de las observaciones sera:

V arYijk = σ2β + σ2τβ + σ2

El experimento que da lugar a las observaciones consta de pqr experimen-tos elementales que se realizaran en orden completamente aleatorizado.

Page 26: ANALISIS DE LA VARIANZA PARTE TERCERAalfonsotrigueros.com/wp-content/uploads/2013/03/presentacion3a.pdf · Los factores con niveles aleatorios los encontraremos, ademas de en los

24 Analisis de la varianza

4. DISENO CON FACTORES JERARQUIZADOS

Introduccion

En los Disenos Jerarquizados, tambien llamados Anidados, los nivelesdel factor anidado tan solo se combinan con un nivel del otro factor. Supong-amos un diseno con dos factores: A y B de tipo fijo o aleatorio. El factor Atiene tres niveles: 1, 2, 3 mientras que el factor B, que se encuentra anidadoen el A, tiene cuatro niveles: 1, 2, 3 y 4.

���

HHH@@��

���

HHH@@��

���HHH@@��

Diseno Anidado

Factor A 1 2 3

Factor B 1 2 3 4 1 2 3 4 1 2 3 4

Realmente, los niveles 1, 2, 3 y 4 del factor B que se combinan con el nivel1 del factor A son distintos de los niveles 1,2,3 y 4 que se combinan con losniveles 2 y 3 del factor A aunque, nominalmente, parezcan los mismo. Es,en definitiva, como si el factor B tuviera 12 niveles diferentes. La notacionindicativa de que el factor B esta anidado en el A es: B(A). Como ejemplo,consideremos una produccion de piezas fabricadas en tres lıneas de produc-cion distintas (factor A con a=3 niveles) y que disponemos de b=4 lotes depiezas de cada lınea (factor B a b=4 niveles). Nuestro objetivo es cuantificar,para una caracterıstica de calidad de las piezas, por ejemplo la dureza, cuales la influencia de cada uno de los dos factores: Linea de fabricacion (A) ylotes (B). Es evidente que el lote 1 procedente de la lınea 1 no es el mismoque el lote 1 procedente de la lınea 2.

Page 27: ANALISIS DE LA VARIANZA PARTE TERCERAalfonsotrigueros.com/wp-content/uploads/2013/03/presentacion3a.pdf · Los factores con niveles aleatorios los encontraremos, ademas de en los

Analisis de la varianza, parte tercera 25

Es importante distinguir los Disenos Anidados de los Disenos Factoriales.En estos ultimos, con un diseno para dos factores A y B con a=3 y b=4niveles cada uno, el esquema de las combinaciones entre los niveles de ambosfactores serıa:

Aquı, el nivel 1 del factor B es identico para las tres combinaciones exis-tentes con los niveles 1,2 y 3 del factor A.

Modelo

Los modelos correspondientes a los Disenos jerarquizados no contemplanla presencia de interacciones y son, para dos factores A y B, del tipo:

Yijk = µ+ τi + βj(i) + ε(ij)k

Donde:

Yijk : Valores obtenidos para la variable de respuesta.

µ : Valor medio de la variable de respueta.

τi : Efecto del factor A con a niveles.

βj(i) : Efecto del factor B anidado en el factor A con b niveles.

ε(ij)k : Termino residual con distribucion N(0, σ). El subındice “k”. indicativodel orden de las “r” repeticiones, se considera anidado en “ij”.

Dado que los factores A y B pueden ser fijos o aleatorios obtendremos,en cada caso, diferentes expresiones para las Esperanzas medias cuadraticas(EMC). Veamos, por ejemplo, dos casos:

Page 28: ANALISIS DE LA VARIANZA PARTE TERCERAalfonsotrigueros.com/wp-content/uploads/2013/03/presentacion3a.pdf · Los factores con niveles aleatorios los encontraremos, ademas de en los

26 Analisis de la varianza

a) A fijo y B aleatorio

b) A y B aleatorios.

Caso a

Caso b

Observese que las EMC para los casos a) y b) son diferentes entre si.

La tabla de Analisis de la Varianza, serıa para ambos casos la siguiente:

Tabla de Analisis de la Varianza

Fuente Variacion Suma de Cuadrados g.d.l Medias Cuadraticas Ratios “F”

Factor A SCA (a-1) MCA =SCA

a− 1

MCA

MCB(A)

Factor B(A) SBB(A) a(b-1) MCB(A) =SCB(A)

a(b− 1)

MCB(A)

MCRESIDUAL

Residual SCRESIDUAL ab(r-1) MCRESIDUAL =SCRESIDUAL

ab(r − 1)

Total SCTOTAL abr-1

Page 29: ANALISIS DE LA VARIANZA PARTE TERCERAalfonsotrigueros.com/wp-content/uploads/2013/03/presentacion3a.pdf · Los factores con niveles aleatorios los encontraremos, ademas de en los

Analisis de la varianza, parte tercera 27

El orden de ejecucion de los experimentos se efectua de forma completa-mente aleatorizada.

Para estimar los componentes de la varianza procederemos, a semejanzade lo realizado en los puntos 3.2 y 3.3, igualando las medias cuadraticas a lasEMC correspondientes. Para el caso b) resultarıa:

σ2 = MCRESIDUAL

σ2 + rσ2β = MCB(A) −→ σ2β =MCB(A) −MCRESIDUAL

r

σ2 + rσ2β + brσ2τ = MCA −→ σ2τ =MCA −MCB(A)

br

Como aplicacion de lo expuesto presentamos como ejemplo un diseno confactores jerarquizados.

EJEMPLO DE DISENO JERARQUIZADO

Con objeto de determinar la influencia relativa de cada componente de lavarianza en la porosidad del coque producido en una Planta Industrial, se haplanificado y ejecutado un Diseno Jerarquizado en el que intervienen lossiguientes factores: Lotes, muestras y analisis. Los Lotes de producciontienen a=3 niveles, las muestras tomadas sobre cada lote b=3 niveles, losanalistas encargados de efectuar los ensayos de cada muestra c=2 niveles yel numero de repeticiones = 2.

En total se efectuaron N = 3 · 3 · 2 · 2 = 36 ensayos de porosidad eje-cutados en el orden completamente aleatorizado indicado en la pag 32. Lostres factores se consideran de tipo aleatorio, es decir, que tanto los lotes,como las muestras y los analistas han sido seleccionados de un colectivo demayor tamano. Como se observa en el esquema, los niveles de cada factor seencuentran anidados en los del anterior:

Page 30: ANALISIS DE LA VARIANZA PARTE TERCERAalfonsotrigueros.com/wp-content/uploads/2013/03/presentacion3a.pdf · Los factores con niveles aleatorios los encontraremos, ademas de en los

28 Analisis de la varianza

Lotes

Muestras

Analistas

Repeticiones

Discusion y Conclusiones

La discusion de resultados, los calculos efectuados con el programa es-tadıstico STATGRAPHICS y las conclusiones se recogen en las paginas 28 a32.

El modelo ANOVA es: %Porosidad = µ+ τi + βj(i) + νk(ij) + εl(ijk)

%Porosidad : Valores obtenidos para la variable de respuesta.

µ : Valor medio.

τi : Efecto del factor aleatorio lotes con a=3 niveles que se suponeN(0, στ)

βj(i) : Efecto del factor aleatorio muestras, anidado en el factor lotes conb=3 niveles que se supone N(0, σβ)

νk(ij) : Efecto del factor aleatorio analistas anidado en el factor muestrascon c=2 niveles que se supone N(0, σν)

εl(ijk) : Termino residual segun N(0, σ) para 2 repeticiones.

Las tablas ANOVA recogidas en las pags. 30 y 31 muestran que los tresefectos son significativos pero al nivel de significacion del 10 % conlos siguientes ratios “F” y probabilidades “p” para el nivel de signifi-cacion:

Factor F “p”Lotes 4,20 0,0724Muestras (Lotes) 3,10 0,0622Analistas (Muestras) 5,18 0,0015

Page 31: ANALISIS DE LA VARIANZA PARTE TERCERAalfonsotrigueros.com/wp-content/uploads/2013/03/presentacion3a.pdf · Los factores con niveles aleatorios los encontraremos, ademas de en los

Analisis de la varianza, parte tercera 29

Para efectuar los contrastes “F” se han tomado como denominador lasmedias cuadraticas indicadas en las pags. 29 y 31

Las EMC aparecen recogidas en la pag 31 y coinciden con las expresionesobtenidas a continuacion:

Para el calculo de los componentes de la varianza las expresiones de lasEMC se igualan a las respectivas medias cuadraticas:

σ2 + 2σ2ν + 4σ2β + 12σ2τ = 57, 597

σ2 + 2σ2ν + 4σ2β = 13, 716

σ2 + 2σ2ν = 4, 42214

σ2 = 0, 853997

Resolviendo el sistema de ecuaciones anterior resulta:

%σ2τ = 3,65675 42,43σ2β = 2,32346 26,96

σ2ν = 1,78407 20,70σ2 = 0,853997 9,91

Los componentes de la varianza y sus porcentajes coinciden con losindicados en la pag 30. La Varianza total es:

Varianza ( %Porosidad) = σ2τ + σ2β + σ2ν + σ2 = 8, 618277

CONCLUSION

Los factores de mayor influencia sobre las Varianza total son los lotes ylas muestras que suponen, respectivamente, un 42,43 % y un 26,96 % de lavarianza total.

Page 32: ANALISIS DE LA VARIANZA PARTE TERCERAalfonsotrigueros.com/wp-content/uploads/2013/03/presentacion3a.pdf · Los factores con niveles aleatorios los encontraremos, ademas de en los

30 Analisis de la varianza

Page 33: ANALISIS DE LA VARIANZA PARTE TERCERAalfonsotrigueros.com/wp-content/uploads/2013/03/presentacion3a.pdf · Los factores con niveles aleatorios los encontraremos, ademas de en los

Analisis de la varianza, parte tercera 31

Page 34: ANALISIS DE LA VARIANZA PARTE TERCERAalfonsotrigueros.com/wp-content/uploads/2013/03/presentacion3a.pdf · Los factores con niveles aleatorios los encontraremos, ademas de en los

32 Analisis de la varianza

Page 35: ANALISIS DE LA VARIANZA PARTE TERCERAalfonsotrigueros.com/wp-content/uploads/2013/03/presentacion3a.pdf · Los factores con niveles aleatorios los encontraremos, ademas de en los

Analisis de la varianza, parte tercera 33

5. DISENO EN PARCELAS DIVIDIDAS(“SPLIT-PLOT”)

Introduccion

El diseno “SPLIT-PLOT” fue utilizado inicialmente por R.A. Fisher en laexperimentacion agrıcola para aquellos casos en los que uno de los factoresprecisara unidades experimentales de mayores dimensiones que las requeridaspor el otro factor. Para simplificar, consideraremos solamente dos factores Ay B con, respectivamente, “a” y “b” niveles cada uno.

Las unidades experimentales mas grandes se denominan parcelas o“plots”y las menores, resultantes de dividir las parcelas en “b” partes, se denominansub-parcelas o “sub-plots”.

En cada parcela se aplica, al azar, uno solo de los “a” tratamientoscorrespondientes a los niveles del factor A, por ejemplo, un determinadotipo de fertilizante, mientras que en cada una de las “b” sub-parcelas en queha quedado dividida la parcela, se siembra una determinanda variedad degrano. Para un numero de replicas “r” se precisan un total de n=ar parcelasy contenidas en ellas un total de N=abr sub-parcelas.

La aplicacion de los tratamientos se efectua aleatoriamente pero conrestricciones. Coexisten, pues, dos aleatorizaciones: Una de ellas asigna los“a” tipos de fertilizante a las parcelas de cada replica y la otra distribuye las“b” variedades de grano entre las sub-parcelas de cada parcela. En definitiva,el diseno “Split-Plot” puede considerarse como dos experimentos diferentessuperpuestos: Uno de ellos estudia la influencia sobre la variable de respuesta(en nuestro ejemplo la produccion de grano) del factor A (tipo de fertilizante)aplicado sobre las parcelas y, el otro, la influencia del factor B (variedad degrano) e interaccion AB observadas sobre las sub-parcelas. Notese, tambien,que los efectos del factor A quedan confundidos con las posibles diferenciasentre los terrenos que constituyen las parcelas.

En la experimentacion industrial, el diseno “Split-Plot” tiene, tambien,un amplio campo de aplicacion y presenta caracterısticas propias. Aquı, seimpone su uso cuando los niveles de factor A, son difıciles de cambiar de unaprueba a la siguiente como lo requerirıa un diseno factorial completamentealeatorizado. Por analogıa con los experimentos agrıcolas, este factor A cuyosniveles no pueden cambiar de un prueba a otra con facilidad, es equivalenteal factor que en la experimentacion agrıcola se aplica a las parcelas mientras

Page 36: ANALISIS DE LA VARIANZA PARTE TERCERAalfonsotrigueros.com/wp-content/uploads/2013/03/presentacion3a.pdf · Los factores con niveles aleatorios los encontraremos, ademas de en los

34 Analisis de la varianza

que el factor B, para el que es facil cambiar de nivel, equıvale al utilizado enlas sub-parcelas.

Mencionamos a continuacion algunas diferencias del diseno “Split-Plot”respecto de los estudiados hasta ahora:

Con los disenos factoriales se diferencia en las restricciones que el diseno“Split-Plot” presenta en la aleatorizacion.

Respecto de los disenos anidados anidados se diferencia en que los nivelesde los factores del diseno “Split-Plot” se combinan entre si, como en losdisenos factoriales, de todas las formas posibles.

El diseno “Split-Plot” es un diseno mas ordenado que el de bloquesaleatorizados ası como este lo es mas que el diseno factorial.

Las diferencias expuestas originan que el modelo de Analisis de laVarianza del diseno “Split-Plot” difiera del de los disenos citados. Sueleser frecuente que, por inadvertencia de las condiciones reales de aleator-izacion bajo las que se ha ejecutado el experimento, se considere y analicecomo si fuera un diseno factorial un diseno que, sin pretenderlo, ha sidoen realidad “Split-Plot”.

MODELO

Seguiremos considerando un modelo para dos factores: factor A con aniveles y factor B con b niveles que dan lugar a un numero de a·b tratamientosdiferentes en cada replica. En total, se efectuan “r” replicas.

La caracterıstica mas sobresaliente del modelo para los disenos“Split-Plot”es que las replicas son consideradas como un tercer factor “R”, a modode bloque, pero capaz de interaccionar con los factores A y B en lasinteracciones: (RA), (RB) y (RAB). El modelo es:

Yijkm = µ+ νi + αj + (να)ij + βk + (νβ)ik + (αβ)jk + (ναβ)ijk + ε(ijk)m

µ : Valor medio.

νi : Efectos del factor Replicacion (R) con niveles 1,2, ... r

αj : Efectos del factor A con niveles 1,2, ... a

Page 37: ANALISIS DE LA VARIANZA PARTE TERCERAalfonsotrigueros.com/wp-content/uploads/2013/03/presentacion3a.pdf · Los factores con niveles aleatorios los encontraremos, ademas de en los

Analisis de la varianza, parte tercera 35

βk : Efectos del factor B con niveles 1,2, ... b

(να)ij : Efectos de la interacion (RA)

(νβ)ik : Efectos de la interacion (RB)

(αβ)jk : Efectos de la interacion (AB)

(ναβ)ijk : Efectos de la interacion (RAB)

ε(ijk)m : Error experimental de varianza σ2

Debemos tener en cuenta que los efectos realmente importantes para elinvestigador son los correspondientes a: A, B y (AB). Los factores A y B losconsideramos fijos y el R como “random”. Por otra parte, como los efectos deA estan confundidos con las diferencias entre parcelas (“plots”), los efectos queel diseno estima con mayor precision son los del factor B y la interacion (AB)correspondientes a las sub-parcelas (“sub-plots”). Por ello, siempre que seaposible, el investigador asignara el factor de mayor interes a las sub-parcelas(factor B).

Para el calculo de las Esperanzas medias cuadraticas (EMC) la disposicionde la tabla para su aplicacion sera la siguiente:

En la tabla observamos que no han quedado grados de libertad (g.d.l.) paraestimar σ2 y que m=1. Por otra parte, la columna referente a las EMC hacepatente que el contraste “F” para establecer si son significativos los efectos αj

Page 38: ANALISIS DE LA VARIANZA PARTE TERCERAalfonsotrigueros.com/wp-content/uploads/2013/03/presentacion3a.pdf · Los factores con niveles aleatorios los encontraremos, ademas de en los

36 Analisis de la varianza

del factor A se realiza frente al termino (να)ij que actua como error parael “plot”. Los efectos βk del factor B se contrastan con relacion al termino(νβ)ij mientras que los efectos (αβ)jk de la interacion (AB) lo hacen frente

a (ναβ)ijk que denominaremos error del sub-plot. Se pone de manifiestoque no es posible efectuar el contraste de los efectos νi del factor R ni dealgunos otros terminos del modelo. Esto no supone una limitacion de entidadya que podemos contrastar los efectos correspondientes a los factores A y Bası como los de la interacion (AB) que son los objetivos de nuestro estudio. Enel siguiente ejemplo de aplicacion ampliamos y completamos algunos aspectosde lo hasta aquı expuesto.

EJEMPLO DE DISENO “SPLIT-PLOT”

En el presente caso se desea cuantificar la influencia de dos factores: Mezclade carbones (factor A) y Tiempo de coquizacion (factor B) sobre la granu-lometrıa del coque metalurgico obtenido en una Planta de Coquizacion encuanto al porcentaje de tamano superior a 90mm.

El experimento disenado consta de dos factores fijos A y B con, respectiva-mente, a=4 mezclas distintas y b=3 tiempos de coquizacion diferentes (18h,20h y 24 horas). Se ha decidido realizar r=4 replicas. La necesidad de disenarun experimento “Split-Plot” se deriva del hecho de que las mezclas son fac-tores con niveles difıciles de cambiar de una prueba a la siguiente mientrasque los tiempos de coquizacion no presentan dificultad en el cambio. Estasituacion hace impracticable un diseno factorial que exigirıa una completaaleatorizacion y los consiguientes cambios de nivel de los dos factores de unaprueba a la siguiente. El esquema general del experimento es el siguiente:

Page 39: ANALISIS DE LA VARIANZA PARTE TERCERAalfonsotrigueros.com/wp-content/uploads/2013/03/presentacion3a.pdf · Los factores con niveles aleatorios los encontraremos, ademas de en los

Analisis de la varianza, parte tercera 37

Porcentaje de coque superior a 90mm

Replica (R) Replica 1 Replica 2 Replica 3 Replica 4r=4

Mezclas Mezclas Mezclas MezclasMezcla (A)

a=4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4

Tiempo (B)b=3

1(18h) x x x x x x x x x x x x x x x x2(20h) x x x x x x x x x x x x x x x x3(24h) x x x x x x x x x x x x x x x x

En nuestro caso, dado que sus niveles son costosos de cambiar, el factor Aconstituira dentro de cada replica una parcela o“plot”. Cada una de las cuatromezclas servira para alimentar los hornos con el carbon necesario para trescoquizaciones sucesivas a tres tiempos diferentes de coquizacion que seran losniveles del factor B que realizaremos sin cambiar de mezcla.

Cada una de las coquizaciones constituira un “sub-plot”. Tras concluir lascoquizaciones correspondientes al primer “plot”, se cambia a otra mezcla queservira para efectuar tres nuevas coquizaciones y ası se procede, sucesiva-mente, hasta finalizar la replica.

El orden de ejecucion de los experimentos, en cuanto a la asignacion demezclas en cada “plot” y los tiempos aplicados a cada “sub-plot”, ha sidoaleatorio y de acuerdo con la secuencia senalada en la pag 40

Page 40: ANALISIS DE LA VARIANZA PARTE TERCERAalfonsotrigueros.com/wp-content/uploads/2013/03/presentacion3a.pdf · Los factores con niveles aleatorios los encontraremos, ademas de en los

38 Analisis de la varianza

Discusion y Conclusiones

La discusion, calculos y conclusiones estan contenidas en las pags. 38 a44.

Aplicando el algoritmo para el calculo de las EMC segun lo indicado enla pag 35 tenemos:

La tabla de Analisis de la Varianza para los resultados obtenidos, similara la de la pag 41, es la siguiente:

Page 41: ANALISIS DE LA VARIANZA PARTE TERCERAalfonsotrigueros.com/wp-content/uploads/2013/03/presentacion3a.pdf · Los factores con niveles aleatorios los encontraremos, ademas de en los

Analisis de la varianza, parte tercera 39

Notese que los test “F”para las fuentes de variabilidad de interes se efec-tuan utilizando como denominadores las medias cuadraticas indicadasen la pag 38 y de acuerdo con la columna EMC de la pag. 38:

Fuente Variabilidad Denominador test “F”Mezcla Replica * MezclaTiempo Replica * TiempoMezcla * Tiempo Replica * Mezcla * Tiempo

Por los valores obtenidos para “F” y los correspondientes niveles de sig-nificacion (probabilidades “p” inferiores a 0,05) se concluye que son es-tadısticamente significativos los factores Mezcla y Tiempo asi comola interaccion Mezcla * Tiempo.

Aunque el diseno no permite, por falta de grados de libertad, estimar lavarianza σ2 del residual ni por consiguiente realizar el contraste“F”parael factor Replica y sus interacciones, ha hecho posible la evaluacion delos factores en los que estabamos interesados

Los resultados de un experimento dispuestos en una tabla como la de lapag. 37 no orientan sobre las posibles restricciones a la aleatorizacion aque ha estado sujeto.

Un error bastante frecuente es efectuar el analisis de un diseno “Split-Plot” como si se tratara de un diseno completamente aleatorizado.

En la pag 44 hemos recogido los resultados obtenidos al efectuar elprocedimiento incorrecto para su comparacion con los del procedimientoadecuado. Aunque en este caso las conclusiones serıan bastante similares,en otras ocasiones suelen originarse conclusiones divergentes.

Conclusiones

Las tablas y graficos de las pags 42 y 43 presentan los efectos de los factoresprincipales A y B ası como los de su interaccion AB. Para el factor A(Mezcla)se aprecia un resultado netamente superior en la Mezcla 4 (67,87 %) que en lasrestantes. En el factor B (Tiempo), el nivel 3 (tiempo de coquizacion=24h.)presenta una respuesta media de 68,04 % sensiblemente superior a la de lostiempos restantes. Para la interaccion AB, la combinacion de los niveles A=4y B=3 produce un resultado elevado (72,57 %) en la variable de respuesta.

Page 42: ANALISIS DE LA VARIANZA PARTE TERCERAalfonsotrigueros.com/wp-content/uploads/2013/03/presentacion3a.pdf · Los factores con niveles aleatorios los encontraremos, ademas de en los

40 Analisis de la varianza

Page 43: ANALISIS DE LA VARIANZA PARTE TERCERAalfonsotrigueros.com/wp-content/uploads/2013/03/presentacion3a.pdf · Los factores con niveles aleatorios los encontraremos, ademas de en los

Analisis de la varianza, parte tercera 41

Page 44: ANALISIS DE LA VARIANZA PARTE TERCERAalfonsotrigueros.com/wp-content/uploads/2013/03/presentacion3a.pdf · Los factores con niveles aleatorios los encontraremos, ademas de en los

42 Analisis de la varianza

Page 45: ANALISIS DE LA VARIANZA PARTE TERCERAalfonsotrigueros.com/wp-content/uploads/2013/03/presentacion3a.pdf · Los factores con niveles aleatorios los encontraremos, ademas de en los

Analisis de la varianza, parte tercera 43

Page 46: ANALISIS DE LA VARIANZA PARTE TERCERAalfonsotrigueros.com/wp-content/uploads/2013/03/presentacion3a.pdf · Los factores con niveles aleatorios los encontraremos, ademas de en los

44 Analisis de la varianza

Page 47: ANALISIS DE LA VARIANZA PARTE TERCERAalfonsotrigueros.com/wp-content/uploads/2013/03/presentacion3a.pdf · Los factores con niveles aleatorios los encontraremos, ademas de en los

Analisis de la varianza, parte tercera 45

BIBLIOGRAFIA

1. E.P.Box, W.G. Hunter and J.S. Hunter (1989). Estadıstica para inves-tigadores. Editorial Reverte.

2. G. Cochran y G.M.Cox (1987). Disenos Experimentales. Editorial Tril-las.

3. C. Daniel (1976). Applications of Statistics to Industrial Experimenta-tion. John Wiley & Sons.

4. A. Fernandez de Troconiz (1987). Modelos Lineales. Universidad delPaıs Vasco.

5. R.A. Fisher. Statistical Methods for Research Workers (1946). 10ª Edi-cion. Traduccion de Aguilar (1949).

6. J.F. Hair, R.E. Anderson, R.L.Tatham, W.L. Tatham, W.C. Black (1999)Analisis Multivariante, 5ª ed. Prentice Hall Iberia.

7. C.R. Hicks (1973). Fundamental Concepts in the Design of Experiments.Editorial Holt.

8. D.R. Kleinbaum (1987). Applied Regression Analysis and Other Multi-variable Methods. Editorial PWS-KENT.

9. Montgomery, D.C. (2001). Design and Analysis of Experiments. FifthEdition. John Wiley & Sons.

10. Montgomery, D.C., Peck, E.A., and Vining, G.G. (2001). Introductionto Linear Regression Analysis. John Wiley & Sons.

11. D.Pena. Estadıstica. Modelos y Metodos. 2ª edicion (1989). Alianza Ed-itorial.

12. Programa Estadıstico Statgraphics version 5 de Statistical GraphicsCorporation, (USA) (2000).