DISE+æOS EXPERIMENTALES UCV

download DISE+æOS EXPERIMENTALES UCV

of 63

Transcript of DISE+æOS EXPERIMENTALES UCV

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    1/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    1

    PRUEBA DE HIPOTESIS

    Hipótesis

    Es el enunciado acerca de una población, elaborado con el propósito de ponerlo aprueba

    Prueba de hipótesis

    Procedimiento basado en la evidencia muestral y en la teoría de probabilidad que se emplea para

    determinar si la hipótesis es un enunciado razonable.

    Procedimiento para probar una hipótesis:

    1.- Plantear la hipótesis nula y la hipótesis alternativa ó .

    Hipótesis nula .- Hipótesis planteada con el objetivo de ser probada. Podemos aceptarla o rechazarla.

    Tal hipótesis es una afirmación que se aceptará si los datos muestrales no pueden proporcionar evidencia

    convincente que es falsa.

    Hipótesis alternativa .- Denominada también hipótesis de investigación. Afirmación que se

    aceptará si los datos muestrales proporcionaron amplia evidencia de que es falsa

    2.- Seleccionar el nivel de significancia.-  Nivel de significancia es la probabilidad de rechazar la

    hipótesis nula cuando es verdadera. Al nivel de significación se le denomina , también se le conoce con

    el nombre de nivel de riesgo.

    Generalmente se usa el nivel del 5% para proyectos de investigación, 1% para el aseguramiento de

    calidades y 10% para encuestas políticas.

    En el proceso de probar una hipótesis podemos cometer dos tipos de errores: error del tipo I o del tipo II.

    Error tipo I es rechazar la hipótesis nula ( cuando en realidad es verdadera.

    Error tipo II es aceptar la hipótesis nula ( cuando en realidad es falsa

    Hipótesis nula Se acepta Se rechaza

    Ho es verdadera Decisión Correcta ErrorHo es falsa Error Decisión Correcta

    3.-Calcular el valor estadístico de prueba.- Existen muchos valores estadísticos de prueba: z, t, chi

    cuadrado, F, etc.

    Es el valor obtenido a partir de la información muestral que se utiliza para determinar si se rechaza la

    hipótesis nula.

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    2/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    2

    4.- Formular la regla de decisión.- Es un enunciado de las condiciones según las que se acepta o se

    rechaza la hipótesis nula.

    Valor crítico es el valor que es el punto divisorio entre la región de aceptación y la región de rechazo de la

    hipótesis nula

    5.-Toma de decisión.- Es aceptar o rechazar la hipótesis nula.

    Potencia de una prueba.- Es la probabilidad de tomar la decisión acertada de rechazar cuando esta

    es falsa o de aceptar cuando esta es verdadera. La potencia de una prueba se calcula mediante 1 . 

    Prueba para la media de la población: Muestra grande

    Prueba de hipótesis con muestras grandes (n 30) respecto a una media de población para una

    prueba de dos colas (bilateral) de la forma:

    Ho µ =

    Ha µ

    Estadístico de prueba: conocida

    Z=

    Estadístico de prueba: desconocida:

    Z=

    Regla de rechazo a un nivel de significancia :

    Rechazar si Z - Z ó Z Z

    Ejemplo

    La tasa anual de resurtido de botellas de aspirinas es 6.0 (esto indica que las existencias del medicamentotienen que renovarse en promedio 6 veces al año en un establecimiento). La desviación estándar es 0,50.

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    3/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    3

    Se sospecha que el volumen de ventas promedio ha cambiado y no es 0,60. Se utilizará el nivel de

    significancia de 0.05 para probar esta hipótesis.

    a.- Plantee la hipótesis nula y alternativa

     b.- ¿Cuál es la probabilidad de un error tipo I?

    c.- Proporcione la fórmula para el valor estadístico de la prueba.

    d.- Enuncie la regla de decisión

    e.- Se selecciona una muestra aleatoria de 64 frascos de tal producto, con una media de 5.84, ¿Deberechazarse la hipótesis de que la media poblacional es 0.60? Interprete los resultados.

    Solución:

    a.  Ho µ = 6Ha µ

     b.-

    c.- El valor estadístico de la prueba es: Z=

    d.- El valor crítico de 1.96

    Si el valor del estadístico de prueba resulta mayor a 1.96 o menor a -1.96 se rechaza la

    hipótesis nula

    Z=  ═ ═ - 2.56

    Como el valor de la prueba está en la región de rechazo, se rechaza y, por lo tanto, se acepta (la

    tasa media no es igual a 6).

    Ejemplo

    El supermercado local gastó en una remodelación miles de nuevos soles durante muchas semanas.

    Aunque la interrupción espantó a los clientes temporalmente, el gerente espera que los clientes vuelvan a

    disfrutar de las nuevas comodidades. Antes de remodelar, los recibos de la tienda promediaban $ 32 533

     por semana. Ahora que se ha terminado la remodelación, el gerente toma una muestra de 36 semanas para

    ver si la construcción afectó de alguna manera el negocio. Se reportó una media de $34 166 y una

    desviación estándar de $12 955 ¿Qué puede decir el gerente a un nivel de significancia del 1%?

    Solución

    Ho µ = 32 533

    Ha µ

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    4/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    4

    Rechazar Ho si:

    Z - 2.576 ó Z 2.576

    El estadístico de la prueba:

    Z

    0.756

    El valor de prueba está dentro de la zona de aceptación, entonces se acepta Ho Es decir la media es 32

    533 

    Prueba de hipótesis con muestras grandes (n 30) respecto a una media poblacional para pruebas

    de una cola (unilateral) de la forma

    H0

    Ha: µ µo 

    Estadístico de prueba: conocida

    Z=

    Estadístico de prueba: desconocida:

    Z=

    Regla de rechazo a un nivel de significación

    Rechazar si Z Z α 

    Prueba de hipótesis con muestras grandes (n 30) respecto a una media poblacional para pruebas

    de una cola (unilateral) de la forma

    H0: µo

    Ha: µ µo 

    Estadístico de prueba: conocida

    Z=

    Estadístico de prueba: desconocida:

    Z=

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    5/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    5

    Regla de rechazo a un nivel de significación

    Rechazar si Z - Zα 

    Ejemplo.- Una encuesta nacional reciente, encontró que estudiantes de la Universidad miraban un

     promedio de 6.8 DVD por mes. Una muestra aleatoria de 36 estudiantes universitarios de la facultad de

    Agronomía, reveló que el número medio de DVD observado el mes pasado fue de 6.2, con una

    desviación estándar de 0.5. En el nivel de significancia de 0.05. ¿Puede concluirse que los estudiantes de

    la facultad de Agronomía ven menos DVD al mes que los de la Universidad?

    H0: 6.8

    Ha: µ 6.8 

    Regla de la decisión

    Rechazar si Z - 1.645

    Valor de la prueba

    Z=  ═    ═ - 7.2

    Como el valor de la prueba está en la zona de rechazo se concluye rechazando la hipótesis nula, esto es,que los estudiantes de la facultad de Agronomía ven menos DVD, en promedio, que los estudiantes de la

    Universidad

    Pruebas respecto a la proporción poblacional.

    La prueba de hipótesis sobre proporciones se usa cuando queremos determinar si la proporción de los

    elementos en una población, que tiene cierta característica, es mayor, igual o menor que algún valor

    especifico.

    Relación proporcional:

    Es la relación por cociente, o porción relativa, que tiene un atributo particular de interés.

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    6/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    6

    Antes de probar una relación proporcional debemos considerar algunos supuestos y cumplirse algunas

    condiciones:

    -  Los datos muestrales recopilados son el resultado de conteo-  El resultado de un experimento se clasifica como éxito o fracaso-  La probabilidad de éxito se mantiene igual en cada ensayo-  Los ensayos son independientes-  La prueba es adecuada cuando n y n( 1- ) valen al menos 5

    El valor estadístico de prueba Z viene dado por:

    Z ═

    Donde:

     ═ Relación proporcional poblacional 

    Relación proporcional muestral

    n ═ Tamaño de muestra 

    Prueba para la proporción poblacional

    Prueba de hipótesis respecto a una proporción poblacional para pruebas de una cola (unilateral) de

    la forma:

    El estadístico de la prueba

    Z ═  

    Regla de rechazo a un nivel de significación

    Ejemplo  

    Una investigación en la Universidad de Toledo indica que el 50% de los estudiantes cambian su área

     principal de especialización después del primer año en el programa de estudios. Una muestra de 100

    alumnos en la escuela de Administración reveló que 48 de ellos cambió de dicha área después del lapso

    mencionado. ¿Ha habido un decremento significativo en la proporción de estudiantes que cambian su área

    de especialización después del primer año en el programa? Realice la prueba al nivel de significancia de

    0.05.

    n: 100

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    7/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    7

    :  ═  0.48

    0.05

    Regla de decisión

    Rechazar si Z - 1.645 

    El estadístico de la prueba

    Z ═    ═    ═   - 0.4 

    Como Z ═ - 0.4, entonces se acepta , es decir, la proporción de estudiantes que cambian de carrera

    después del primer año no ha tenido un decremento significativo.

    Prueba de hipótesis respecto a una proporción poblacional para prueba de una cola (unilateral) de

    la forma:

    Estadístico de prueba

    Z ═  

    Rechazar si Z Zα Ejemplo Un artículo en la publicación Piura 21 reportó que solo hay un empleo disponible para uno de

    cada tres egresados de la Universidad. Las principales razones aportadas fueron que existe una

    sobrepoblación de estos últimos y una economía débil. Suponga que una encuesta de 200 egresados

    recientes de la Universidad de Jaén reveló que 80 tenían empleo. Al nivel de significancia de 0.02, ¿Se

     puede concluir que tienen trabajo una proporción mayor de egresados de la Universidad de Jaén?

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    8/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    8

    n

    Regla de la decisión.

    Rechazar si Z 2.054

    Valor de la prueba:

    Z ═    ═    ═  2

    Se acepta por lo tanto, la proporción de egresados que tienen trabajo es menor o igual a

    Prueba de hipótesis respecto a una población poblacional para pruebas de dos colas (bilateral) de la

    forma:

    Estadístico de prueba

    Z ═  

    Regla de rechazo a un nivel de significancia α 

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    9/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    9

    Rechazar s ó

    Ejemplo

    Se establece la siguiente hipótesis:

    : p = 0.4

    : p

    Una muestra de 120 observaciones reveló al nivel de significación de 0.05 ¿Puede rechazarse

    la hipótesis nula?

    a,. Establezca la regla de decisión.

     b.- Calcule el valor estadístico de la prueba.

    c.- ¿Cuál es su decisión respecto a la hipótesis nula?

    Solución

    a.- Regla de decisión

    Rechazar si Z -1,96 ó Z 1.96

     b.- Valor de prueba

    Z = -2.24

    c.- Se rechaza , pues el estadístico de prueba cae en la zona de rechazo.

    Prueba de hipótesis con muestras grandes (n respecto a dos medias poblacionales

    Prueba de hipótesis con muestras grandes (n 30) respecto a dos medias poblacionales para una

    prueba de dos colas (bilateral) de la forma

    :

    :

    Estadístico de prueba

    Conocida desconocida

    Z Z

    Donde

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    10/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    10

    Tamaño de muestra Media muestral Variancia poblacional

    Población 1

    Población 2

    Regla de rechazo a nivel de significancia Z   ó Z  Ejemplo

    Una importante compañía de transporte público de Chiclayo debe decidir entre dos marcas de llantas para

    su parque automotor, con un nivel de confianza del 95%. Para tomar una decisión seleccionó una muestra

    aleatoria de 100 llantas de cada marca y encontró que la marca 1 tiene una vida útil de 98 000 Km, en

     promedio, con una desviación estándar de 8 000 Km.

    Por otro lado, las estadísticas calculadas para la marca 2 son, en promedio, de 101 000 Km y desviación

    estándar de 12 000 Km

    Que marca de llantas debería adquirir la compañía de transporte si la diferencia de precios es mínima?

    Solución

             

     = 98 000    = 101 000   

    Regla de decisión

    Rechazar   Z    ó Z   Valor de la prueba

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    11/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    11

    Z =       = - 2.08

    Como -2.08 está en la zona de rechazo, se rechaza

     a un nivel de significancia del 5%. Esto es, existe

    diferencia significativa entre la vida útil promedio de ambas marcas. Sin embargo, no hemos contestado a

    nuestra pregunta inicial de qué marca de llantas se debe adquirir. Realizamos una nueva prueba de

    hipótesis suponiendo que la vida útil media de la marca 2 es mayor que la de la marca 1. Para lo cual

    establecemos la prueba de hipótesis para una cola

    Prueba de hipótesis con muestras grandes (n  respecto a dos medias poblacionales para unaprueba de 1 cola de la forma:

    :

       

     :

         0

    :      :      0Estadístico de prueba

    Conocida desconocida

    Z Z

    Regla de rechazo a un nivel de significancia

     

    Rechazar si Z -

     

    Prueba de hipótesis con muestras grandes (n  respecto a dos medias poblacionales para unaprueba de 1 cola de la forma:

    :      :      0 :      :      0Estadístico de prueba

    Conocida desconocida

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    12/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    12

    Z Z

    Regla de rechazo a un nivel de significación

     

    Rechazar si Z  Del ejercicio anterior, para decidir qué marca comprar, realizamos una nueva prueba de hipótesissuponiendo que la vida útil promedio de la llanta de marca 2 es mayor que la vida útil promedio de la

    marca 1, esto es :

             Usando los mismos datos anteriores tenemos  

    Con los datos mostrados se calcula Z

    Z =       = - 2.08

    Como –  2.08 está en la zona de rechazo tenemos que la marca 2 tiene mayor vida útil promedio que la

    marca 1.Por lo tanto, la compañía de transporte debe abastecerse de la marca 2

    Prueba de hipótesis con muestras grandes (n  para la diferencia entre dos proporciones:La prueba de hipótesis para la diferencia entre dos proporciones se realiza cuando queremos determinar si

    las proporciones de dos poblaciones son o no iguales. La lógica del procedimiento es idéntica para la

    diferencia de las medias poblacionales.

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    13/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    13

    Tomamos una muestra aleatoria de cada población y calculamos las proporciones muestrales; si la

    diferencia entre estas proporciones se puede atribuir al azar, aceptamos la hipótesis de que las dos

     poblaciones tienen igual proporciones.

    Valor estadístico de prueba.

    Z=        Tamaño de muestra Proporción Proporción

    muestral ponderada

    Población 1    Población 2  

      =   =      Alternativamente      

    Ejemplo

    El departamento de investigación en la casa Matriz de una compañía aseguradora, realiza una

    investigación acera de las causas de accidentes automovilísticos, las características de los conductores,

    etc. Se seleccionó una muestra aleatoria de 400 pólizas de seguros expedidas a personas solteras. Se

    descubrió que en el periodo anterior de tres años, 120 sufrieron al menos un accidente automovilístico. Enforma semejante, una muestra de 600 pólizas expedidas a personas casadas reveló que 150 habían tenido

    al menos un accidente. Al nivel de significancia de 0.05, ¿Hay diferencia significativa en las personas

    solteras y casadas que sufrieron un accidente durante un lapso de tres años?

    Solución

       400 600  = 0.30  = 0.25

     

       

     

    Regla de decisión

    Rechazar   Z    ó Z   

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    14/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    14

    Valor de la prueba

    Z=       

      =   =   = 0.27Z=

          = 1.74Como 1.74 está en la región de aceptación se acepta   , no hay diferencia significativaentre las proporciones de personas solteras y casadas que sufrieron un accidente durante un lapso de tres

    años.

    Prueba de hipótesis para muestras pequeñas

    En los casos en los que se desconoce  y el número de observaciones en la muestra es menor a 30, se puede utilizar la desviación estándar muestral, s, como una estimación de , pero no puede utilizar ladistribución de Z como valor estadístico de prueba. La t  de Student o distribución t , sirve como valor

    estadístico de prueba.

    Prueba para la media poblacional

    Se utiliza el mismo procedimiento que en el caso de la muestra grande pero el valor estadístico de prueba

    es el siguiente:

    =

    √  

    Ejemplo

    Por registros pasados se sabe que la vida útil promedio de una pila eléctrica que se utiliza en un reloj

    digital es de 305 días. La vida útil de las pilas se distribuye normalmente. Tal elemento eléctrico fue

    modificado recientemente para que tenga mayor duración. Se probó una muestra de 20 pilas modificadas

    y se encontró que la vida media era de 311 días con una desviación estándar de la muestra de 12 días. Al

    nivel de significancia de 0.05. ¿La modificación incrementó la duración promedio de la pila?

    a.- Plantear la hipótesis nula y alternativa.

     b.- Ilustrar gráficamente la regla de decisión.

    c.- Calcular t   y llegar a una decisión. Resuma la manera breve el resultado.

    Solución:

       Grados de libertad (g.l.): 20 –  1 = 19  Regla de decisión:

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    15/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    15

    Rechazar  si t  Valor de prueba:

    t =  √    √   = 2.24

    Por lo tanto se rechaza  porque 2.24 está en la zona de rechazo. Prueba de dos medias poblacionales: Muestras aleatorias independientes

    Valor de prueba

    t       t  con    –   grados de libertad:

               Donde:

    Tamaño de muestra Media muestral Varianza ponderada

    Población 1      Población 2    Grados de libertad:    – 2Observación

    Las varianzas son desconocidas, pero iguales:

         

    Donde  es un estimador insesgado de  Ejemplo:

    Una muestra de calificaciones en un examen presentado en un curso de Estadística (en escala 100) es:

    Hombres: 72, 69, 98, 66, 85, 76,79 80,77

    Mujeres: 87, 90, 78, 81, 80, 76

    Al nivel de significancia de 0.01, ¿La calificación de las mujeres es más alta que la calificación de los

    hombres?

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    16/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    16

    Solución:  :     :    H M  78 82

    s  9.49 5.40

    n  9 6

    Regla de decisión:

    Rechazar  si t    Valor de la prueba

    t                   = 66.6153

    t     = 0.10Se acepta   porque 0.42 está en la zona de aceptación. Por lo tanto, no se puede afirmar que la

    calificación de las mujeres es más alta que la calificación de los hombres.

    Prueba para la diferencia entre dos medias poblacionales: una prueba de diferencia pareada

    Hay dos casos:

    a.- Caso I:

    < 30Variancias poblacionales desconocidas pero iguales  

    1.-Hipótesis nula: Ho: (µ1 – µ2) = µd = 0

    2.- Hipótesis nula:

    Prueba de una cola Prueba de dos colas

    Ha: µd> 0 Ha: µd 0ó

    Ha: µd < 0

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    17/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    17

    3.- Estadístico de prueba

    t = √ ⁄ =  √ ⁄  

     =

    1 –  

    2

    4.- Región de rechazo: Rechazar Ho cuando

    Prueba de una cola Prueba de dos colas

    t > t t> ⁄   ó t –  t Ejemplo.- Antes de contratar la instalación de un sistema que trasmita música a las oficinas de unaempresa, el gerente selecciona al azar 7 oficinas para instalarles el nuevo sistema. El tiempo promedio en

    minutos que pasaban los empleados fuera de esas oficinas, fue registrado antes y después de instalarse el

    sistema de música, obteniéndose los siguientes resultados

    Numero de oficina  1 2 3 4 5 6 7

    No música  8 9 5 6 5 10 7Con música  5 6 7 5 6 7 8

    ¿Sugeriría Ud. que el ejecutivo proceda con la instalación?  = 0.05Solución

    Ho: µd = 0

    Ha: µd > 0

    No música Con música d8 5 39 6 35 7  –  26 5 15 6  –  110 7 37 8  –  1

    =7,14  =6,28  =0,85  =2,6457t = √ ⁄ = √ ⁄  = √ ⁄  =1,025

    En las tablas t (7-1) 0,05 1,943

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    18/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    18

    Conclusión: No hay una evidencia estadística para afirmar que con la instalación de la música en lasoficinas, los empleados pasaran más tiempo en estas.

    b.. Caso II:

     

    Variancias poblacionales desconocidas pero diferentes    Las hipótesis son las mismas, pero la prueba estadística será:

         

    Los grados de libertad se calculan de la siguiente manera:

    g.l.  

    Los demás pasos son los mismos

    Prueba de hipótesis para la Varianza

    Hay casos que se tiene el problema de desconocer la varianza, o desviación estándar de la población, en

    donde las distribuciones son normales. Si se desea probar una hipótesis acerca de la varianza se puede

    hacer utilizando la distribución de Ji cuadrada (Chi cuadrada). Así mismo, supóngase que se tiene interés

    en dos poblaciones normales independientes, donde las medias y las varianzas de la población son

    desconocidas. Se desea probar la igualdad de las dos varianzas, ya que para poder comparar las medias de

    estas dos poblaciones se ha utilizado la distribución de t  de Student, en la cual podemos tener varianzas

    iguales o diferentes en la población.

    Par conocer esto último se requiere de la distribución F de Fisher, y después de utilizarla se tomará ladecisión de tener o no varianzas iguales en la población, dando pie a realizar la comparación de las dos

    medias según sea el caso. En un primer caso en el que las varianzas de la población son desconocidas,

     pero iguales, o en un segundo caso, donde se tiene varianzas desconocidas, pero diferentes

    Prueba de hipótesis para la varianza de un distribución normal

    A continuación se desarrollará el procedimiento para contrastar hipótesis sobre la varianza

     poblacional , a partir de una muestra aleatoria de n  observaciones de una población normal.Prueba bilateral de la varianza de una población

           

    Estadístico de prueba: =

    Regla de decisión a un nivel de significancia  

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    19/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    19

    Rechazar si:     ó    

    Ejemplo

    Una manera de evaluar la eficacia de un profesor ayudante es analizar las calificaciones obtenidas por sus

    estudiantes en un examen al final del curso. Evidentemente, es interesante la puntuación media, sin

    embargo, la varianza también contiene información útil; algunos profesores tienen un estilo que funciona

    muy bien con los estudiantes más sobresalientes, pero es ineficiente con los estudiantes con menos

    capacidad o menos motivados. Un profesor realiza un examen al final de cada semestre para todas las

    secciones del curso, la varianza de las calificaciones de este examen suelen estar muy próximos a 300 :

    Un nuevo ayudante tiene una clase de 30 estudiantes, cuyas calificaciones en el examen tuvieron una

    varianza de 480; considerando estas calificaciones como una muestra aleatoria de una población normal,

    contrastar la hipótesis nula de que la varianza poblacional de sus calificaciones es 300 frente a una

    alternativa bilateral con 0.05        

    Regla de decisión

    Rechazar si:     ó    Valor de prueba

    =    = 46.40Entonces dado que 45.72, se rechaza  , lo cual significa que la varianza es diferente de 300

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    20/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    20

    Prueba unilateral derecha de la varianza de una población

           

    Estadístico de prueba

    =

    Regla de decisión a un nivel de significancia  Rechazar si:    

    Ejemplo

    Un producto, se debe maquinar determinada parte con tolerancias muy estrechas, para que los clientes la

     puedan aceptar. Las especificaciones del producto piden que la varianza máxima de las longitudes de las

     partes sea 0.0004. Suponga que en 30 partes, la varianza de la muestra resultó ser   0.0005. Pruebecon un

     0.05 si se ha violado la especificación de varianza de la población

           Estadístico de prueba

    = =   = 36.25

    Regla de decisión a un nivel de significancia  Rechazar si:    

    Regla de decisión

    Rechazar si:    Entonces dado que

       , se acepta la Ho, lo cual significa que las especificaciones del producto

    no han sido violadas.

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    21/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    21

    Prueba unilateral izquierda de la varianza de una población

           

    Estadístico de prueba

    =

    Regla de decisión a un nivel de significancia  Rechazar si:    Inferencia acerca de la varianza de dos poblaciones normales

    Distribución de F

    Denominada así por sir Ronald Fisher, uno de los fundadores de la ciencia estadística moderna. Esta

    distribución se utiliza como la entidad estadística de prueba en varios casos, sirve para probar si dos

    muestras proceden de poblaciones con varianzas iguales. Asimismo, también sirve cuando se desea

    comparar simultáneamente varias medias poblacionales, esta comparación simultanea de varias de tales

    medias se denomina análisis de varianza (ANAVA) ó (ANOVA), en estos dos casos las poblacionesdeben ser normales.

    Prueba de hipótesis bilateral respecto a la varianza de dos poblaciones

           Estadístico de prueba F  Regla de decisión a un nivel de significación  Rechaza sí:F   ó F  

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    22/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    22

    Prueba unilateral derecha acerca de la varianza de dos poblaciones normales.

           Estadístico de prueba

    F  Regla de decisión a un nivel de significación  Rechaza sí:

    F  

    Observación.- La varianza muestral más grande se coloca en el numerador, en consecuencia, la razón F

    siempre es mayor a 1. Por lo tanto, el valor crítico de la cola de valores superiores es el único que se

    necesita

    ( ) ( ) Ejemplo:

    La compañía Piura Com realizó un estudio acerca de los hábitos de escuchar radio por parte de los

    hombres y las mujeres. Un aspecto del estudio comprendió el tiempo promedio de audición. Se descubrió

    que tal tiempo para los varones es de 35 minutos al día. La desviación estándar de la muestra de 11

     personas de sexo masculino que se estudiaron fue de 10 minutos diarios. El tiempo promedio de audición

     para las 13 mujeres en el estudio fue también de 35 minutos, pero la desviación estándar de la muestra,

    resultó 12 minutos. Al nivel de significancia de 0.10, ¿es posible concluir que existe diferencia en la

    variación del número de minutos que los hombres y las mujeres escuchan la radio?

           

     

       

       

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    23/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    23

    Recuerde que

      0.36

    Rechaza sí:F  ó F Estadístico de prueba

    F     1.44Por lo tanto, al ser F 1.44 se acepta , lo cual significa que la variación del número de minutos queescuchan radio los hombres es igual al de las mujeres.

    Ejemplo

    En su incansable búsqueda de un sistema de llenado adecuado, cierta empresa prueba dos máquinas.

    Robot Fill se usa para llenar 16 tarros y resulta una desviación estándar de 1.9 onzas en el llenado. Con

    Automatic Fill se llenan 21 frascos que dan desviación estándar de 2.1 onzas. Si la empresa tiene que

    elegir uno de estos sistemas en función de la uniformidad de llenado, ¿Cuál deberá seleccionar? Useun  0.05Solución

    Robot Fill Automatic Fill

         

     

           

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    24/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    24

    De acuerdo a la tabla de F:

       Regla de decisión a un nivel de significación  Rechaza sí: F Estadístico de prueba

    F     Dado que el valor de F es 1.22 se acepta Ho. Por lo tanto, se elige el proceso Automatic Fill porque es el

    que presenta mejor uniformidad de llenado. 

    Prueba de bondad de ajunte e independencia

    Prueba de  Una medida de la diferencia existente entre las frecuencias observadas y esperadas es suministrada por el

    estadístico,  dado por:   ∑  

    Donde

       Frecuencia observada Frecuencia esperada.Ejemplo

    La siguiente tabla muestra las frecuencias observadas al lanzar un dado 120 veces. Ensayar la hipótesis de

    que el dado está bien hecho al nivel de dignificación de 0.05

    Cara 1 2 3 4 5 6

     Frecuencia observada 25 17 15 23 24 16

    Solución

    Hipótesis:  : Las frecuencias observadas y esperadas son significativamente iguales (dado bienhecho). : La frecuencias observadas y esperadas son diferentes (dado cargado)

    Primero se procede a encontrar los valores esperados. La probabilidad de obtener  cualquier numero en un

    dado no cargado es de  Cara 1 2 3 4 5 6 Total

    Frecuencia observada 25 17 15 23 24 16 120

    Frecuencia esperada 20 20 20 20 20 20

    Buscamos el valor en la tabla para K –  1 = 6 –  1 = 5 grados de libertad

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    25/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    25

    Regla de decisión

       

     Rechazar

    11.07

    Valor de la prueba

      ∑      +          = 5Como 5 es menor que 11.07 se acepta la

     y se concluye con una significación de 0.05, que el dado está

     bien hecho

    Tabla de contingencia

    En muchas ocasiones, los n  elementos de una muestra tomada de una población puede clasificarse con

    dos criterios diferentes. Por tanto, es interesante saber si los dos métodos de clasificación son

    estadísticamente independientes.

    El interés recae en probar la hipótesis de que los dos métodos de clasificación renglón  –  columna son

    independientes. Si se rechaza esta hipótesis, entonces, se concluye que existe alguna interacción entre los

    dos criterios de clasificación.

     Ejemplo

    Una asociación de profesores universitarios quiere determinar si la clasificación en el trabajo es

    independiente de la categoría académica. Para ello se realizó un estudio nacional entre los académicos

    universitarios y encontró los resultados que se muestran a continuación, Con α al 0.05 haga una prueba

     para saber si son dependientes la satisfacción en el trabajo y la categoría académica

    CategoríaProfesorAsistente

    Profesorauxiliar

    Profesorasociado

    Profesorprincipal

    Satisfacción Mucha 40 60 52 63En el Regular 78 87 82 88trabajo Poca 57 63 66 64

    .

    Solución

    Planteamiento de las hipótesis

     La satisfacción en el trabajo y la categoría académica son independientes La satisfacción en el trabajo y la categoría académica no son independientesGrados de libertad: (r –  1)(c –  1) = (3 -1)(4 -1) = 6

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    26/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    26

    Regla de decisión

    Rechazar     12.59Se procede a calcular los valores esperados de cada celda:  Donde: i= fila j = columna

    Se toma en cuenta los totales del renglón y la columna

    categoríaProfesorasistente

    Profesorauxiliar

    Profesorasociado

    Profesorprincipal

    Total

    Satisfacción Mucha 40 60 52 63 215En el Regular 78 87 82 88 335trabajo Poca 57 63 66 64 250

    Total 175 210 200 215 800

    Valor de la prueba:

      ∑

     

     =  = 47.03 =  = 56.44 =  = 53.75 =  = 57.78

     =  = 73.28 =  = 87.94 =  = 83.75

     =  = 90.03

     =  = 54.69 =  = 65.62 =  = 62.50 =  = 62.50

    categoríaProfesorasistente

    Profesorauxiliar

    Profesorasociado

    Profesorprincipal

    Total

    Satisfacción Mucha 47.03 56.44 53.75 57.78 215En el Regular 73.28 87.94 83.75 90.03 335trabajo Poca 54.69 65.62 62.50 67.19 250

    Total 175 210 200 215 800

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    27/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    27

       +      = 2.75Como 2.75 es menor que el valor critico 12.59, por lo tanto, no se rechaza

     y se concluye con un α =

    0.05, que la satisfacción en el trabajo y la categoría académica son independiente.  

    Análisis de regresión y correlación

    Análisis de correlación

    Conjunto técnicas estadísticas empleadas para medir la intensidad de la asociación de dos variables.

    Diagrama de dispersión

    Gráfica que presenta la relación entre dos variables.

    Variable dependiente

    Es aquella cuyos datos dependen de otras variables.

    Variable independiente

    Son los valores que no tienen relación de dependencia con otras variables.

    Por convención, la variable conocida o independiente se grafica en el eje de abscisas (x), y la variable

    independiente o estimada en eje de las ordenadas (y)

    Ejemplo

    La empresa Rázuri Hnos. un negocio familiar que ha vendido al menudeo en Piura durante muchos años,

    se anuncia ampliamente por radio y televisión, destacando sus bajos precios y accesibles condiciones decrédito. Al dueño le gustaría analizar la relación entre las ventas y lo que gasta en publicidad. A

    continuación se muestra la información acerca de las ventas y lso gastos de publicidad durante los últimos

    cuatro meses.

    Mes Gastos de publicidad(miles de dólares)

    Ingreso por ventas(miles de dólares)

    Julio 2 7Agosto 1 3

    Setiembre 3 8Octubre 4 10

    Se plantea la hipótesis de que a medida que aumentan los gastos de publicidad, aumentan los ingresos por

    ventas.

    Debemos comenzar por el diagrama de dispersión, que nos permite tener una idea sobre el  grado

    (intensidad) y la naturaleza (forma) de la relación entre las dos variables. Entonces podemos dar cuenta si

    la relación es lineal o no lineal, positiva o negativa, o simplemente no existe una relación aparente.

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    28/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    28

    Observando el diagrama podremos establecer lo siguiente:

    1.- Existe una relación lineal entre los gastos de publicidad y el ingreso por ventas en ese periodo de 4

    meses. Por lo tanto, es posible trazar una línea recta que se ajuste a los puntos graficados en eldiagrama de dispersión

    2.- La relación no es determinística; vale decir, cualquiera que sea la línea recta que se trace, la mayoría

    de los puntos estarán por encima o por debajo de dicha recta. 

    Coeficiente de correlación

    Medida de la intensidad de la relación lineal entre dos variables. Para determinar el valor numérico del

    coeficiente de correlación se utiliza la siguiente expresión

    r =

       

    Donde:

    n= Número de pares de observaciones

    ∑x = Suma de los valores de la variable x  

    ∑y = Suma de los valores de la variable y

    ∑ = Suma de los valores de x elevados al cuadrado

    Cuadrado de la suma de los valores de x

    ∑= Suma de los valores de y elevados al cuadrado = Cuadrado de la suma de los valores de y∑xy = Suma del producto de x e y

    El coeficiente de correlación ( r ) puede tomar cualquier valor de -1.00 a +1.00 inclusive. Un coeficiente

    de correlación -1.00 ó de +1.00 indica una correlación perfecta

    Un coeficiente cercano a cero indica que la relación es débil.

    Con los datos del problema tenemos:

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    29/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    29

    Total

    r =     r =

       = 0.96Por lo tanto existe una fuerte correlación entre el gasto en publicidad y el ingreso por ventas.

    Análisis de regresión

    A través del análisis de regresión buscamos que la línea de ajuste se aproxime lo mejor posible a todos los

     puntos del diagrama de dispersión. La ecuación para la línea recta empleada para calcular y   con base en

    x se conoce como ecuación de regresión.

    Ecuación de regresión

    Expresión matemática que define la relación entre dos variables.

    Principio de mínimos cuadrado 

    Técnica empleada para obtener la ecuación de la regresión, minimizando la suma de los cuadrados de las

    distancias verticales entre los valores y   verdaderos y los valores pronosticados .Dicha recta se define como:

    y = a +bx

    Par determinar la calidad estimadora de esta recta necesitamos alguna medida de la distancia de los

     puntos (  a esta recta. El siguiente grafico muestra, para un solo punto, como se mide esta distancia.Para el valor  el correspondiente valor y   en nuestra recta es a + bx mientras que el valor realmenteobservado para la variable dependiente es .La diferencia entre los dos es:

         

    x y xy    2 7 14 4 491 3 3 1 93 8 24 9 644 10 40 16 100

    10 28 81 30 222

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    30/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    30

    Ahora bien, cualquier estimador razonable de la recta de regresión verdadera dejará algunos de los datos

    observados por debajo y otros por encima de la recta estimada. Por lo tanto, algunos de los   serán positivos y otros negativos

    a =   b =

      b =

       La recta:

    ̂ = a + bxSe denomina recta de regresión muestral de y   sobre x

    El coeficiente b   significa que cada unidad adicional de x   incrementa el valor de y   en b   unidades

    El valor a solo tiene interpretación matemática, indica el punto de corte de la recta con el eje y.

     Ejemplo 

    Los datos siguientes muestran las ventas (en millones) de cajas y los gastos de publicidad (en millones de

    dólares) para 7 marcas principales de refrescos:

    Marca Gastos depublicidad

    Ventas de cajas

    Coca cola 131.3 1929.2Pepsi 92.4 1384.6Kola real 60.4 811.4Sprite 55.7 541.5Inca cola 40.2 536.9Concordia 29.0 535.67 up 11.6 219.5

    a.- Trace un diagrama de dispersión para estos datos, con los gastos de publicidad como variable

    independiente.

     b.- ¿Qué parece indicar este diagrama acerca de la relación entre las dos variables? trace una recta que pase por los datos, para aproximar una relación lineal entre los gastos de publicidad y las ventas.

    c.- Aplique el método de mínimos cuadrados para plantear la ecuación estimada de regresión

    d.- Presente una interpretación de la pendiente de esta ecuación

    Solución:

    Variable independiente: Gastos de publicidad

    Variable dependiente: Ventas de cajas

    Diagrama de dispersión.

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    31/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    31

    El diagrama parece indicar que la relación entre las variables es linealmente positiva.

    Ahora encontraremos los valores de r , a  y b

    Gastos de Publicidad Ventas de cajasx   y   xy

    131.3 17 239.69 1929.2 3 721 812.64 253 303.96

    92.4 8 537.76 1 384.6 1 917 117.16 127 937.04

    60.4 3 648.16 811.4 658 369.96 49 008.56

    55.7 3 102.49 541.5 293 222.25 30 161.55

    40.2 1 616.04 536.9 288 261.61 21 583.38

    29 841 535.6 286 867.36 15 532.4

    11.6 134.56 219.5 48 180.25 2 546.2

    Sumas 420.6 35 119.7 5 958.7 7 213 831.23 500 073.09

    r =

     

     

    r =    = 0.97810014Como r   se aproxima a uno, entonces diremos que la relación que hay entre las dos variables es bastante

    fuerte o intensa.

    La ecuación que mejor se ajusta a los datos es una recta, como se aprecia en el siguiente gráfico.

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    32/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    32

     b =    

     b =

     = 14.42378282a =  

    a =  = - 15.42Por lo tanto la ecuación de la recta seria:

    y = a +bx

    y = - 15.42 + 14.424x

    La interpretación que tiene a   es solo matemática, esto es el punto de corte con el eje y  

    El valor que toma b   se interpreta como: por cada incremento en la variable dependiente se espera una

    variación de 14.424 en la variable dependiente

    Coeficiente de determinación (    )Es el estadístico que mide la proporción de la variación total en y   que puede ser explicada   por la

    variación en x.

    El coeficiente de determinación se calcula elevando al cuadrado el coeficiente de correlación.

    En el ejemplo anterior como r = 0.9781, el coeficiente de determinación será    0.9567, luego pudedecirse que 95.67% de la variación en el número de cajas vendidas se explica por la variación en los

    gastos de publicidad.

    Prueba de significancia del coeficiente de correlación

    Es importante estudiar si r   es significativo (distinto de cero) ya que ello implica que el modelo de

    regresión lineal es significativo.

    Planteamiento de hipótesis:

     0 (la correlación en la población es nula)   (la correlación en la población no es nula)

    Estadístico de prueba

    t √ √   , con n –  2 grados de libertad

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    33/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    33

    Rechazar si:T   ó t  

    Del ejemplo anterior, pruebe la hipótesis de que no existe correlación en la población. Emplee 0.02 de

    nivel de significancia

    Solución

    Planteamiento de hipótesis

     0 (la correlación en la población es nula)   (la correlación en la población no es nula)Regla de la decisión

    Rechazar si:T   ó t  

    Estadístico de prueba

    t √ √   = √ √   =   = 10.5093Se acepta la hipótesis alternativa, es decir existe relación entre las variables en estudio

    ERROR ESTÁNDAR DE LA ESTIMACIÓN:

    Mide la dispersión de los valores observados, con respecto a la recta de regresión.

     =

     

     =

     

     –  –– 

    MarcaGastos dePublicidad

    x

    Ventas deCajas

    y  RendimientoPronosticado

    Desviacionesy -    

    Desviacionesal cuadrado

    Coca cola 131.3 1929.2 1878.45 50.75 2575.56Pepsi 92.4 1384.6 1317.35 67.25 4522.56

    Kola real 60.4 811.4 855.78 - 44.38 1969.58Sprite 55.7 541.5 787.99 - 246.49 60757.32

    Inca cola 40.2 536.9 564.42 - 27.52 757.35Concordia 29.0 535.6 402.87 132.73 17617.25

    7 up 11.6 219.5 151.89 67.61 4571.11

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    34/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    34

     =   –  =   –  = 136.21ESTIMACIÓN DE LOS INTERVALOS DE CONFIANZA

    El error estándar de la estimación es una medida válida para utilizarla al fijar los intervalos de confianza

    cuando el tamaño de muestra es grande y de alguna forma la dispersión con respeto a la recta de la

    regresión está distribuida de manera normal.

    Un intervalo de confianza se determinará para:

    1.- El valor medio de Y para un valor dado de X

    2.- Un valor individual de Y para un valor dado de X

       t(Syx)

     

    ( )

     

    De donde

    Y' = es el valor pronosticado para cualquier valor X seleccionado

    X = es cualquier valor seleccionado de X = es la media de Xn = en el número de observaciones

    Syx = es el error estándar de la estimación

    t = es el valor de t tomado para n –  2

     Ejemplo

    De acuerdo a los datos anteriores. Calcular los intervalos de confianza para la venta de cajas de gaseosascuando la inversión en publicidad es 100.00 (millones de dólares) = es 1426.98 para un x igual a 100= es 60.0857n = es 7

    Syx = 136.21

    t (n –  2) =t(7 -2)(0,05)= 2.5711426.98   –  

    1426.98   195.1291 = 1622.1091 y 1231.8509 Interpretación.-

    Cuando se invierte 100 millones de dólares en publicidad, se espera que la venta de gaseosas esté

    comprendida entre1622.1091 y 1231.8509 miles de cajas 

    Pero cuando a se trata de un valor individual la fórmula es:

       t(Syx)   ( )  

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    35/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    35

     Ejemplo.

    - Cuanto será la venta de cajas de Inca cola, cuando esta compañía invierta 100 millones en publicidad:

    1426.98  1426.98  1972.305y 881.655

    Interpretación.-

    Con una probabilidad del 0,95 se puede afirmar que cuando la Inca Cola invierta 100 millones en

     publicidad sus ventas estarán comprendidas entre 1972.305 y 881.655 cajas.. 

    RELACIÓN ENTRE COEFICIENTE DE CORRELACIÓN, COEFICIENTE DEDETERMINACIÓN Y ERROR ESTANDAR DE ESTIMACIÓN

    Un medio conveniente para mostrar la relación entre estas tres medidas es la ANAVA, recordemos que:

    El error estándar de la estimación mide cuán cerca de la recta de regresión se encuentra los valores reales.Cuando el valor es pequeño indica que las dos variables están relacionadas muy de cerca.

    El coeficiente de correlación mide la fuerza de la asociación entre dos variables. Cuándo los puntos del

    diagrama de dispersión parecen cercanos a la línea recta, se observa que el coeficiente de correlación

    tiende a ser grande. Luego el error estándar de la estimación y coeficiente de correlación indican la misma

    información, pero utilizan escalas diferentes.

    El coeficiente de determinación mide el porcentaje de la variación de Y que se explica por la variación de

    A N A V A

    Fuentes deVariación Suma deCuadrados  Grados deLibertad  CuadradoMedio  Prueba designificación  SignificaciónestadísticaRegresión   1 ⁄   ⁄  Error   n –  2 ⁄  Total   n –  1SC r =  –  SC e= ∑( –  )  =SC t –  SC rSC t = ∑ ( – ) 

         

    y      ( – )  ( )     –    (  – )  (  ) 1929.2 1878.45 851.2428 1077.9572 1161991.725 50.75 2575.5625 1027.2072 1055154.632

    1384.6 1317.35 851.2428 533.3572 284469.9028 67.25 4522.5625 466.1072 217255.9219

    811.4 855.78 851.2428 - 39.8428 1587.4487 -44.38 1969.5844 4.5372 20.5861

    541.5 787.99 851.2428 -309.7428 95940.6021 -246.49 60757.3201 -63.2528 4000.9167

    536.9 564.42 851.2428 -314.3428 98811.3959 -27.52 757.3504 -286.8228 82267.3186

    535.6 402.87 851.2428 -315.6428 99630.3771 132.73 17617.2529 -448.3728 201038.1678

    219.5 151.89 851.2428 -631.7428 399098.9654 67.61 4571.1121 -699.3528 489094.3389

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    36/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    36

    A N A V A

    Fuentes deVariación

    SC GL CM F Sign.Estad.

    Regresión 2048831.882 1 2048831.882 110.4244 **Error 92770.7449 5 18554.1489Total 2141530.417 6

    F (1,5)= 6.61 (  16.26 (   Interpretación:

    Realizado el análisis de variancia (ANAVA) para la regresión se encontró una alta significación

    estadística para la regresión, por lo tanto podemos decir que existe asociación entre ambas variables en

    estudio

     =  = 1 –     =  = 1 –    = 0,9567 = 95.67%

    El 95.67% de las variaciones de la venta de cajas de gaseosas (Y) es explicado por la inversión que se

    hizo en publicidad (X)

    r =  = 0.9781 (Coeficiente de correlación)1 –   = 4.33% (Coeficiente de no determinación)

    El error estándar de la estimación también puede ser calculado de la siguiente forma

    S yx=   –  =   –  = 136.2136Por último se como se observa que conforme la Suma de Cuadrado del error disminuye

    ta y por el contrario, conforme disminuye el error estándar se incrementa r 2

    Análisis de regresión múltiple

    Estudia la influencia de dos o más variables independientes sobre la dependencia de otra variable

    dependiente.

    La ecuación será:

      = bo + b1X1 +b2X2X 1,X2 = son las dos variables independientes

     bo = es la intersección en Y, es decir, la ordenada con el eje del punto de intersección con el

    eje Y

     b1= es el cambio neto en Y por cada cambio unitario de X1 manteniendo x2 constante (o sea

    sin cambios). Se denomina coeficiente de regresión parcial, coeficiente de regresión

    neta, ó más brevemente, coeficiente de regresión.

     b2  = Es el cambio neto en Y por unidad de cambio en X2, manteniendo X1  constante (sin

    cambios). También se denomina coeficiente de regresión parcial o simplemente

    coeficiente de regresión.

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    37/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    37

    La ecuación de la regresión múltiple se puede ampliar a más variables independientes.

    Y' = bo +b1X1 + b2X2 +b3X3 +……………+bk Xk

    El método de mínimos cuadrados, minimiza la suma de cuadrados de las desviaciones verticales con

    respecto a la línea de la regresión, principios que se cumple para la regresión lineal como para la

    regresión múltiple.En el caso de dos variables independientes es necesario resolver las siguientes ecuaciones:

    ∑Y = na + b1∑X1 +b2∑X2 

    ∑X1Y = bo∑X1 + b1∑  + b2∑X1X2 ∑X2Y = bo∑X2 + b1∑X1X2 + b2∑  

    Este sistema de ecuaciones se puede resolver de diferentes maneras, una de ellas es empleando matrices

    Ejemplo.- El director de personal de una empresa que tiene un importante grupo de vendedores, debeentrevistar y seleccionar nuevo personal. Ha diseñado una prueba que ayuda a seleccionar los mejores

    aspirantes para su personal de ventas A fin de verificar la validez de una prueba como instrumento de predicción de las ventas semanales. Eligió al azar a cinco vendedores y aplicó la prueba a cada uno. Los

    importes de ventas semanales se aparearon con el puntaje obtenido en la prueba y con la calificación que

    se les hizo a su desempeño

    1.- ¿Cuál será la ecuación de regresión múltiple?

    2. ¿Supóngase que un solicitante de empleo en el departamento de ventas tuvo un puntaje de 6,0 en la

     prueba y una calificación de desempeño de 3,8. ¿Cuáles son las ventas semanales estimadas del

    solicitante?

    Vendedor Ventas semanales(en miles de soles) Y

    Puntaje de laPrueba

     

     

    Calificación deDesempeño

     

    Juan 5 4 2Milagritos 12 7 5Raúl 4 3 1Steffany 8 6 4Eduardo 11 10 6

    Solución:1.- La ecuación podrá ser calculada de la siguiente forma:

     = 

    Total

    Reemplazamos en el arreglo matricial

    Y                      5 4 2 16 4 8 20 10

    12 7 5 49 25 35 84 60

    4 3 1 9 1 3 12 4

    8 6 4 36 16 24 48 32

    11 10 6 100 36 60 110 66

    40 30 18 210 82 130 274 172

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    38/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    38

    –  =

     Encontramos determinante de la matriz 3x3

    || Procedemos a invertir la matriz cuadrada 3x3

    * + = 320 * + = 120 * + = 120* + =120 * + = 86 * + = 110* + = 120 * + = 110 * + = 150

      – – –

     =

     

    Calculamos los coeficientes de la regresión múltiple

    [(–)] = 3,5  =[(–)–]  = – 0,975

     = [(–)]  = 2,875Luego la ecuación será igual a:    = bo + b1X1 + b2X2    = 3,5 + ( –  0,975) X1 + 2,875X22.- Y' = 3,5 + ( – 0,975)6,0 + 2,875(3,8)

    Y' = 8,575 miles de nuevos soles.

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    39/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    39

    ERROR ESTÁNDAR MÚLTIPLE DE LA ESTIMACIÓN:

    El error estándar de la estimación en el análisis de la regresión múltiple mide el error para valores de Y

    con respecto al plano de regresión si es que intervienen dos variables independientes.

    Sy.12 =

      –  

    –  

    Puntaje dePrueba  

    CalificacióndeDesempeño  

    Ventassemanales(miles desoles)

    VentassemanalesPronosticadas(miles de soles)

      (  ) Juan 4 2 5 5,35  –  0,35 0,1225

    Milagritos 7 5 12 11,05 0,95 0,9025

    Raúl 3 1 4 3,45 0,55 0,3025

    Steffany 6 4 8 9,15  –  1,15 1,3225

    Eduardo 10 6 11 11,00 0,00 0,0000

    Total 0,00 2,6500

    Sy.12 =   –  = 1,151 miles de solesCOEFICIENTE DE CORRELACIÓN MULTIPLE. (r)

    Es la medida de la fuerza de la asociación entre la variable dependiente y dos o más variables

    independientes

    Este coeficiente toma valores entre 0 y a 1 inclusive, siempre es positiva Ejemplo Un coeficiente de 0,94

    indica una asociación muy fuerte entre las variables dependiente e independiente. Un coeficiente de 0,09

    revela una relación muy débil

    Correlación Correlación Correlación pequeña moderada grande

    0 0,50 1,00

    sin correlacion correlación perfecta

    COEFICIENTE DE DETERMINACIÓN MÚLTIPLE (r2).-- Proporción (porcentaje) de la variación

    total en la variable dependiente Y que se explica por medio del conjunto de variables independientes

    COEFICIENTE DE NO DETERMINACIÓN MÚLTIPLE (1  –   r2).-  mide la proporción de lavariación total en la variable dependiente Y, que no se debe a las variables independiente. 

    A N A V A

    Fuentes deVariación

    Suma deCuadrados 

    Grados deLibertad 

    CuadradoMedio 

    Prueba designificación 

    Significaciónestadistica

    Regresión   K ⁄   ⁄  Error   n –     ⁄  Total   n –  1El coeficiente de determinación se puede calcular de la siguiente manera:

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    40/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    40

     Error estándar de la estimación múltiple será igual a:

    Sy.12 =   – – 

    Total

       

    A N A V A

    Fuentes devariación

    SC GL CM F SIG

    Regresión 47.35 2 23.675 17.87 N.S.Error 2.65 2 1.325Total 50 4

    F(2,2)= 19,00 (  99,50 (  

    Coeficiente de determinación:

      =

      %

    Quiere decir que el 94,70% de la variación es explicado por la regresión

    Coeficiente de regresión múltiple

    r = √  = 0,9731Error estándar de la estimación múltiple:

    Sy.12 =   – – =   –  = 1,1510FUNDAMENTOS DE LA EXPERIMENTACIÓN AGRÍCOLA;

    DISEÑOS EXPERIMENTALES

    La estadística es uno de los elementos básicos de la experimentación agrícola, ya que mediante ella se

     pueden obtener algunas conclusiones acerca de tales experimentos.

    El desarrollo agrícola de un país se basa en las investigaciones que se realizan en ese campo, valiéndose

    de la experimentación. Cualquier modalidad en las técnicas de cultivo, al introducirse por primera vez a

    una región, necesita de la experimentación para poder adaptarlo y divulgarlo entre los agricultores. Esto

    se debe a que las condiciones de clima y suelo varían en cada región, estación y año.

    y      –        –      –      5 5,39 8  –  3 9  –  0,35 0,1225  –  2,65 7,022512 11,05 8 4 16 0,95 0,9025 3,05 9,30254 3,45 8  –  4 16 0,55 0,3025  –  4,55 20,70258 9,15 8 0 0  –  1,15 1,3225 1,15 1,322511 11 8 3 9 0 0 3 940 40 0 50 0 2,65 0 47,35

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    41/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    41

    Para el aprovechamiento óptimo de los recursos disponibles, los experimentos se deben diseñar de

    acuerdo con los principios estadísticos que permiten al experimentador llegar a conclusiones correctas

    acerca de un problema específico. Los experimentadores y estadísticos deben planear los experimentos

    conjuntamente. Para ello el estadista debe tener un criterio práctico y el experimentador un criterio

    estadístico.

    Las etapas de todo trabajo de investigación se pueden resumir de la siguiente manera:

    a)  Enunciado del problema. b)  Colaboradores.c)  Formulación de hipótesis.d)  Selección del procedimiento y diseño experimentales.e)  Realización del experimento.f)  Aplicación de los métodos estadísticos a los resultados,g)  Interpretación de resultados.h)  Análisis económico y su utilidad práctica para la comunidad.

    La biometría es primordial para analizar e interpretar los datos y se manifiesta en diversas formas:

    a)  Estudio de la variación de una población de seres vivos. b)  Comparación entre poblaciones y muestras para juzgar su semejanza.c)  Interpretación de resultados de experimentos biológicos y agropecuarios, en donde se comparan

     poblaciones o muestras sometidas a diferentes estudios o pertenecientes a diferentes variedades o

    razas.

    d)  Determinación de la relación entre dos o más variedades (correlación y regresión).e)  Aplicación de métodos para reducir las fuentes de error en la correlación de datos.f)  En poblaciones segregadas, separación de la variación atribuible a la sección de los genes debido

    al medio, en estudios de herencia cuantitativa.

    En general, la experimentación agrícola la deben realizar los profesionales relacionados con las ciencias

    agronómicas y biológicas.

    Diseñar un experimento significa planear un trabajo de modo que reúna la información aplicable al

     problema en investigación. Steel y Torrie consideran un experimento como una pregunta que detectará

    nuevos hechos, confirmará los resultados de ensayos anteriores y dará recomendaciones de aplicación

     práctica.

    El experimento es el conjunto de reglas usadas para obtener una muestra de la población y al concluir el

    ensayo obtener información acerca de la población. Little y Jackson afirman que el experimento es un

    elemento de investigación utilizada para descubrir algo desconocido, o para probar un principio o una

    hipótesis. Es un caso importante del método científico, ya que las preguntas que el experimento pretende

    contestar serán fundamentales para apoyar o rechazar una hipótesis.

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    42/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    42

    TRATAMIENTO 

    Es una de las formas que, en cantidad o calidad, el factor a estudiar toma durante el experimento. Por

    ejemplo, sí el factor a estudiar es variedad de arroz, un tratamiento es la variedad NIR si el factor a

    estudiar es cantidad de lisina, cada una de las dosis de lisina aplicada durante el experimento es un

    tratamiento. Los tratamientos a estudiar durante el experimento pueden ser una combinación de varios

    factores simples: si quiere estudiarse la distancia entre hileras y la distancia entre plantas en un cultivo, se

     pueden considerar tratamientos simples como 80 cm. entre hileras o 3 cm entre plantas, o tratamientos

    combinados como 80 cm entre hileras y 3 cm entre plantas.

    Por ejemplo, en la industria el productor de detergentes puede establecer como tratamiento el tipo de agua

    (dura o suave), la temperatura del agua, la duración del lavado, la marca y el tipo de lavadora. En los

    estudios sociológicos y psicológicos, los tratamientos se pueden referir a edad, sexo, grado de educación,

    religión, etcétera.

    Unidad experimental 

    es el material experimental al que se aplica un tratamiento de manera uniforme. Puede ser un animal, un

    conjunto de semillas, una parcela, una maceta, un árbol, un tubo de ensayo, etcétera.

    Tratamiento testigo

    Es un tratamiento que se compara. Por ejemplo, si se quiere probar en una región el grado de adaptación y

    rendimiento de una variedad nueva de plátano, se planeará el ensayo de tal manera que se incluyen

    variedades locales como testigos. Si la nueva variedad presenta mayor resistencia a enfermedades,insectos, vientos, precipitación, etc., y en consecuencia produce mayor rendimiento por hectárea, esa

    variedad se recomendará para la zona.

    En investigación con animales se pueden probar sexos, localidades, raciones, épocas, sistemas de

     pastoreo, carga de animal óptima, tipos de vacuna, uso de vitaminas y minerales, etc. En tales casos, se

    forman grupos de animales tan homogéneos como sea posible para la investigación. Para formar los

    grupos se deben considerar aspectos como edad, sexo y raza. Si a varios grupos de animales se les

    administran diferentes dosis de vitaminas, pero no a un grupo testigo, el análisis estadístico dará

    información acerca del aumento de peso, altura y precocidad de los animales que recibieron la vitamina

    comparados con los que no la recibieron.

    REPETICIÓN

    Cuando en un experimento se tiene un conjunto de tratamientos para poder estimar el error experimental,

    es necesario que dichos tratamientos aparezcan más de una vez en el experimento, para así aumentar la

     precisión de éste, controlar el error experimental y disminuir la desviación estándar de la media. Por lo

    tanto, se entenderá por repetición al número de veces que un tratamiento aparece en el experimento.

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    43/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    43

    DISEÑO EXPERIMENTAL

    Es el procedimiento que se sigue para asignar los tratamientos a las unidades experimentales. Es un

    método aleatorio, o sea, de asignación al azar, porque se decide el tratamiento que corresponde a cada

    unidad experimental mediante un sorteo o por medio de una tabla de números aleatorios. 

    BLOQUE O REPETICIÓN

    Es un conjunto de unidades experimentales lo más homogéneas posibles, en el cual aparecen todos los

    tratamientos una sola vez; dicho bloque se debe colocar perpendicular al gradiente para tratar de

    minimizar el error.

    ERROR EXPERIMENTAL

    Los resultados experimentales varean no solo por la acción de los tratamientos, sino también por

    variaciones ambientales que tienden a enmascarar el efecto de los tratamientos. Por lo general. Paraexpresar estas variaciones se usa el término error experimental. Pero el término error no quiere decir

    equivocación, sino que incluye todo tipo de variación externa ajena al material experimental.

    El error experimental es la medida de variación que existe entre las observaciones de unidades

    experimentales en el mismo tratamiento, es decir, la variación no proviene de los tratamientos. Existen

    dos clases de variaciones; la variación inherente al material experimental, al que se aplican los

    tratamientos, y la que proviene de la falta de uniformidad en la realización física del experimento. Si los

    resultados obtenidos tienen la precisión necesaria para llegar a conclusiones validas, ninguna de las dos

    fuentes de variación deben preocupar al investigador.

    El error experimental no se puede eliminar, pero sus efectos se pueden reducir para obtener una mejor

    estimación de los efectos de los tratamientos. Las modalidades más recomendadas para disminuir error

    son:

    a.-Utilizar unidades experimentales muy uniformes, como suelo homogéneo, riegos, densidad de

    siembra, fertilización, control de plagas y hierbas, etcétera.

     b.- Tamaño adecuado de la unidad experimental.

    c.- Eliminación del efecto de orilla y de la competencia entre tratamientos

    d.- Distribución adecuada de los tratamientos mediante sorteos.

    e.- Usar el número adecuado de repeticiones para cada tratamiento.

    f.- Poner todos los tratamientos en iguales condiciones, de manera que si alguno es superior a los

    demás, se puede probar.

    Existen ciertos detalles técnicos al realizar los experimentos que parecen obvios, sin embargo, muchas

    veces pasan inadvertidos. Una vez que se tiene listo el terreno para el experimento, es conveniente marcar

    los contornos de los bloques y la posesión de las parcelas de acuerdo con el diseño experimental. Si el

    campo está surcado y el número de surcos por parcela es impar se debe marcar el surco central de cada

     parcela, y si es par el primer surco de la derecha. Además, las bolsas que contengan las semillas, abonos,

    etc., que se aplican a las parcelas, tendrán claramente indicado el número de bloque y parcela a que

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    44/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    44

     pertenecen. Antes de empezar la siembra y su preparación, el experimentador debe verificar que cada

     bolsa esté en el campo frente a la parcela correspondiente.

    Durante la realización del experimento debe quedar claro que todas las labores se harán con uniformidad

     para todo el lote experimental, excepto las que están en estudio. Cuando se efectúan experimentos de

    abonamiento, variedades, etc., es importante conocer el origen de cada tratamiento, las características de

    las variedades y el análisis de los abonos. Los materiales para aplicar los tratamientos se deben conseguir

    y preparar oportunamente, y nunca esperar hasta el día del inicio del experimento.

    La siembra, abonamiento, labores culturales y otras, se deben realizar el mismo día para todo el

    experimento. Lo anterior es necesario en los lugares lluviosos, porque las labores realizadas antes y

    después de llover encuentran el terreno en condiciones diferentes, lo cual puede causar variabilidad en la

    germinación, efecto de los abonos, etc. Si no es posible realizar las labor completa en un día se debe

    evitar dejar bloques sin terminar

    Si se trata de experimentos comparativos de variedades es útil compara las características de las

    variedades sembradas, con aquellas que se obtienen al momento de la cosecha, para determinar cómo se

    adaptan a las condiciones ecológicas de la localidad. También es muy importante que una parte de la

    semilla de las variedades introducidas se cultive aparte para mantener su pureza, además de multiplicarla

    y aclimatarla, ya sea para utilizarla en experimentos siguientes o para distribuirla entre los agricultores.

    En ciertos casos, para mantener la pureza de la variedad es necesario ir al embolsado de las flores para

    evitar la polinización cruzada.

    Cuando se trabaja con varios obreros de campo es importante cuidar que ninguno se dedique a un mismo

    tratamiento en todas las repeticiones del experimento. Ya que, un obrero puede trabajar mejor que otro y,

    en consecuencia, el tratamiento que realice estará en ventaja.

    Un experimento nunca se debe sembrar fuera de época porque pierde su valor. En los experimentos de

    abonamiento no debe descartarse el testigo sin abono, ni el testigo que representa la práctica de la

    localidad. Debido a que muchos experimentos se pierden por los daños que causan los animales se debe

    extremar la vigilancia, especialmente en la época próxima a la cosecha.

    En la toma de datos y observaciones en los experimentos, es importante que el experimentador se libere

    de toda preferencia por determinado tratamiento para evitar falsear de manera inconsciente los resultados.

    También es importante que él mismo sea quien haga las observaciones y que anote sólo los datos

    debidamente comprobados. En los experimentos no deben interesar solamente los rendimientos, ya que de

     proceder así no se conocerían las causas que determinan ciertos resultados de buena calidad del producto.

    Se aconseja revisar los experimentos cuando menos una vez por semana, para hacer las observaciones

    oportunamente. Todas las observaciones se deben anotar cuidadosamente sin dejan nada al azar ni confiar

    en la memoria. Los datos deben estar en orden, de tal manera que otro experimentador pueda utilizarlos si

    es necesario.

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    45/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    45

    Para muchos investigadores el tamaño y la forma de la unidad experimental es únicamente un problema

    de control. Sin embargo, investigaciones realizadas en diferentes cultivos con datos de ensayo en blanco,

    han indicado que el tamaño adecuado se relaciona con el grado de precisión y con una mejor estimación

    de los efectos de los tratamientos, el aspecto del costo por unidad experimental y la precisión del

    experimento: aquí se prefiere un mayor número de repeticiones que el tamaño, y la unidad experimental

    se orienta de manera que la mayor dimensión se dirija hacia donde esté la mayor variación del suelo.

    ELECCIÓN DEL DISEÑO EXPERIMENTAL

    Cuando el experimentador ya definió el objetivo del trabajo y los tratamientos por probar, el siguiente

     paso es determinar el diseño experimental que se debe usar. Para un experimento específico, el mejor

    diseño es el más sencillo y el que usa la menor cantidad de material para lograr el objetivo.

    En la práctica, las unidades experimentales, las condiciones ambientales y de manejo no son iguales, y los

    métodos de medida son inexactos. Por ello, es necesario hacer repeticiones y utilizar un diseño

    experimental.

    Si se considera que el experimentador estudia un fenómeno complejo (como la producción de trigo, de

    leche o el crecimiento de una colonia de hongos), que mantiene fijos todos los factores que intervienen en

    el fenómeno y que los métodos de medida son exactos, el resultado será el mismo cada vez que se realice

    el experimento. Entonces, cada combinación de factores determina un resultado que permanecerá

    constante si se repite el experimento. El experimentador, de acuerdo con su objetivo, varía uno o más

    factores para evaluar el efecto de tales variaciones en el resultado.

    TÉCNICA DE ALEATORIEDAD

    Debido a la variabilidad del suelo, para evitar que un tratamiento sea favorecido o puesto en desventaja en

    forma sistemática en sus repeticiones, Fisher ideó la técnica de aleatoriedad, cuya finalidad es dar una

    estimación insesgada del error experimental.

    Las parcelas contiguas tienden a correlacionarse, por eso cualquiera de ellas debe recibir al azar algún

    tratamiento. La aleatoriedad tiende a destruir la correlación entre errores y hacer válidas las pruebas de

    significación. El ejemplo más común de la técnica de aleatoriedad está dado por la rifa de un objeto. Si se

    colocan papeles o fichas numeradas en un ánfora y se supone que están completamente mezcladas,

    cualquier secuencia en que salgan se considerará aleatoria. Cuando el investigador tiene pocos

    tratamientos recurre a esta técnica. Sin embargo, es preferible recurrir a una tabla de números aleatorios.  

    ANÁLISIS DE VARIANZA

    Anteriormente se analizaron datos provenientes de dos muestras o dos tratamientos. Se observó que por

    medio de la prueba t de Student es posible determinar si la variedad A es estadísticamente más productiva

    que la variedad B, o si un forraje con fertilizante es mejor que un forraje sin fertilizante.

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    46/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    46

    El trabajo del investigador pocas veces se limita a estudiar dos tratamientos a la vez. Para ahorrar tiempo

    y esfuerzo, y para aumentar la precisión del experimento, por lo general, se estudian más de dos factores a

    la vez, con varios niveles dentro de cada factor.

    Sir Ronald Fisher introdujo el análisis de varianza (ANAVA), que es un procedimiento aritmético que

    consiste en desdoblar la suma de cuadrados total (variación total) en fuentes de variación reconocidas,

    con todo y la variación que no se pudo medir (proveniente de la variabilidad inherente al material

    experimental o de la falta de homogeneidad del ambiente donde se realizó el experimento); fuente de

    variación que se conoce como residuo o error experimental. Por ejemplo, cuando se trató lo concerniente

    a regresión, la suma de cuadrados total se descompuso en suma de cuadrados debido a la regresión, más

    la suma de cuadrados debido al error.

    El ANAVA se utiliza en todos los campos de investigación cuando los datos se miden cuantitativamente.

    Su uso ha sido muy ventajoso en el diseño experimental. Las suposiciones básicas del ANAVA son

    a)  Los efectos de tratamientos y ambientales son aditivos. b)  El error experimental es un elemento aleatorio, normal e independiente, distribuido con media

    cero y varianza común.

    GRADOS DE LIBERTAD

    Los grados de libertad son el número de contrastes ortogonales menos el número de restricciones

    impuestas, que se pueden hacer en un grupo de datos. Por ejemplo, si se supone que el rendimiento de

    cinco variedades de un cultivo es de 25, 26, 27, 28 y 29 kg, la medía es 27 kg. Las desviaciones de los

    números con respecto a su medida (que deben sumar cero) son:

    25 26 27 28 29

    -2 -1 0 +1 +2

    En esta muestra de cinco datos, uno queda fijo (la restricción está dada por X= 27), porque X se utilizó

    como el origen para las desviaciones. Entonces quedan cuatro valores (cuatro grados de libertad) que se

     pueden comparar independientemente con la media, o sea que el número de grados de libertad de una

    muestra de datos está dado por el total de observaciones menos uno (n - 1).

    La varianza de la muestra está dada por:

     = ( )  =  Es decir, la varianza es el cociente que resulta de dividir la suma de cuadrados entre el número de grados

    de libertad. Dentro del ANAVA, y para obtener el valor F (que denota la significación entre tratamientos)

    se divide el cuadrado medio del tratamiento entre el cuadrado medio del error.

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    47/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    47

    Al comparar el valor de F calculado con el F tabulado, se podrá establecer si existe significancia. Habrá

    significancia en caso de que el valor F calculado sea mayor que el valor F tabulado. Este último se

    encuentra en la tabla de F, con el nivel de significancia apropiado, los grados de libertad del error en la

    vertical. Si se rechaza la hipótesis nula de que no existen diferencias en los tratamientos, el siguiente paso

    es efectuar la prueba de significancia entre medias de tratamiento, para conocer cuáles de ellos son

    mejores.

    DISEÑO COMPLETAMENTE AL AZAR

    El diseño completamente al azar es el diseño más simple y se usa cuando las unidades experimentales son

    homogéneas, y la variación entre ellas es muy pequeña. Tal es el caso de experimentos de laboratorios,

    invernadero, gallineros, porcinas, etc. En experimentos en que las condiciones ambientales son

    controladas, tal diseño es una prueba con un solo criterio de clasificación.

    Las ventajas de este diseño son:

    a.- Es fácil de planear.

     b.- Es flexible en cuanto al número de tratamientos y repeticiones, el límite está dado por el número de

    unidades experimentales en general.

    c.- No es necesario que el número de tratamientos sea igual al número de repeticiones.

    d.- No se estima parcelas perdidas.

    e.- El número de grados de libertad para el error aumenta al no tener muchas restricciones.

    Las desventajas del diseño son:

    a.- No es eficiente con material experimental heterogéneo.

     b.- Puesto que no existen restricciones en cuanto a la aleatoriedad, el error experimental incluye la

    variación total entre unidades experimentales

    A N A V A

    FUENTE DE

    VARIACION

    SUMA DE

    CUADRADOS

    SC

    GRADOS DE

    LIBERTAD

    GL

    CUADRADO

    MEDIO

    CM

    PRUEBA

    ESTADISTICA

    F

    Tratamiento  –  TC   t –  1  ⁄   ⁄  Error SC tot. –  SCtra.  t(r –  1)  ⁄  Total

     –  TC   tr –  1 

    Termino de corrección (TC) =  

    DISEÑO COMPLETAMENTE AL AZAR CON IGUAL NÚMERO DE UNIDADES POR

    TRATAMIENTO

    En un ensayo con macetas se aplicaron cinco tratamientos a clones de pasto estrella. Se tomaron cuatro

    macetas por tratamiento. Los rendimientos se presentan a continuación. Probar las hipótesis

    correspondientes.

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    48/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    48

    T R A T A M I E N T O SMacetas 1 2 3 4 5

    1 101 51 83 67 292 93 61 68 40 453 93 59 72 46 514 96 58 75 52 42

    Total 383 229 298 205 167 128

     Media 93,7

     

    57,2

     

    74,5

     

    51,2

     

    41,7

       No existe diferencia entre tratamientosSi existe diferencia entre tratamientosTC 82176SC total   –  TC = 8168SC tratamientos =

     7286SC error = SC total –  SC tratamientos

    = 82176 –  7286 = 882

    A N A V A

    Fuentes de Variación SC GL CM F SIG

    Tratamiento 7286 4 1821,5 30,98 **Error 882 15 58,15Total 8168 19

    F 0.05 = 3,06

    0,01= 4,89

    C.V. =√    √    100= 46,33%

    El coeficiente de variabilidad o coeficiente de variación indica la confiablidad en los datos, a medida quesu valor disminuye la confiabilidad es mayor.

    Prueba de significación de t

    -  Las pruebas de hipótesis serán:1 vs 2 1 vs 3 1 vs 4 1vs 5

    Ho   Ho   Ho   Ho  Ha   Ha   Ha   Ha  2 vs 3 2 vs 4 2 vs 5

    Ho   Ho   Ho  Ha   Ha   Ha  3 vs 4 3 vs 5

    Ho   Ho  Ha   Ha  4 vs 5

    Ho  Ha  

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    49/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    49

    -  El error estándar será S =     =     = 5, 39Se busca en las tablas de t  

    t

      0,05= 2,131

    t  0,01= 2,947Comparaciones 

    t =  se repite para cada par de comparaciones

    t =  =  = 6, 77**

    t =

     =

     = 3, 57**

    t =  =  = 7, 88**t =

     =  = 9, 64**t =

     =  = – 17, 25 *t =

     =  = 1, 11 N.S.t =  =  = 2, 87*t =

     =  = 4, 31**t =

     =  = 6, 07**t =

     =  = 1, 76 N.S.Prueba de D. L. S.

    D.L.S. = t . S = 2,131 x 5,39= 11.481 vs 2 = 93,75 –  57,25 = 36,5*

    1 vs 3 = 93,75 –  74,50 = 19,25*

    1 vs 4 = 93,75 –  51,25 = 42,5*

    1 vs 5 = 93,75 –  41,75 = 52,00*

    2 vs 3 = 57,25 –  74,50 = –  17,25*

    2 vs 4 = 57,25 –  51,25 = 6,00 N.S.

    2 vs 5 = 57,25 –  41,75 = 15,50*

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    50/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    50

    3 vs 4 = 74,50 –  51,25 = 23,25*

    3 vs 5 = 74,50 –  41,75 = 32,75*

    4 vs 5 = 51,25 –  41,75 = 9,5 N.S.

    Prueba de significación de Duncan

    Esta prueba tiene en cuenta el orden de los promedios de cada uno de los tratamientos.

    S =    =    =3,81Con los grados de libertad del error buscamos en la tabla de Duncan

    (A.E.S)   3,01    3,16    3,25    3,31Encontramos la A.L.S.

    A.L.S. =A.E.S. x S 2 3 4 5

    A.E.S. 3.01 3.16 3.25 3.31

    S  3.81 3.81 3.81 3.81A.L.S. 11.46 12.03 12.38 12.61

    Ordenamos en orden creciente los promedios

    Tratamiento 5 4 3 2 1

    Promedio 41,75 51,25 57,25 74,50 93,73

    Comparamos los promedios desde el mayor hasta el menor

    1 –  5 = 93,73 –  41,75 = 51,98 > 12,61 *

    1 –  4 = 93,73 –  51,25 = 42,48 > 12,38 *

    1 –  2 = 93,73 –  57,25 = 36,48 > 12,03 *

    1 –  3 = 93,73 –  74,50 = 19,23 > 11,46 *

    3 –  5 = 74,50 –  41,74 = 32,76 > 12,38 *3 –  4 = 74,50 –  51,25 = 23,25 > 12,03 *

    3 –  2 = 74,50 –  57,25 = 17,00 > 11,46 *

    2 –  5 = 57,25 –  41,75 = 15,50 > 12,03 *

    2 –  4 = 57,25 –  51,25 = 6,00 < 11,46 N.S.

    4 –  5 = 51,25 –  41,75 = 9,50 < 11,46 N.S.

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    51/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    51

    Otro método

    Tratamiento Promedio

    1  93,703  74,502 57,25

    4 51,25

    5 41,75

    Los tratamientos bajo la misma recta son estadísticamente iguales. 

    Prueba de significación de Tukey

    S =    =    =3,81Buscamos en la tabla de Tukey con los grados de libertad del error y el número de tratamientos.

    A.E.S. (T) = A.E.S. (15 y 5) = 4,37

    A.L.S. = S A.E.S. (T)A.L.S. = 3,81 X 4,37 =16,64

    Realizamos las comparaciones múltiples

    Tratamiento Promedio

    2  93,704  74,502 57,25

    4 51,25

    5 41,75

    Los promedios bajo la misma recta son estadísticamente iguales

    DISEÑO COMPLETAMENTE AL AZAR CON DIFERENTE NÚMERO DE UNIDADES POR

    TRATAMIENTO

    A veces se presenta el caso de que por insuficiencia de material para todos los tratamientos, o porque se

    han perdido unidades experimentales, no se dispone de igual número de observaciones por tratamiento.Esta es una de las ventajas del diseño completamente al azar, ya que los datos se pueden analizar

    directamente sin necesidad de estimar parcelas perdidas.

    Por ejemplo se analizó un experimento de cuatro raciones para cerdos con nueve cerdos por ración.

    Durante el experimento se presentó una enfermedad y murieron 16 cerdos. 

    La hipótesis a probar es:  No existe diferencia entre los tratamientosHa Si existe diferencia entre los tratamientos

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    52/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    52

    R A C I O N E SRepeticiones 1 2 3 4

    1 45 35 34 412 46 33 34 413 49 35 444 44 34 435 33 41

    6 427 448 419 41

    Total 184 68 170 378 800 Gran Total 46 54 34 42TC =

      =     SC trat. =

     

     

     

     

    SCtotal=             –  32 000=464SC error = SC total –  SC tratamientos =464 –  432 = 32A N A V A

    Fuentes de Variación SC GL CM, F SIG

    Tratamiento 432 3 72 36 **

    Error 32 16 2

    Total 464 19

    F 0.05 3,24

    0,01 5,29

    C.V. = √    √   x 100= 3,52%Como F es altamente significativo, nos permite rechazar la hipótesis nula de que no hay diferencias entre

    los tratamientos

    El coeficiente de variabilidad o coeficiente de variación indica la confiablidad en los datos, a medida que

    su valor disminuye la confiabilidad es mayor.

    DISEÑO DE BLOQUES COMPLETOS AL AZAR

    El objetivo del diseño bloques completos al azar es reunir las unidades experimentales a las cuales se

    aplicaran los tratamientos, en bloques de cierto tamaño, de tal modo de que los tratamientos se efectúen

    dentro de cada bloque. La variabilidad entre unidades experimentales de bloques diferentes será mayor

    que entre unidades dentro del mismo bloque, como consecuencia, las diferencias encontradas entre

    unidades, se deben principalmente a discrepancias entre tratamientos. La disparidad que no se deba a

    tratamientos, se elimina por el diseño y forma parte del error experimenta. De acuerdo con esto, es fácil

    observar que la variabilidad entre bloques no afecta las diferencias entre medias de tratamientos, porqueen cada bloque aparece una vez por tratamiento, y así los bloques y tratamientos son ortogonales.

  • 8/15/2019 DISE+æOS EXPERIMENTALES UCV

    53/63

    DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV 

    53

    Durante el experimento todas las parcelas dentro del bloque se deben tratar igual, excepto cuando se

    aplique un tratamiento cuyo efecto se quiere medir. Por ejemplo, si los tratamientos son niveles de

    fertilización, todos los demás factores como preparación del suelo, época, densidad de siembra, labores de

    cultivo, uso de plaguicidas, riegos y variedades deben ser exactamente iguales para todas las parcelas, si

    no es así, se introducirían otras fuentes de variación cuyo efecto no se podría medir, y ocultarían el efecto

    de los tratamientos en estudio.

    El diseño bloque completo al azar se caracteriza por su equilibrio, fácil planeación y procedimiento de

    cálculo simple. Su única desventaja es que cuando el número de tratamientos es alto, aumenta la

    superficie del terreno dentro de cada bloque y también el error experimental.

    R E P E T I C I O N E S

    J=1,2,3,…………r  

    Suma Media

    Tratamiento

    i=1,2,3…t 

    1 2 r

    1              2               t               

    Suma          Media           

    A N A V A

    TC =  El siguiente ejemplo presenta los resultados de seis variedades de frijol (rendimiento expre