DISE+æOS EXPERIMENTALES UCV
-
Upload
yoel-suarez-roque -
Category
Documents
-
view
214 -
download
0
Transcript of DISE+æOS EXPERIMENTALES UCV
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
1/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
1
PRUEBA DE HIPOTESIS
Hipótesis
Es el enunciado acerca de una población, elaborado con el propósito de ponerlo aprueba
Prueba de hipótesis
Procedimiento basado en la evidencia muestral y en la teoría de probabilidad que se emplea para
determinar si la hipótesis es un enunciado razonable.
Procedimiento para probar una hipótesis:
1.- Plantear la hipótesis nula y la hipótesis alternativa ó .
Hipótesis nula .- Hipótesis planteada con el objetivo de ser probada. Podemos aceptarla o rechazarla.
Tal hipótesis es una afirmación que se aceptará si los datos muestrales no pueden proporcionar evidencia
convincente que es falsa.
Hipótesis alternativa .- Denominada también hipótesis de investigación. Afirmación que se
aceptará si los datos muestrales proporcionaron amplia evidencia de que es falsa
2.- Seleccionar el nivel de significancia.- Nivel de significancia es la probabilidad de rechazar la
hipótesis nula cuando es verdadera. Al nivel de significación se le denomina , también se le conoce con
el nombre de nivel de riesgo.
Generalmente se usa el nivel del 5% para proyectos de investigación, 1% para el aseguramiento de
calidades y 10% para encuestas políticas.
En el proceso de probar una hipótesis podemos cometer dos tipos de errores: error del tipo I o del tipo II.
Error tipo I es rechazar la hipótesis nula ( cuando en realidad es verdadera.
Error tipo II es aceptar la hipótesis nula ( cuando en realidad es falsa
Hipótesis nula Se acepta Se rechaza
Ho es verdadera Decisión Correcta ErrorHo es falsa Error Decisión Correcta
3.-Calcular el valor estadístico de prueba.- Existen muchos valores estadísticos de prueba: z, t, chi
cuadrado, F, etc.
Es el valor obtenido a partir de la información muestral que se utiliza para determinar si se rechaza la
hipótesis nula.
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
2/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
2
4.- Formular la regla de decisión.- Es un enunciado de las condiciones según las que se acepta o se
rechaza la hipótesis nula.
Valor crítico es el valor que es el punto divisorio entre la región de aceptación y la región de rechazo de la
hipótesis nula
5.-Toma de decisión.- Es aceptar o rechazar la hipótesis nula.
Potencia de una prueba.- Es la probabilidad de tomar la decisión acertada de rechazar cuando esta
es falsa o de aceptar cuando esta es verdadera. La potencia de una prueba se calcula mediante 1 .
Prueba para la media de la población: Muestra grande
Prueba de hipótesis con muestras grandes (n 30) respecto a una media de población para una
prueba de dos colas (bilateral) de la forma:
Ho µ =
Ha µ
Estadístico de prueba: conocida
Z=
Estadístico de prueba: desconocida:
Z=
Regla de rechazo a un nivel de significancia :
Rechazar si Z - Z ó Z Z
Ejemplo
La tasa anual de resurtido de botellas de aspirinas es 6.0 (esto indica que las existencias del medicamentotienen que renovarse en promedio 6 veces al año en un establecimiento). La desviación estándar es 0,50.
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
3/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
3
Se sospecha que el volumen de ventas promedio ha cambiado y no es 0,60. Se utilizará el nivel de
significancia de 0.05 para probar esta hipótesis.
a.- Plantee la hipótesis nula y alternativa
b.- ¿Cuál es la probabilidad de un error tipo I?
c.- Proporcione la fórmula para el valor estadístico de la prueba.
d.- Enuncie la regla de decisión
e.- Se selecciona una muestra aleatoria de 64 frascos de tal producto, con una media de 5.84, ¿Deberechazarse la hipótesis de que la media poblacional es 0.60? Interprete los resultados.
Solución:
a. Ho µ = 6Ha µ
b.-
c.- El valor estadístico de la prueba es: Z=
d.- El valor crítico de 1.96
Si el valor del estadístico de prueba resulta mayor a 1.96 o menor a -1.96 se rechaza la
hipótesis nula
Z= ═ ═ - 2.56
Como el valor de la prueba está en la región de rechazo, se rechaza y, por lo tanto, se acepta (la
tasa media no es igual a 6).
Ejemplo
El supermercado local gastó en una remodelación miles de nuevos soles durante muchas semanas.
Aunque la interrupción espantó a los clientes temporalmente, el gerente espera que los clientes vuelvan a
disfrutar de las nuevas comodidades. Antes de remodelar, los recibos de la tienda promediaban $ 32 533
por semana. Ahora que se ha terminado la remodelación, el gerente toma una muestra de 36 semanas para
ver si la construcción afectó de alguna manera el negocio. Se reportó una media de $34 166 y una
desviación estándar de $12 955 ¿Qué puede decir el gerente a un nivel de significancia del 1%?
Solución
Ho µ = 32 533
Ha µ
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
4/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
4
Rechazar Ho si:
Z - 2.576 ó Z 2.576
El estadístico de la prueba:
Z
0.756
El valor de prueba está dentro de la zona de aceptación, entonces se acepta Ho Es decir la media es 32
533
Prueba de hipótesis con muestras grandes (n 30) respecto a una media poblacional para pruebas
de una cola (unilateral) de la forma
H0
Ha: µ µo
Estadístico de prueba: conocida
Z=
Estadístico de prueba: desconocida:
Z=
Regla de rechazo a un nivel de significación
Rechazar si Z Z α
Prueba de hipótesis con muestras grandes (n 30) respecto a una media poblacional para pruebas
de una cola (unilateral) de la forma
H0: µo
Ha: µ µo
Estadístico de prueba: conocida
Z=
Estadístico de prueba: desconocida:
Z=
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
5/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
5
Regla de rechazo a un nivel de significación
Rechazar si Z - Zα
Ejemplo.- Una encuesta nacional reciente, encontró que estudiantes de la Universidad miraban un
promedio de 6.8 DVD por mes. Una muestra aleatoria de 36 estudiantes universitarios de la facultad de
Agronomía, reveló que el número medio de DVD observado el mes pasado fue de 6.2, con una
desviación estándar de 0.5. En el nivel de significancia de 0.05. ¿Puede concluirse que los estudiantes de
la facultad de Agronomía ven menos DVD al mes que los de la Universidad?
H0: 6.8
Ha: µ 6.8
Regla de la decisión
Rechazar si Z - 1.645
Valor de la prueba
Z= ═ ═ - 7.2
Como el valor de la prueba está en la zona de rechazo se concluye rechazando la hipótesis nula, esto es,que los estudiantes de la facultad de Agronomía ven menos DVD, en promedio, que los estudiantes de la
Universidad
Pruebas respecto a la proporción poblacional.
La prueba de hipótesis sobre proporciones se usa cuando queremos determinar si la proporción de los
elementos en una población, que tiene cierta característica, es mayor, igual o menor que algún valor
especifico.
Relación proporcional:
Es la relación por cociente, o porción relativa, que tiene un atributo particular de interés.
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
6/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
6
Antes de probar una relación proporcional debemos considerar algunos supuestos y cumplirse algunas
condiciones:
- Los datos muestrales recopilados son el resultado de conteo- El resultado de un experimento se clasifica como éxito o fracaso- La probabilidad de éxito se mantiene igual en cada ensayo- Los ensayos son independientes- La prueba es adecuada cuando n y n( 1- ) valen al menos 5
El valor estadístico de prueba Z viene dado por:
Z ═
Donde:
═ Relación proporcional poblacional
Relación proporcional muestral
n ═ Tamaño de muestra
Prueba para la proporción poblacional
Prueba de hipótesis respecto a una proporción poblacional para pruebas de una cola (unilateral) de
la forma:
El estadístico de la prueba
Z ═
Regla de rechazo a un nivel de significación
Ejemplo
Una investigación en la Universidad de Toledo indica que el 50% de los estudiantes cambian su área
principal de especialización después del primer año en el programa de estudios. Una muestra de 100
alumnos en la escuela de Administración reveló que 48 de ellos cambió de dicha área después del lapso
mencionado. ¿Ha habido un decremento significativo en la proporción de estudiantes que cambian su área
de especialización después del primer año en el programa? Realice la prueba al nivel de significancia de
0.05.
n: 100
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
7/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
7
: ═ 0.48
0.05
Regla de decisión
Rechazar si Z - 1.645
El estadístico de la prueba
Z ═ ═ ═ - 0.4
Como Z ═ - 0.4, entonces se acepta , es decir, la proporción de estudiantes que cambian de carrera
después del primer año no ha tenido un decremento significativo.
Prueba de hipótesis respecto a una proporción poblacional para prueba de una cola (unilateral) de
la forma:
Estadístico de prueba
Z ═
Rechazar si Z Zα Ejemplo Un artículo en la publicación Piura 21 reportó que solo hay un empleo disponible para uno de
cada tres egresados de la Universidad. Las principales razones aportadas fueron que existe una
sobrepoblación de estos últimos y una economía débil. Suponga que una encuesta de 200 egresados
recientes de la Universidad de Jaén reveló que 80 tenían empleo. Al nivel de significancia de 0.02, ¿Se
puede concluir que tienen trabajo una proporción mayor de egresados de la Universidad de Jaén?
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
8/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
8
n
Regla de la decisión.
Rechazar si Z 2.054
Valor de la prueba:
Z ═ ═ ═ 2
Se acepta por lo tanto, la proporción de egresados que tienen trabajo es menor o igual a
Prueba de hipótesis respecto a una población poblacional para pruebas de dos colas (bilateral) de la
forma:
Estadístico de prueba
Z ═
Regla de rechazo a un nivel de significancia α
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
9/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
9
Rechazar s ó
Ejemplo
Se establece la siguiente hipótesis:
: p = 0.4
: p
Una muestra de 120 observaciones reveló al nivel de significación de 0.05 ¿Puede rechazarse
la hipótesis nula?
a,. Establezca la regla de decisión.
b.- Calcule el valor estadístico de la prueba.
c.- ¿Cuál es su decisión respecto a la hipótesis nula?
Solución
a.- Regla de decisión
Rechazar si Z -1,96 ó Z 1.96
b.- Valor de prueba
Z = -2.24
c.- Se rechaza , pues el estadístico de prueba cae en la zona de rechazo.
Prueba de hipótesis con muestras grandes (n respecto a dos medias poblacionales
Prueba de hipótesis con muestras grandes (n 30) respecto a dos medias poblacionales para una
prueba de dos colas (bilateral) de la forma
:
:
Estadístico de prueba
Conocida desconocida
Z Z
Donde
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
10/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
10
Tamaño de muestra Media muestral Variancia poblacional
Población 1
Población 2
Regla de rechazo a nivel de significancia Z ó Z Ejemplo
Una importante compañía de transporte público de Chiclayo debe decidir entre dos marcas de llantas para
su parque automotor, con un nivel de confianza del 95%. Para tomar una decisión seleccionó una muestra
aleatoria de 100 llantas de cada marca y encontró que la marca 1 tiene una vida útil de 98 000 Km, en
promedio, con una desviación estándar de 8 000 Km.
Por otro lado, las estadísticas calculadas para la marca 2 son, en promedio, de 101 000 Km y desviación
estándar de 12 000 Km
Que marca de llantas debería adquirir la compañía de transporte si la diferencia de precios es mínima?
Solución
= 98 000 = 101 000
Regla de decisión
Rechazar Z ó Z Valor de la prueba
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
11/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
11
Z = = - 2.08
Como -2.08 está en la zona de rechazo, se rechaza
a un nivel de significancia del 5%. Esto es, existe
diferencia significativa entre la vida útil promedio de ambas marcas. Sin embargo, no hemos contestado a
nuestra pregunta inicial de qué marca de llantas se debe adquirir. Realizamos una nueva prueba de
hipótesis suponiendo que la vida útil media de la marca 2 es mayor que la de la marca 1. Para lo cual
establecemos la prueba de hipótesis para una cola
Prueba de hipótesis con muestras grandes (n respecto a dos medias poblacionales para unaprueba de 1 cola de la forma:
:
:
0
: : 0Estadístico de prueba
Conocida desconocida
Z Z
Regla de rechazo a un nivel de significancia
Rechazar si Z -
Prueba de hipótesis con muestras grandes (n respecto a dos medias poblacionales para unaprueba de 1 cola de la forma:
: : 0 : : 0Estadístico de prueba
Conocida desconocida
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
12/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
12
Z Z
Regla de rechazo a un nivel de significación
Rechazar si Z Del ejercicio anterior, para decidir qué marca comprar, realizamos una nueva prueba de hipótesissuponiendo que la vida útil promedio de la llanta de marca 2 es mayor que la vida útil promedio de la
marca 1, esto es :
Usando los mismos datos anteriores tenemos
Con los datos mostrados se calcula Z
Z = = - 2.08
Como – 2.08 está en la zona de rechazo tenemos que la marca 2 tiene mayor vida útil promedio que la
marca 1.Por lo tanto, la compañía de transporte debe abastecerse de la marca 2
Prueba de hipótesis con muestras grandes (n para la diferencia entre dos proporciones:La prueba de hipótesis para la diferencia entre dos proporciones se realiza cuando queremos determinar si
las proporciones de dos poblaciones son o no iguales. La lógica del procedimiento es idéntica para la
diferencia de las medias poblacionales.
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
13/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
13
Tomamos una muestra aleatoria de cada población y calculamos las proporciones muestrales; si la
diferencia entre estas proporciones se puede atribuir al azar, aceptamos la hipótesis de que las dos
poblaciones tienen igual proporciones.
Valor estadístico de prueba.
Z= Tamaño de muestra Proporción Proporción
muestral ponderada
Población 1 Población 2
= = Alternativamente
Ejemplo
El departamento de investigación en la casa Matriz de una compañía aseguradora, realiza una
investigación acera de las causas de accidentes automovilísticos, las características de los conductores,
etc. Se seleccionó una muestra aleatoria de 400 pólizas de seguros expedidas a personas solteras. Se
descubrió que en el periodo anterior de tres años, 120 sufrieron al menos un accidente automovilístico. Enforma semejante, una muestra de 600 pólizas expedidas a personas casadas reveló que 150 habían tenido
al menos un accidente. Al nivel de significancia de 0.05, ¿Hay diferencia significativa en las personas
solteras y casadas que sufrieron un accidente durante un lapso de tres años?
Solución
400 600 = 0.30 = 0.25
Regla de decisión
Rechazar Z ó Z
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
14/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
14
Valor de la prueba
Z=
= = = 0.27Z=
= 1.74Como 1.74 está en la región de aceptación se acepta , no hay diferencia significativaentre las proporciones de personas solteras y casadas que sufrieron un accidente durante un lapso de tres
años.
Prueba de hipótesis para muestras pequeñas
En los casos en los que se desconoce y el número de observaciones en la muestra es menor a 30, se puede utilizar la desviación estándar muestral, s, como una estimación de , pero no puede utilizar ladistribución de Z como valor estadístico de prueba. La t de Student o distribución t , sirve como valor
estadístico de prueba.
Prueba para la media poblacional
Se utiliza el mismo procedimiento que en el caso de la muestra grande pero el valor estadístico de prueba
es el siguiente:
=
√
Ejemplo
Por registros pasados se sabe que la vida útil promedio de una pila eléctrica que se utiliza en un reloj
digital es de 305 días. La vida útil de las pilas se distribuye normalmente. Tal elemento eléctrico fue
modificado recientemente para que tenga mayor duración. Se probó una muestra de 20 pilas modificadas
y se encontró que la vida media era de 311 días con una desviación estándar de la muestra de 12 días. Al
nivel de significancia de 0.05. ¿La modificación incrementó la duración promedio de la pila?
a.- Plantear la hipótesis nula y alternativa.
b.- Ilustrar gráficamente la regla de decisión.
c.- Calcular t y llegar a una decisión. Resuma la manera breve el resultado.
Solución:
Grados de libertad (g.l.): 20 – 1 = 19 Regla de decisión:
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
15/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
15
Rechazar si t Valor de prueba:
t = √ √ = 2.24
Por lo tanto se rechaza porque 2.24 está en la zona de rechazo. Prueba de dos medias poblacionales: Muestras aleatorias independientes
Valor de prueba
t t con – grados de libertad:
Donde:
Tamaño de muestra Media muestral Varianza ponderada
Población 1 Población 2 Grados de libertad: – 2Observación
Las varianzas son desconocidas, pero iguales:
Donde es un estimador insesgado de Ejemplo:
Una muestra de calificaciones en un examen presentado en un curso de Estadística (en escala 100) es:
Hombres: 72, 69, 98, 66, 85, 76,79 80,77
Mujeres: 87, 90, 78, 81, 80, 76
Al nivel de significancia de 0.01, ¿La calificación de las mujeres es más alta que la calificación de los
hombres?
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
16/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
16
Solución: : : H M 78 82
s 9.49 5.40
n 9 6
Regla de decisión:
Rechazar si t Valor de la prueba
t = 66.6153
t = 0.10Se acepta porque 0.42 está en la zona de aceptación. Por lo tanto, no se puede afirmar que la
calificación de las mujeres es más alta que la calificación de los hombres.
Prueba para la diferencia entre dos medias poblacionales: una prueba de diferencia pareada
Hay dos casos:
a.- Caso I:
< 30Variancias poblacionales desconocidas pero iguales
1.-Hipótesis nula: Ho: (µ1 – µ2) = µd = 0
2.- Hipótesis nula:
Prueba de una cola Prueba de dos colas
Ha: µd> 0 Ha: µd 0ó
Ha: µd < 0
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
17/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
17
3.- Estadístico de prueba
t = √ ⁄ = √ ⁄
=
1 –
2
4.- Región de rechazo: Rechazar Ho cuando
Prueba de una cola Prueba de dos colas
t > t t> ⁄ ó t – t Ejemplo.- Antes de contratar la instalación de un sistema que trasmita música a las oficinas de unaempresa, el gerente selecciona al azar 7 oficinas para instalarles el nuevo sistema. El tiempo promedio en
minutos que pasaban los empleados fuera de esas oficinas, fue registrado antes y después de instalarse el
sistema de música, obteniéndose los siguientes resultados
Numero de oficina 1 2 3 4 5 6 7
No música 8 9 5 6 5 10 7Con música 5 6 7 5 6 7 8
¿Sugeriría Ud. que el ejecutivo proceda con la instalación? = 0.05Solución
Ho: µd = 0
Ha: µd > 0
No música Con música d8 5 39 6 35 7 – 26 5 15 6 – 110 7 37 8 – 1
=7,14 =6,28 =0,85 =2,6457t = √ ⁄ = √ ⁄ = √ ⁄ =1,025
En las tablas t (7-1) 0,05 1,943
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
18/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
18
Conclusión: No hay una evidencia estadística para afirmar que con la instalación de la música en lasoficinas, los empleados pasaran más tiempo en estas.
b.. Caso II:
Variancias poblacionales desconocidas pero diferentes Las hipótesis son las mismas, pero la prueba estadística será:
Los grados de libertad se calculan de la siguiente manera:
g.l.
Los demás pasos son los mismos
Prueba de hipótesis para la Varianza
Hay casos que se tiene el problema de desconocer la varianza, o desviación estándar de la población, en
donde las distribuciones son normales. Si se desea probar una hipótesis acerca de la varianza se puede
hacer utilizando la distribución de Ji cuadrada (Chi cuadrada). Así mismo, supóngase que se tiene interés
en dos poblaciones normales independientes, donde las medias y las varianzas de la población son
desconocidas. Se desea probar la igualdad de las dos varianzas, ya que para poder comparar las medias de
estas dos poblaciones se ha utilizado la distribución de t de Student, en la cual podemos tener varianzas
iguales o diferentes en la población.
Par conocer esto último se requiere de la distribución F de Fisher, y después de utilizarla se tomará ladecisión de tener o no varianzas iguales en la población, dando pie a realizar la comparación de las dos
medias según sea el caso. En un primer caso en el que las varianzas de la población son desconocidas,
pero iguales, o en un segundo caso, donde se tiene varianzas desconocidas, pero diferentes
Prueba de hipótesis para la varianza de un distribución normal
A continuación se desarrollará el procedimiento para contrastar hipótesis sobre la varianza
poblacional , a partir de una muestra aleatoria de n observaciones de una población normal.Prueba bilateral de la varianza de una población
Estadístico de prueba: =
Regla de decisión a un nivel de significancia
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
19/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
19
Rechazar si: ó
Ejemplo
Una manera de evaluar la eficacia de un profesor ayudante es analizar las calificaciones obtenidas por sus
estudiantes en un examen al final del curso. Evidentemente, es interesante la puntuación media, sin
embargo, la varianza también contiene información útil; algunos profesores tienen un estilo que funciona
muy bien con los estudiantes más sobresalientes, pero es ineficiente con los estudiantes con menos
capacidad o menos motivados. Un profesor realiza un examen al final de cada semestre para todas las
secciones del curso, la varianza de las calificaciones de este examen suelen estar muy próximos a 300 :
Un nuevo ayudante tiene una clase de 30 estudiantes, cuyas calificaciones en el examen tuvieron una
varianza de 480; considerando estas calificaciones como una muestra aleatoria de una población normal,
contrastar la hipótesis nula de que la varianza poblacional de sus calificaciones es 300 frente a una
alternativa bilateral con 0.05
Regla de decisión
Rechazar si: ó Valor de prueba
= = 46.40Entonces dado que 45.72, se rechaza , lo cual significa que la varianza es diferente de 300
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
20/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
20
Prueba unilateral derecha de la varianza de una población
Estadístico de prueba
=
Regla de decisión a un nivel de significancia Rechazar si:
Ejemplo
Un producto, se debe maquinar determinada parte con tolerancias muy estrechas, para que los clientes la
puedan aceptar. Las especificaciones del producto piden que la varianza máxima de las longitudes de las
partes sea 0.0004. Suponga que en 30 partes, la varianza de la muestra resultó ser 0.0005. Pruebecon un
0.05 si se ha violado la especificación de varianza de la población
Estadístico de prueba
= = = 36.25
Regla de decisión a un nivel de significancia Rechazar si:
Regla de decisión
Rechazar si: Entonces dado que
, se acepta la Ho, lo cual significa que las especificaciones del producto
no han sido violadas.
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
21/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
21
Prueba unilateral izquierda de la varianza de una población
Estadístico de prueba
=
Regla de decisión a un nivel de significancia Rechazar si: Inferencia acerca de la varianza de dos poblaciones normales
Distribución de F
Denominada así por sir Ronald Fisher, uno de los fundadores de la ciencia estadística moderna. Esta
distribución se utiliza como la entidad estadística de prueba en varios casos, sirve para probar si dos
muestras proceden de poblaciones con varianzas iguales. Asimismo, también sirve cuando se desea
comparar simultáneamente varias medias poblacionales, esta comparación simultanea de varias de tales
medias se denomina análisis de varianza (ANAVA) ó (ANOVA), en estos dos casos las poblacionesdeben ser normales.
Prueba de hipótesis bilateral respecto a la varianza de dos poblaciones
Estadístico de prueba F Regla de decisión a un nivel de significación Rechaza sí:F ó F
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
22/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
22
Prueba unilateral derecha acerca de la varianza de dos poblaciones normales.
Estadístico de prueba
F Regla de decisión a un nivel de significación Rechaza sí:
F
Observación.- La varianza muestral más grande se coloca en el numerador, en consecuencia, la razón F
siempre es mayor a 1. Por lo tanto, el valor crítico de la cola de valores superiores es el único que se
necesita
( ) ( ) Ejemplo:
La compañía Piura Com realizó un estudio acerca de los hábitos de escuchar radio por parte de los
hombres y las mujeres. Un aspecto del estudio comprendió el tiempo promedio de audición. Se descubrió
que tal tiempo para los varones es de 35 minutos al día. La desviación estándar de la muestra de 11
personas de sexo masculino que se estudiaron fue de 10 minutos diarios. El tiempo promedio de audición
para las 13 mujeres en el estudio fue también de 35 minutos, pero la desviación estándar de la muestra,
resultó 12 minutos. Al nivel de significancia de 0.10, ¿es posible concluir que existe diferencia en la
variación del número de minutos que los hombres y las mujeres escuchan la radio?
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
23/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
23
Recuerde que
0.36
Rechaza sí:F ó F Estadístico de prueba
F 1.44Por lo tanto, al ser F 1.44 se acepta , lo cual significa que la variación del número de minutos queescuchan radio los hombres es igual al de las mujeres.
Ejemplo
En su incansable búsqueda de un sistema de llenado adecuado, cierta empresa prueba dos máquinas.
Robot Fill se usa para llenar 16 tarros y resulta una desviación estándar de 1.9 onzas en el llenado. Con
Automatic Fill se llenan 21 frascos que dan desviación estándar de 2.1 onzas. Si la empresa tiene que
elegir uno de estos sistemas en función de la uniformidad de llenado, ¿Cuál deberá seleccionar? Useun 0.05Solución
Robot Fill Automatic Fill
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
24/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
24
De acuerdo a la tabla de F:
Regla de decisión a un nivel de significación Rechaza sí: F Estadístico de prueba
F Dado que el valor de F es 1.22 se acepta Ho. Por lo tanto, se elige el proceso Automatic Fill porque es el
que presenta mejor uniformidad de llenado.
Prueba de bondad de ajunte e independencia
Prueba de Una medida de la diferencia existente entre las frecuencias observadas y esperadas es suministrada por el
estadístico, dado por: ∑
Donde
Frecuencia observada Frecuencia esperada.Ejemplo
La siguiente tabla muestra las frecuencias observadas al lanzar un dado 120 veces. Ensayar la hipótesis de
que el dado está bien hecho al nivel de dignificación de 0.05
Cara 1 2 3 4 5 6
Frecuencia observada 25 17 15 23 24 16
Solución
Hipótesis: : Las frecuencias observadas y esperadas son significativamente iguales (dado bienhecho). : La frecuencias observadas y esperadas son diferentes (dado cargado)
Primero se procede a encontrar los valores esperados. La probabilidad de obtener cualquier numero en un
dado no cargado es de Cara 1 2 3 4 5 6 Total
Frecuencia observada 25 17 15 23 24 16 120
Frecuencia esperada 20 20 20 20 20 20
Buscamos el valor en la tabla para K – 1 = 6 – 1 = 5 grados de libertad
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
25/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
25
Regla de decisión
Rechazar
11.07
Valor de la prueba
∑ + = 5Como 5 es menor que 11.07 se acepta la
y se concluye con una significación de 0.05, que el dado está
bien hecho
Tabla de contingencia
En muchas ocasiones, los n elementos de una muestra tomada de una población puede clasificarse con
dos criterios diferentes. Por tanto, es interesante saber si los dos métodos de clasificación son
estadísticamente independientes.
El interés recae en probar la hipótesis de que los dos métodos de clasificación renglón – columna son
independientes. Si se rechaza esta hipótesis, entonces, se concluye que existe alguna interacción entre los
dos criterios de clasificación.
Ejemplo
Una asociación de profesores universitarios quiere determinar si la clasificación en el trabajo es
independiente de la categoría académica. Para ello se realizó un estudio nacional entre los académicos
universitarios y encontró los resultados que se muestran a continuación, Con α al 0.05 haga una prueba
para saber si son dependientes la satisfacción en el trabajo y la categoría académica
CategoríaProfesorAsistente
Profesorauxiliar
Profesorasociado
Profesorprincipal
Satisfacción Mucha 40 60 52 63En el Regular 78 87 82 88trabajo Poca 57 63 66 64
.
Solución
Planteamiento de las hipótesis
La satisfacción en el trabajo y la categoría académica son independientes La satisfacción en el trabajo y la categoría académica no son independientesGrados de libertad: (r – 1)(c – 1) = (3 -1)(4 -1) = 6
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
26/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
26
Regla de decisión
Rechazar 12.59Se procede a calcular los valores esperados de cada celda: Donde: i= fila j = columna
Se toma en cuenta los totales del renglón y la columna
categoríaProfesorasistente
Profesorauxiliar
Profesorasociado
Profesorprincipal
Total
Satisfacción Mucha 40 60 52 63 215En el Regular 78 87 82 88 335trabajo Poca 57 63 66 64 250
Total 175 210 200 215 800
Valor de la prueba:
∑
= = 47.03 = = 56.44 = = 53.75 = = 57.78
= = 73.28 = = 87.94 = = 83.75
= = 90.03
= = 54.69 = = 65.62 = = 62.50 = = 62.50
categoríaProfesorasistente
Profesorauxiliar
Profesorasociado
Profesorprincipal
Total
Satisfacción Mucha 47.03 56.44 53.75 57.78 215En el Regular 73.28 87.94 83.75 90.03 335trabajo Poca 54.69 65.62 62.50 67.19 250
Total 175 210 200 215 800
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
27/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
27
+ = 2.75Como 2.75 es menor que el valor critico 12.59, por lo tanto, no se rechaza
y se concluye con un α =
0.05, que la satisfacción en el trabajo y la categoría académica son independiente.
Análisis de regresión y correlación
Análisis de correlación
Conjunto técnicas estadísticas empleadas para medir la intensidad de la asociación de dos variables.
Diagrama de dispersión
Gráfica que presenta la relación entre dos variables.
Variable dependiente
Es aquella cuyos datos dependen de otras variables.
Variable independiente
Son los valores que no tienen relación de dependencia con otras variables.
Por convención, la variable conocida o independiente se grafica en el eje de abscisas (x), y la variable
independiente o estimada en eje de las ordenadas (y)
Ejemplo
La empresa Rázuri Hnos. un negocio familiar que ha vendido al menudeo en Piura durante muchos años,
se anuncia ampliamente por radio y televisión, destacando sus bajos precios y accesibles condiciones decrédito. Al dueño le gustaría analizar la relación entre las ventas y lo que gasta en publicidad. A
continuación se muestra la información acerca de las ventas y lso gastos de publicidad durante los últimos
cuatro meses.
Mes Gastos de publicidad(miles de dólares)
Ingreso por ventas(miles de dólares)
Julio 2 7Agosto 1 3
Setiembre 3 8Octubre 4 10
Se plantea la hipótesis de que a medida que aumentan los gastos de publicidad, aumentan los ingresos por
ventas.
Debemos comenzar por el diagrama de dispersión, que nos permite tener una idea sobre el grado
(intensidad) y la naturaleza (forma) de la relación entre las dos variables. Entonces podemos dar cuenta si
la relación es lineal o no lineal, positiva o negativa, o simplemente no existe una relación aparente.
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
28/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
28
Observando el diagrama podremos establecer lo siguiente:
1.- Existe una relación lineal entre los gastos de publicidad y el ingreso por ventas en ese periodo de 4
meses. Por lo tanto, es posible trazar una línea recta que se ajuste a los puntos graficados en eldiagrama de dispersión
2.- La relación no es determinística; vale decir, cualquiera que sea la línea recta que se trace, la mayoría
de los puntos estarán por encima o por debajo de dicha recta.
Coeficiente de correlación
Medida de la intensidad de la relación lineal entre dos variables. Para determinar el valor numérico del
coeficiente de correlación se utiliza la siguiente expresión
r =
Donde:
n= Número de pares de observaciones
∑x = Suma de los valores de la variable x
∑y = Suma de los valores de la variable y
∑ = Suma de los valores de x elevados al cuadrado
Cuadrado de la suma de los valores de x
∑= Suma de los valores de y elevados al cuadrado = Cuadrado de la suma de los valores de y∑xy = Suma del producto de x e y
El coeficiente de correlación ( r ) puede tomar cualquier valor de -1.00 a +1.00 inclusive. Un coeficiente
de correlación -1.00 ó de +1.00 indica una correlación perfecta
Un coeficiente cercano a cero indica que la relación es débil.
Con los datos del problema tenemos:
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
29/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
29
Total
r = r =
= 0.96Por lo tanto existe una fuerte correlación entre el gasto en publicidad y el ingreso por ventas.
Análisis de regresión
A través del análisis de regresión buscamos que la línea de ajuste se aproxime lo mejor posible a todos los
puntos del diagrama de dispersión. La ecuación para la línea recta empleada para calcular y con base en
x se conoce como ecuación de regresión.
Ecuación de regresión
Expresión matemática que define la relación entre dos variables.
Principio de mínimos cuadrado
Técnica empleada para obtener la ecuación de la regresión, minimizando la suma de los cuadrados de las
distancias verticales entre los valores y verdaderos y los valores pronosticados .Dicha recta se define como:
y = a +bx
Par determinar la calidad estimadora de esta recta necesitamos alguna medida de la distancia de los
puntos ( a esta recta. El siguiente grafico muestra, para un solo punto, como se mide esta distancia.Para el valor el correspondiente valor y en nuestra recta es a + bx mientras que el valor realmenteobservado para la variable dependiente es .La diferencia entre los dos es:
x y xy 2 7 14 4 491 3 3 1 93 8 24 9 644 10 40 16 100
10 28 81 30 222
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
30/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
30
Ahora bien, cualquier estimador razonable de la recta de regresión verdadera dejará algunos de los datos
observados por debajo y otros por encima de la recta estimada. Por lo tanto, algunos de los serán positivos y otros negativos
a = b =
b =
La recta:
̂ = a + bxSe denomina recta de regresión muestral de y sobre x
El coeficiente b significa que cada unidad adicional de x incrementa el valor de y en b unidades
El valor a solo tiene interpretación matemática, indica el punto de corte de la recta con el eje y.
Ejemplo
Los datos siguientes muestran las ventas (en millones) de cajas y los gastos de publicidad (en millones de
dólares) para 7 marcas principales de refrescos:
Marca Gastos depublicidad
Ventas de cajas
Coca cola 131.3 1929.2Pepsi 92.4 1384.6Kola real 60.4 811.4Sprite 55.7 541.5Inca cola 40.2 536.9Concordia 29.0 535.67 up 11.6 219.5
a.- Trace un diagrama de dispersión para estos datos, con los gastos de publicidad como variable
independiente.
b.- ¿Qué parece indicar este diagrama acerca de la relación entre las dos variables? trace una recta que pase por los datos, para aproximar una relación lineal entre los gastos de publicidad y las ventas.
c.- Aplique el método de mínimos cuadrados para plantear la ecuación estimada de regresión
d.- Presente una interpretación de la pendiente de esta ecuación
Solución:
Variable independiente: Gastos de publicidad
Variable dependiente: Ventas de cajas
Diagrama de dispersión.
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
31/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
31
El diagrama parece indicar que la relación entre las variables es linealmente positiva.
Ahora encontraremos los valores de r , a y b
Gastos de Publicidad Ventas de cajasx y xy
131.3 17 239.69 1929.2 3 721 812.64 253 303.96
92.4 8 537.76 1 384.6 1 917 117.16 127 937.04
60.4 3 648.16 811.4 658 369.96 49 008.56
55.7 3 102.49 541.5 293 222.25 30 161.55
40.2 1 616.04 536.9 288 261.61 21 583.38
29 841 535.6 286 867.36 15 532.4
11.6 134.56 219.5 48 180.25 2 546.2
Sumas 420.6 35 119.7 5 958.7 7 213 831.23 500 073.09
r =
r = = 0.97810014Como r se aproxima a uno, entonces diremos que la relación que hay entre las dos variables es bastante
fuerte o intensa.
La ecuación que mejor se ajusta a los datos es una recta, como se aprecia en el siguiente gráfico.
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
32/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
32
b =
b =
= 14.42378282a =
a = = - 15.42Por lo tanto la ecuación de la recta seria:
y = a +bx
y = - 15.42 + 14.424x
La interpretación que tiene a es solo matemática, esto es el punto de corte con el eje y
El valor que toma b se interpreta como: por cada incremento en la variable dependiente se espera una
variación de 14.424 en la variable dependiente
Coeficiente de determinación ( )Es el estadístico que mide la proporción de la variación total en y que puede ser explicada por la
variación en x.
El coeficiente de determinación se calcula elevando al cuadrado el coeficiente de correlación.
En el ejemplo anterior como r = 0.9781, el coeficiente de determinación será 0.9567, luego pudedecirse que 95.67% de la variación en el número de cajas vendidas se explica por la variación en los
gastos de publicidad.
Prueba de significancia del coeficiente de correlación
Es importante estudiar si r es significativo (distinto de cero) ya que ello implica que el modelo de
regresión lineal es significativo.
Planteamiento de hipótesis:
0 (la correlación en la población es nula) (la correlación en la población no es nula)
Estadístico de prueba
t √ √ , con n – 2 grados de libertad
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
33/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
33
Rechazar si:T ó t
Del ejemplo anterior, pruebe la hipótesis de que no existe correlación en la población. Emplee 0.02 de
nivel de significancia
Solución
Planteamiento de hipótesis
0 (la correlación en la población es nula) (la correlación en la población no es nula)Regla de la decisión
Rechazar si:T ó t
Estadístico de prueba
t √ √ = √ √ = = 10.5093Se acepta la hipótesis alternativa, es decir existe relación entre las variables en estudio
ERROR ESTÁNDAR DE LA ESTIMACIÓN:
Mide la dispersión de los valores observados, con respecto a la recta de regresión.
=
–
=
– ––
MarcaGastos dePublicidad
x
Ventas deCajas
y RendimientoPronosticado
Desviacionesy -
Desviacionesal cuadrado
Coca cola 131.3 1929.2 1878.45 50.75 2575.56Pepsi 92.4 1384.6 1317.35 67.25 4522.56
Kola real 60.4 811.4 855.78 - 44.38 1969.58Sprite 55.7 541.5 787.99 - 246.49 60757.32
Inca cola 40.2 536.9 564.42 - 27.52 757.35Concordia 29.0 535.6 402.87 132.73 17617.25
7 up 11.6 219.5 151.89 67.61 4571.11
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
34/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
34
= – = – = 136.21ESTIMACIÓN DE LOS INTERVALOS DE CONFIANZA
El error estándar de la estimación es una medida válida para utilizarla al fijar los intervalos de confianza
cuando el tamaño de muestra es grande y de alguna forma la dispersión con respeto a la recta de la
regresión está distribuida de manera normal.
Un intervalo de confianza se determinará para:
1.- El valor medio de Y para un valor dado de X
2.- Un valor individual de Y para un valor dado de X
t(Syx)
( )
De donde
Y' = es el valor pronosticado para cualquier valor X seleccionado
X = es cualquier valor seleccionado de X = es la media de Xn = en el número de observaciones
Syx = es el error estándar de la estimación
t = es el valor de t tomado para n – 2
Ejemplo
De acuerdo a los datos anteriores. Calcular los intervalos de confianza para la venta de cajas de gaseosascuando la inversión en publicidad es 100.00 (millones de dólares) = es 1426.98 para un x igual a 100= es 60.0857n = es 7
Syx = 136.21
t (n – 2) =t(7 -2)(0,05)= 2.5711426.98 –
1426.98 195.1291 = 1622.1091 y 1231.8509 Interpretación.-
Cuando se invierte 100 millones de dólares en publicidad, se espera que la venta de gaseosas esté
comprendida entre1622.1091 y 1231.8509 miles de cajas
Pero cuando a se trata de un valor individual la fórmula es:
t(Syx) ( )
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
35/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
35
Ejemplo.
- Cuanto será la venta de cajas de Inca cola, cuando esta compañía invierta 100 millones en publicidad:
1426.98 1426.98 1972.305y 881.655
Interpretación.-
Con una probabilidad del 0,95 se puede afirmar que cuando la Inca Cola invierta 100 millones en
publicidad sus ventas estarán comprendidas entre 1972.305 y 881.655 cajas..
RELACIÓN ENTRE COEFICIENTE DE CORRELACIÓN, COEFICIENTE DEDETERMINACIÓN Y ERROR ESTANDAR DE ESTIMACIÓN
Un medio conveniente para mostrar la relación entre estas tres medidas es la ANAVA, recordemos que:
El error estándar de la estimación mide cuán cerca de la recta de regresión se encuentra los valores reales.Cuando el valor es pequeño indica que las dos variables están relacionadas muy de cerca.
El coeficiente de correlación mide la fuerza de la asociación entre dos variables. Cuándo los puntos del
diagrama de dispersión parecen cercanos a la línea recta, se observa que el coeficiente de correlación
tiende a ser grande. Luego el error estándar de la estimación y coeficiente de correlación indican la misma
información, pero utilizan escalas diferentes.
El coeficiente de determinación mide el porcentaje de la variación de Y que se explica por la variación de
A N A V A
Fuentes deVariación Suma deCuadrados Grados deLibertad CuadradoMedio Prueba designificación SignificaciónestadísticaRegresión 1 ⁄ ⁄ Error n – 2 ⁄ Total n – 1SC r = – SC e= ∑( – ) =SC t – SC rSC t = ∑ ( – )
y ( – ) ( ) – ( – ) ( ) 1929.2 1878.45 851.2428 1077.9572 1161991.725 50.75 2575.5625 1027.2072 1055154.632
1384.6 1317.35 851.2428 533.3572 284469.9028 67.25 4522.5625 466.1072 217255.9219
811.4 855.78 851.2428 - 39.8428 1587.4487 -44.38 1969.5844 4.5372 20.5861
541.5 787.99 851.2428 -309.7428 95940.6021 -246.49 60757.3201 -63.2528 4000.9167
536.9 564.42 851.2428 -314.3428 98811.3959 -27.52 757.3504 -286.8228 82267.3186
535.6 402.87 851.2428 -315.6428 99630.3771 132.73 17617.2529 -448.3728 201038.1678
219.5 151.89 851.2428 -631.7428 399098.9654 67.61 4571.1121 -699.3528 489094.3389
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
36/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
36
A N A V A
Fuentes deVariación
SC GL CM F Sign.Estad.
Regresión 2048831.882 1 2048831.882 110.4244 **Error 92770.7449 5 18554.1489Total 2141530.417 6
F (1,5)= 6.61 ( 16.26 ( Interpretación:
Realizado el análisis de variancia (ANAVA) para la regresión se encontró una alta significación
estadística para la regresión, por lo tanto podemos decir que existe asociación entre ambas variables en
estudio
= = 1 – = = 1 – = 0,9567 = 95.67%
El 95.67% de las variaciones de la venta de cajas de gaseosas (Y) es explicado por la inversión que se
hizo en publicidad (X)
r = = 0.9781 (Coeficiente de correlación)1 – = 4.33% (Coeficiente de no determinación)
El error estándar de la estimación también puede ser calculado de la siguiente forma
S yx= – = – = 136.2136Por último se como se observa que conforme la Suma de Cuadrado del error disminuye
ta y por el contrario, conforme disminuye el error estándar se incrementa r 2
Análisis de regresión múltiple
Estudia la influencia de dos o más variables independientes sobre la dependencia de otra variable
dependiente.
La ecuación será:
= bo + b1X1 +b2X2X 1,X2 = son las dos variables independientes
bo = es la intersección en Y, es decir, la ordenada con el eje del punto de intersección con el
eje Y
b1= es el cambio neto en Y por cada cambio unitario de X1 manteniendo x2 constante (o sea
sin cambios). Se denomina coeficiente de regresión parcial, coeficiente de regresión
neta, ó más brevemente, coeficiente de regresión.
b2 = Es el cambio neto en Y por unidad de cambio en X2, manteniendo X1 constante (sin
cambios). También se denomina coeficiente de regresión parcial o simplemente
coeficiente de regresión.
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
37/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
37
La ecuación de la regresión múltiple se puede ampliar a más variables independientes.
Y' = bo +b1X1 + b2X2 +b3X3 +……………+bk Xk
El método de mínimos cuadrados, minimiza la suma de cuadrados de las desviaciones verticales con
respecto a la línea de la regresión, principios que se cumple para la regresión lineal como para la
regresión múltiple.En el caso de dos variables independientes es necesario resolver las siguientes ecuaciones:
∑Y = na + b1∑X1 +b2∑X2
∑X1Y = bo∑X1 + b1∑ + b2∑X1X2 ∑X2Y = bo∑X2 + b1∑X1X2 + b2∑
Este sistema de ecuaciones se puede resolver de diferentes maneras, una de ellas es empleando matrices
Ejemplo.- El director de personal de una empresa que tiene un importante grupo de vendedores, debeentrevistar y seleccionar nuevo personal. Ha diseñado una prueba que ayuda a seleccionar los mejores
aspirantes para su personal de ventas A fin de verificar la validez de una prueba como instrumento de predicción de las ventas semanales. Eligió al azar a cinco vendedores y aplicó la prueba a cada uno. Los
importes de ventas semanales se aparearon con el puntaje obtenido en la prueba y con la calificación que
se les hizo a su desempeño
1.- ¿Cuál será la ecuación de regresión múltiple?
2. ¿Supóngase que un solicitante de empleo en el departamento de ventas tuvo un puntaje de 6,0 en la
prueba y una calificación de desempeño de 3,8. ¿Cuáles son las ventas semanales estimadas del
solicitante?
Vendedor Ventas semanales(en miles de soles) Y
Puntaje de laPrueba
Calificación deDesempeño
Juan 5 4 2Milagritos 12 7 5Raúl 4 3 1Steffany 8 6 4Eduardo 11 10 6
Solución:1.- La ecuación podrá ser calculada de la siguiente forma:
–
=
Total
Reemplazamos en el arreglo matricial
Y 5 4 2 16 4 8 20 10
12 7 5 49 25 35 84 60
4 3 1 9 1 3 12 4
8 6 4 36 16 24 48 32
11 10 6 100 36 60 110 66
40 30 18 210 82 130 274 172
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
38/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
38
– =
Encontramos determinante de la matriz 3x3
|| Procedemos a invertir la matriz cuadrada 3x3
* + = 320 * + = 120 * + = 120* + =120 * + = 86 * + = 110* + = 120 * + = 110 * + = 150
– – –
–
=
Calculamos los coeficientes de la regresión múltiple
[(–)] = 3,5 =[(–)–] = – 0,975
= [(–)] = 2,875Luego la ecuación será igual a: = bo + b1X1 + b2X2 = 3,5 + ( – 0,975) X1 + 2,875X22.- Y' = 3,5 + ( – 0,975)6,0 + 2,875(3,8)
Y' = 8,575 miles de nuevos soles.
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
39/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
39
ERROR ESTÁNDAR MÚLTIPLE DE LA ESTIMACIÓN:
El error estándar de la estimación en el análisis de la regresión múltiple mide el error para valores de Y
con respecto al plano de regresión si es que intervienen dos variables independientes.
Sy.12 =
–
–
Puntaje dePrueba
CalificacióndeDesempeño
Ventassemanales(miles desoles)
VentassemanalesPronosticadas(miles de soles)
( ) Juan 4 2 5 5,35 – 0,35 0,1225
Milagritos 7 5 12 11,05 0,95 0,9025
Raúl 3 1 4 3,45 0,55 0,3025
Steffany 6 4 8 9,15 – 1,15 1,3225
Eduardo 10 6 11 11,00 0,00 0,0000
Total 0,00 2,6500
Sy.12 = – = 1,151 miles de solesCOEFICIENTE DE CORRELACIÓN MULTIPLE. (r)
Es la medida de la fuerza de la asociación entre la variable dependiente y dos o más variables
independientes
Este coeficiente toma valores entre 0 y a 1 inclusive, siempre es positiva Ejemplo Un coeficiente de 0,94
indica una asociación muy fuerte entre las variables dependiente e independiente. Un coeficiente de 0,09
revela una relación muy débil
Correlación Correlación Correlación pequeña moderada grande
0 0,50 1,00
sin correlacion correlación perfecta
COEFICIENTE DE DETERMINACIÓN MÚLTIPLE (r2).-- Proporción (porcentaje) de la variación
total en la variable dependiente Y que se explica por medio del conjunto de variables independientes
COEFICIENTE DE NO DETERMINACIÓN MÚLTIPLE (1 – r2).- mide la proporción de lavariación total en la variable dependiente Y, que no se debe a las variables independiente.
A N A V A
Fuentes deVariación
Suma deCuadrados
Grados deLibertad
CuadradoMedio
Prueba designificación
Significaciónestadistica
Regresión K ⁄ ⁄ Error n – ⁄ Total n – 1El coeficiente de determinación se puede calcular de la siguiente manera:
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
40/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
40
Error estándar de la estimación múltiple será igual a:
Sy.12 = – –
Total
A N A V A
Fuentes devariación
SC GL CM F SIG
Regresión 47.35 2 23.675 17.87 N.S.Error 2.65 2 1.325Total 50 4
F(2,2)= 19,00 ( 99,50 (
Coeficiente de determinación:
=
%
Quiere decir que el 94,70% de la variación es explicado por la regresión
Coeficiente de regresión múltiple
r = √ = 0,9731Error estándar de la estimación múltiple:
Sy.12 = – – = – = 1,1510FUNDAMENTOS DE LA EXPERIMENTACIÓN AGRÍCOLA;
DISEÑOS EXPERIMENTALES
La estadística es uno de los elementos básicos de la experimentación agrícola, ya que mediante ella se
pueden obtener algunas conclusiones acerca de tales experimentos.
El desarrollo agrícola de un país se basa en las investigaciones que se realizan en ese campo, valiéndose
de la experimentación. Cualquier modalidad en las técnicas de cultivo, al introducirse por primera vez a
una región, necesita de la experimentación para poder adaptarlo y divulgarlo entre los agricultores. Esto
se debe a que las condiciones de clima y suelo varían en cada región, estación y año.
y – – – 5 5,39 8 – 3 9 – 0,35 0,1225 – 2,65 7,022512 11,05 8 4 16 0,95 0,9025 3,05 9,30254 3,45 8 – 4 16 0,55 0,3025 – 4,55 20,70258 9,15 8 0 0 – 1,15 1,3225 1,15 1,322511 11 8 3 9 0 0 3 940 40 0 50 0 2,65 0 47,35
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
41/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
41
Para el aprovechamiento óptimo de los recursos disponibles, los experimentos se deben diseñar de
acuerdo con los principios estadísticos que permiten al experimentador llegar a conclusiones correctas
acerca de un problema específico. Los experimentadores y estadísticos deben planear los experimentos
conjuntamente. Para ello el estadista debe tener un criterio práctico y el experimentador un criterio
estadístico.
Las etapas de todo trabajo de investigación se pueden resumir de la siguiente manera:
a) Enunciado del problema. b) Colaboradores.c) Formulación de hipótesis.d) Selección del procedimiento y diseño experimentales.e) Realización del experimento.f) Aplicación de los métodos estadísticos a los resultados,g) Interpretación de resultados.h) Análisis económico y su utilidad práctica para la comunidad.
La biometría es primordial para analizar e interpretar los datos y se manifiesta en diversas formas:
a) Estudio de la variación de una población de seres vivos. b) Comparación entre poblaciones y muestras para juzgar su semejanza.c) Interpretación de resultados de experimentos biológicos y agropecuarios, en donde se comparan
poblaciones o muestras sometidas a diferentes estudios o pertenecientes a diferentes variedades o
razas.
d) Determinación de la relación entre dos o más variedades (correlación y regresión).e) Aplicación de métodos para reducir las fuentes de error en la correlación de datos.f) En poblaciones segregadas, separación de la variación atribuible a la sección de los genes debido
al medio, en estudios de herencia cuantitativa.
En general, la experimentación agrícola la deben realizar los profesionales relacionados con las ciencias
agronómicas y biológicas.
Diseñar un experimento significa planear un trabajo de modo que reúna la información aplicable al
problema en investigación. Steel y Torrie consideran un experimento como una pregunta que detectará
nuevos hechos, confirmará los resultados de ensayos anteriores y dará recomendaciones de aplicación
práctica.
El experimento es el conjunto de reglas usadas para obtener una muestra de la población y al concluir el
ensayo obtener información acerca de la población. Little y Jackson afirman que el experimento es un
elemento de investigación utilizada para descubrir algo desconocido, o para probar un principio o una
hipótesis. Es un caso importante del método científico, ya que las preguntas que el experimento pretende
contestar serán fundamentales para apoyar o rechazar una hipótesis.
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
42/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
42
TRATAMIENTO
Es una de las formas que, en cantidad o calidad, el factor a estudiar toma durante el experimento. Por
ejemplo, sí el factor a estudiar es variedad de arroz, un tratamiento es la variedad NIR si el factor a
estudiar es cantidad de lisina, cada una de las dosis de lisina aplicada durante el experimento es un
tratamiento. Los tratamientos a estudiar durante el experimento pueden ser una combinación de varios
factores simples: si quiere estudiarse la distancia entre hileras y la distancia entre plantas en un cultivo, se
pueden considerar tratamientos simples como 80 cm. entre hileras o 3 cm entre plantas, o tratamientos
combinados como 80 cm entre hileras y 3 cm entre plantas.
Por ejemplo, en la industria el productor de detergentes puede establecer como tratamiento el tipo de agua
(dura o suave), la temperatura del agua, la duración del lavado, la marca y el tipo de lavadora. En los
estudios sociológicos y psicológicos, los tratamientos se pueden referir a edad, sexo, grado de educación,
religión, etcétera.
Unidad experimental
es el material experimental al que se aplica un tratamiento de manera uniforme. Puede ser un animal, un
conjunto de semillas, una parcela, una maceta, un árbol, un tubo de ensayo, etcétera.
Tratamiento testigo
Es un tratamiento que se compara. Por ejemplo, si se quiere probar en una región el grado de adaptación y
rendimiento de una variedad nueva de plátano, se planeará el ensayo de tal manera que se incluyen
variedades locales como testigos. Si la nueva variedad presenta mayor resistencia a enfermedades,insectos, vientos, precipitación, etc., y en consecuencia produce mayor rendimiento por hectárea, esa
variedad se recomendará para la zona.
En investigación con animales se pueden probar sexos, localidades, raciones, épocas, sistemas de
pastoreo, carga de animal óptima, tipos de vacuna, uso de vitaminas y minerales, etc. En tales casos, se
forman grupos de animales tan homogéneos como sea posible para la investigación. Para formar los
grupos se deben considerar aspectos como edad, sexo y raza. Si a varios grupos de animales se les
administran diferentes dosis de vitaminas, pero no a un grupo testigo, el análisis estadístico dará
información acerca del aumento de peso, altura y precocidad de los animales que recibieron la vitamina
comparados con los que no la recibieron.
REPETICIÓN
Cuando en un experimento se tiene un conjunto de tratamientos para poder estimar el error experimental,
es necesario que dichos tratamientos aparezcan más de una vez en el experimento, para así aumentar la
precisión de éste, controlar el error experimental y disminuir la desviación estándar de la media. Por lo
tanto, se entenderá por repetición al número de veces que un tratamiento aparece en el experimento.
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
43/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
43
DISEÑO EXPERIMENTAL
Es el procedimiento que se sigue para asignar los tratamientos a las unidades experimentales. Es un
método aleatorio, o sea, de asignación al azar, porque se decide el tratamiento que corresponde a cada
unidad experimental mediante un sorteo o por medio de una tabla de números aleatorios.
BLOQUE O REPETICIÓN
Es un conjunto de unidades experimentales lo más homogéneas posibles, en el cual aparecen todos los
tratamientos una sola vez; dicho bloque se debe colocar perpendicular al gradiente para tratar de
minimizar el error.
ERROR EXPERIMENTAL
Los resultados experimentales varean no solo por la acción de los tratamientos, sino también por
variaciones ambientales que tienden a enmascarar el efecto de los tratamientos. Por lo general. Paraexpresar estas variaciones se usa el término error experimental. Pero el término error no quiere decir
equivocación, sino que incluye todo tipo de variación externa ajena al material experimental.
El error experimental es la medida de variación que existe entre las observaciones de unidades
experimentales en el mismo tratamiento, es decir, la variación no proviene de los tratamientos. Existen
dos clases de variaciones; la variación inherente al material experimental, al que se aplican los
tratamientos, y la que proviene de la falta de uniformidad en la realización física del experimento. Si los
resultados obtenidos tienen la precisión necesaria para llegar a conclusiones validas, ninguna de las dos
fuentes de variación deben preocupar al investigador.
El error experimental no se puede eliminar, pero sus efectos se pueden reducir para obtener una mejor
estimación de los efectos de los tratamientos. Las modalidades más recomendadas para disminuir error
son:
a.-Utilizar unidades experimentales muy uniformes, como suelo homogéneo, riegos, densidad de
siembra, fertilización, control de plagas y hierbas, etcétera.
b.- Tamaño adecuado de la unidad experimental.
c.- Eliminación del efecto de orilla y de la competencia entre tratamientos
d.- Distribución adecuada de los tratamientos mediante sorteos.
e.- Usar el número adecuado de repeticiones para cada tratamiento.
f.- Poner todos los tratamientos en iguales condiciones, de manera que si alguno es superior a los
demás, se puede probar.
Existen ciertos detalles técnicos al realizar los experimentos que parecen obvios, sin embargo, muchas
veces pasan inadvertidos. Una vez que se tiene listo el terreno para el experimento, es conveniente marcar
los contornos de los bloques y la posesión de las parcelas de acuerdo con el diseño experimental. Si el
campo está surcado y el número de surcos por parcela es impar se debe marcar el surco central de cada
parcela, y si es par el primer surco de la derecha. Además, las bolsas que contengan las semillas, abonos,
etc., que se aplican a las parcelas, tendrán claramente indicado el número de bloque y parcela a que
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
44/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
44
pertenecen. Antes de empezar la siembra y su preparación, el experimentador debe verificar que cada
bolsa esté en el campo frente a la parcela correspondiente.
Durante la realización del experimento debe quedar claro que todas las labores se harán con uniformidad
para todo el lote experimental, excepto las que están en estudio. Cuando se efectúan experimentos de
abonamiento, variedades, etc., es importante conocer el origen de cada tratamiento, las características de
las variedades y el análisis de los abonos. Los materiales para aplicar los tratamientos se deben conseguir
y preparar oportunamente, y nunca esperar hasta el día del inicio del experimento.
La siembra, abonamiento, labores culturales y otras, se deben realizar el mismo día para todo el
experimento. Lo anterior es necesario en los lugares lluviosos, porque las labores realizadas antes y
después de llover encuentran el terreno en condiciones diferentes, lo cual puede causar variabilidad en la
germinación, efecto de los abonos, etc. Si no es posible realizar las labor completa en un día se debe
evitar dejar bloques sin terminar
Si se trata de experimentos comparativos de variedades es útil compara las características de las
variedades sembradas, con aquellas que se obtienen al momento de la cosecha, para determinar cómo se
adaptan a las condiciones ecológicas de la localidad. También es muy importante que una parte de la
semilla de las variedades introducidas se cultive aparte para mantener su pureza, además de multiplicarla
y aclimatarla, ya sea para utilizarla en experimentos siguientes o para distribuirla entre los agricultores.
En ciertos casos, para mantener la pureza de la variedad es necesario ir al embolsado de las flores para
evitar la polinización cruzada.
Cuando se trabaja con varios obreros de campo es importante cuidar que ninguno se dedique a un mismo
tratamiento en todas las repeticiones del experimento. Ya que, un obrero puede trabajar mejor que otro y,
en consecuencia, el tratamiento que realice estará en ventaja.
Un experimento nunca se debe sembrar fuera de época porque pierde su valor. En los experimentos de
abonamiento no debe descartarse el testigo sin abono, ni el testigo que representa la práctica de la
localidad. Debido a que muchos experimentos se pierden por los daños que causan los animales se debe
extremar la vigilancia, especialmente en la época próxima a la cosecha.
En la toma de datos y observaciones en los experimentos, es importante que el experimentador se libere
de toda preferencia por determinado tratamiento para evitar falsear de manera inconsciente los resultados.
También es importante que él mismo sea quien haga las observaciones y que anote sólo los datos
debidamente comprobados. En los experimentos no deben interesar solamente los rendimientos, ya que de
proceder así no se conocerían las causas que determinan ciertos resultados de buena calidad del producto.
Se aconseja revisar los experimentos cuando menos una vez por semana, para hacer las observaciones
oportunamente. Todas las observaciones se deben anotar cuidadosamente sin dejan nada al azar ni confiar
en la memoria. Los datos deben estar en orden, de tal manera que otro experimentador pueda utilizarlos si
es necesario.
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
45/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
45
Para muchos investigadores el tamaño y la forma de la unidad experimental es únicamente un problema
de control. Sin embargo, investigaciones realizadas en diferentes cultivos con datos de ensayo en blanco,
han indicado que el tamaño adecuado se relaciona con el grado de precisión y con una mejor estimación
de los efectos de los tratamientos, el aspecto del costo por unidad experimental y la precisión del
experimento: aquí se prefiere un mayor número de repeticiones que el tamaño, y la unidad experimental
se orienta de manera que la mayor dimensión se dirija hacia donde esté la mayor variación del suelo.
ELECCIÓN DEL DISEÑO EXPERIMENTAL
Cuando el experimentador ya definió el objetivo del trabajo y los tratamientos por probar, el siguiente
paso es determinar el diseño experimental que se debe usar. Para un experimento específico, el mejor
diseño es el más sencillo y el que usa la menor cantidad de material para lograr el objetivo.
En la práctica, las unidades experimentales, las condiciones ambientales y de manejo no son iguales, y los
métodos de medida son inexactos. Por ello, es necesario hacer repeticiones y utilizar un diseño
experimental.
Si se considera que el experimentador estudia un fenómeno complejo (como la producción de trigo, de
leche o el crecimiento de una colonia de hongos), que mantiene fijos todos los factores que intervienen en
el fenómeno y que los métodos de medida son exactos, el resultado será el mismo cada vez que se realice
el experimento. Entonces, cada combinación de factores determina un resultado que permanecerá
constante si se repite el experimento. El experimentador, de acuerdo con su objetivo, varía uno o más
factores para evaluar el efecto de tales variaciones en el resultado.
TÉCNICA DE ALEATORIEDAD
Debido a la variabilidad del suelo, para evitar que un tratamiento sea favorecido o puesto en desventaja en
forma sistemática en sus repeticiones, Fisher ideó la técnica de aleatoriedad, cuya finalidad es dar una
estimación insesgada del error experimental.
Las parcelas contiguas tienden a correlacionarse, por eso cualquiera de ellas debe recibir al azar algún
tratamiento. La aleatoriedad tiende a destruir la correlación entre errores y hacer válidas las pruebas de
significación. El ejemplo más común de la técnica de aleatoriedad está dado por la rifa de un objeto. Si se
colocan papeles o fichas numeradas en un ánfora y se supone que están completamente mezcladas,
cualquier secuencia en que salgan se considerará aleatoria. Cuando el investigador tiene pocos
tratamientos recurre a esta técnica. Sin embargo, es preferible recurrir a una tabla de números aleatorios.
ANÁLISIS DE VARIANZA
Anteriormente se analizaron datos provenientes de dos muestras o dos tratamientos. Se observó que por
medio de la prueba t de Student es posible determinar si la variedad A es estadísticamente más productiva
que la variedad B, o si un forraje con fertilizante es mejor que un forraje sin fertilizante.
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
46/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
46
El trabajo del investigador pocas veces se limita a estudiar dos tratamientos a la vez. Para ahorrar tiempo
y esfuerzo, y para aumentar la precisión del experimento, por lo general, se estudian más de dos factores a
la vez, con varios niveles dentro de cada factor.
Sir Ronald Fisher introdujo el análisis de varianza (ANAVA), que es un procedimiento aritmético que
consiste en desdoblar la suma de cuadrados total (variación total) en fuentes de variación reconocidas,
con todo y la variación que no se pudo medir (proveniente de la variabilidad inherente al material
experimental o de la falta de homogeneidad del ambiente donde se realizó el experimento); fuente de
variación que se conoce como residuo o error experimental. Por ejemplo, cuando se trató lo concerniente
a regresión, la suma de cuadrados total se descompuso en suma de cuadrados debido a la regresión, más
la suma de cuadrados debido al error.
El ANAVA se utiliza en todos los campos de investigación cuando los datos se miden cuantitativamente.
Su uso ha sido muy ventajoso en el diseño experimental. Las suposiciones básicas del ANAVA son
a) Los efectos de tratamientos y ambientales son aditivos. b) El error experimental es un elemento aleatorio, normal e independiente, distribuido con media
cero y varianza común.
GRADOS DE LIBERTAD
Los grados de libertad son el número de contrastes ortogonales menos el número de restricciones
impuestas, que se pueden hacer en un grupo de datos. Por ejemplo, si se supone que el rendimiento de
cinco variedades de un cultivo es de 25, 26, 27, 28 y 29 kg, la medía es 27 kg. Las desviaciones de los
números con respecto a su medida (que deben sumar cero) son:
25 26 27 28 29
-2 -1 0 +1 +2
En esta muestra de cinco datos, uno queda fijo (la restricción está dada por X= 27), porque X se utilizó
como el origen para las desviaciones. Entonces quedan cuatro valores (cuatro grados de libertad) que se
pueden comparar independientemente con la media, o sea que el número de grados de libertad de una
muestra de datos está dado por el total de observaciones menos uno (n - 1).
La varianza de la muestra está dada por:
= ( ) = Es decir, la varianza es el cociente que resulta de dividir la suma de cuadrados entre el número de grados
de libertad. Dentro del ANAVA, y para obtener el valor F (que denota la significación entre tratamientos)
se divide el cuadrado medio del tratamiento entre el cuadrado medio del error.
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
47/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
47
Al comparar el valor de F calculado con el F tabulado, se podrá establecer si existe significancia. Habrá
significancia en caso de que el valor F calculado sea mayor que el valor F tabulado. Este último se
encuentra en la tabla de F, con el nivel de significancia apropiado, los grados de libertad del error en la
vertical. Si se rechaza la hipótesis nula de que no existen diferencias en los tratamientos, el siguiente paso
es efectuar la prueba de significancia entre medias de tratamiento, para conocer cuáles de ellos son
mejores.
DISEÑO COMPLETAMENTE AL AZAR
El diseño completamente al azar es el diseño más simple y se usa cuando las unidades experimentales son
homogéneas, y la variación entre ellas es muy pequeña. Tal es el caso de experimentos de laboratorios,
invernadero, gallineros, porcinas, etc. En experimentos en que las condiciones ambientales son
controladas, tal diseño es una prueba con un solo criterio de clasificación.
Las ventajas de este diseño son:
a.- Es fácil de planear.
b.- Es flexible en cuanto al número de tratamientos y repeticiones, el límite está dado por el número de
unidades experimentales en general.
c.- No es necesario que el número de tratamientos sea igual al número de repeticiones.
d.- No se estima parcelas perdidas.
e.- El número de grados de libertad para el error aumenta al no tener muchas restricciones.
Las desventajas del diseño son:
a.- No es eficiente con material experimental heterogéneo.
b.- Puesto que no existen restricciones en cuanto a la aleatoriedad, el error experimental incluye la
variación total entre unidades experimentales
A N A V A
FUENTE DE
VARIACION
SUMA DE
CUADRADOS
SC
GRADOS DE
LIBERTAD
GL
CUADRADO
MEDIO
CM
PRUEBA
ESTADISTICA
F
Tratamiento – TC t – 1 ⁄ ⁄ Error SC tot. – SCtra. t(r – 1) ⁄ Total
– TC tr – 1
Termino de corrección (TC) =
DISEÑO COMPLETAMENTE AL AZAR CON IGUAL NÚMERO DE UNIDADES POR
TRATAMIENTO
En un ensayo con macetas se aplicaron cinco tratamientos a clones de pasto estrella. Se tomaron cuatro
macetas por tratamiento. Los rendimientos se presentan a continuación. Probar las hipótesis
correspondientes.
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
48/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
48
T R A T A M I E N T O SMacetas 1 2 3 4 5
1 101 51 83 67 292 93 61 68 40 453 93 59 72 46 514 96 58 75 52 42
Total 383 229 298 205 167 128
Media 93,7
57,2
74,5
51,2
41,7
No existe diferencia entre tratamientosSi existe diferencia entre tratamientosTC 82176SC total – TC = 8168SC tratamientos =
7286SC error = SC total – SC tratamientos
= 82176 – 7286 = 882
A N A V A
Fuentes de Variación SC GL CM F SIG
Tratamiento 7286 4 1821,5 30,98 **Error 882 15 58,15Total 8168 19
F 0.05 = 3,06
0,01= 4,89
C.V. =√ √ 100= 46,33%
El coeficiente de variabilidad o coeficiente de variación indica la confiablidad en los datos, a medida quesu valor disminuye la confiabilidad es mayor.
Prueba de significación de t
- Las pruebas de hipótesis serán:1 vs 2 1 vs 3 1 vs 4 1vs 5
Ho Ho Ho Ho Ha Ha Ha Ha 2 vs 3 2 vs 4 2 vs 5
Ho Ho Ho Ha Ha Ha 3 vs 4 3 vs 5
Ho Ho Ha Ha 4 vs 5
Ho Ha
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
49/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
49
- El error estándar será S = = = 5, 39Se busca en las tablas de t
t
0,05= 2,131
t 0,01= 2,947Comparaciones
t = se repite para cada par de comparaciones
t = = = 6, 77**
t =
=
= 3, 57**
t = = = 7, 88**t =
= = 9, 64**t =
= = – 17, 25 *t =
= = 1, 11 N.S.t = = = 2, 87*t =
= = 4, 31**t =
= = 6, 07**t =
= = 1, 76 N.S.Prueba de D. L. S.
D.L.S. = t . S = 2,131 x 5,39= 11.481 vs 2 = 93,75 – 57,25 = 36,5*
1 vs 3 = 93,75 – 74,50 = 19,25*
1 vs 4 = 93,75 – 51,25 = 42,5*
1 vs 5 = 93,75 – 41,75 = 52,00*
2 vs 3 = 57,25 – 74,50 = – 17,25*
2 vs 4 = 57,25 – 51,25 = 6,00 N.S.
2 vs 5 = 57,25 – 41,75 = 15,50*
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
50/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
50
3 vs 4 = 74,50 – 51,25 = 23,25*
3 vs 5 = 74,50 – 41,75 = 32,75*
4 vs 5 = 51,25 – 41,75 = 9,5 N.S.
Prueba de significación de Duncan
Esta prueba tiene en cuenta el orden de los promedios de cada uno de los tratamientos.
S = = =3,81Con los grados de libertad del error buscamos en la tabla de Duncan
(A.E.S) 3,01 3,16 3,25 3,31Encontramos la A.L.S.
A.L.S. =A.E.S. x S 2 3 4 5
A.E.S. 3.01 3.16 3.25 3.31
S 3.81 3.81 3.81 3.81A.L.S. 11.46 12.03 12.38 12.61
Ordenamos en orden creciente los promedios
Tratamiento 5 4 3 2 1
Promedio 41,75 51,25 57,25 74,50 93,73
Comparamos los promedios desde el mayor hasta el menor
1 – 5 = 93,73 – 41,75 = 51,98 > 12,61 *
1 – 4 = 93,73 – 51,25 = 42,48 > 12,38 *
1 – 2 = 93,73 – 57,25 = 36,48 > 12,03 *
1 – 3 = 93,73 – 74,50 = 19,23 > 11,46 *
3 – 5 = 74,50 – 41,74 = 32,76 > 12,38 *3 – 4 = 74,50 – 51,25 = 23,25 > 12,03 *
3 – 2 = 74,50 – 57,25 = 17,00 > 11,46 *
2 – 5 = 57,25 – 41,75 = 15,50 > 12,03 *
2 – 4 = 57,25 – 51,25 = 6,00 < 11,46 N.S.
4 – 5 = 51,25 – 41,75 = 9,50 < 11,46 N.S.
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
51/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
51
Otro método
Tratamiento Promedio
1 93,703 74,502 57,25
4 51,25
5 41,75
Los tratamientos bajo la misma recta son estadísticamente iguales.
Prueba de significación de Tukey
S = = =3,81Buscamos en la tabla de Tukey con los grados de libertad del error y el número de tratamientos.
A.E.S. (T) = A.E.S. (15 y 5) = 4,37
A.L.S. = S A.E.S. (T)A.L.S. = 3,81 X 4,37 =16,64
Realizamos las comparaciones múltiples
Tratamiento Promedio
2 93,704 74,502 57,25
4 51,25
5 41,75
Los promedios bajo la misma recta son estadísticamente iguales
DISEÑO COMPLETAMENTE AL AZAR CON DIFERENTE NÚMERO DE UNIDADES POR
TRATAMIENTO
A veces se presenta el caso de que por insuficiencia de material para todos los tratamientos, o porque se
han perdido unidades experimentales, no se dispone de igual número de observaciones por tratamiento.Esta es una de las ventajas del diseño completamente al azar, ya que los datos se pueden analizar
directamente sin necesidad de estimar parcelas perdidas.
Por ejemplo se analizó un experimento de cuatro raciones para cerdos con nueve cerdos por ración.
Durante el experimento se presentó una enfermedad y murieron 16 cerdos.
La hipótesis a probar es: No existe diferencia entre los tratamientosHa Si existe diferencia entre los tratamientos
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
52/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
52
R A C I O N E SRepeticiones 1 2 3 4
1 45 35 34 412 46 33 34 413 49 35 444 44 34 435 33 41
6 427 448 419 41
Total 184 68 170 378 800 Gran Total 46 54 34 42TC =
= SC trat. =
SCtotal= – 32 000=464SC error = SC total – SC tratamientos =464 – 432 = 32A N A V A
Fuentes de Variación SC GL CM, F SIG
Tratamiento 432 3 72 36 **
Error 32 16 2
Total 464 19
F 0.05 3,24
0,01 5,29
C.V. = √ √ x 100= 3,52%Como F es altamente significativo, nos permite rechazar la hipótesis nula de que no hay diferencias entre
los tratamientos
El coeficiente de variabilidad o coeficiente de variación indica la confiablidad en los datos, a medida que
su valor disminuye la confiabilidad es mayor.
DISEÑO DE BLOQUES COMPLETOS AL AZAR
El objetivo del diseño bloques completos al azar es reunir las unidades experimentales a las cuales se
aplicaran los tratamientos, en bloques de cierto tamaño, de tal modo de que los tratamientos se efectúen
dentro de cada bloque. La variabilidad entre unidades experimentales de bloques diferentes será mayor
que entre unidades dentro del mismo bloque, como consecuencia, las diferencias encontradas entre
unidades, se deben principalmente a discrepancias entre tratamientos. La disparidad que no se deba a
tratamientos, se elimina por el diseño y forma parte del error experimenta. De acuerdo con esto, es fácil
observar que la variabilidad entre bloques no afecta las diferencias entre medias de tratamientos, porqueen cada bloque aparece una vez por tratamiento, y así los bloques y tratamientos son ortogonales.
-
8/15/2019 DISE+æOS EXPERIMENTALES UCV
53/63
DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV
53
Durante el experimento todas las parcelas dentro del bloque se deben tratar igual, excepto cuando se
aplique un tratamiento cuyo efecto se quiere medir. Por ejemplo, si los tratamientos son niveles de
fertilización, todos los demás factores como preparación del suelo, época, densidad de siembra, labores de
cultivo, uso de plaguicidas, riegos y variedades deben ser exactamente iguales para todas las parcelas, si
no es así, se introducirían otras fuentes de variación cuyo efecto no se podría medir, y ocultarían el efecto
de los tratamientos en estudio.
El diseño bloque completo al azar se caracteriza por su equilibrio, fácil planeación y procedimiento de
cálculo simple. Su única desventaja es que cuando el número de tratamientos es alto, aumenta la
superficie del terreno dentro de cada bloque y también el error experimental.
R E P E T I C I O N E S
J=1,2,3,…………r
Suma Media
Tratamiento
i=1,2,3…t
1 2 r
1 2 t
Suma Media
A N A V A
TC = El siguiente ejemplo presenta los resultados de seis variedades de frijol (rendimiento expre