DISE+æOS EXPERIMENTALES UCV

8/15/2019 DISE+æOS EXPERIMENTALES UCV

1/63

DISEÑOS EXPERIMENTALES Ciclo 2013 I UCV

1

PRUEBA DE HIPOTESIS

Hipótesis

Es el enunciado acerca de una población, elaborado con el propósito de ponerlo aprueba

Prueba de hipótesis

Procedimiento basado en la evidencia muestral y en la teoría de probabilidad que se emplea para

determinar si la hipótesis es un enunciado razonable.

Procedimiento para probar una hipótesis:

1.- Plantear la hipótesis nula y la hipótesis alternativa ó .

Hipótesis nula .- Hipótesis planteada con el objetivo de ser probada. Podemos aceptarla o rechazarla.

Tal hipótesis es una afirmación que se aceptará si los datos muestrales no pueden proporcionar evidencia

convincente que es falsa.

Hipótesis alternativa .- Denominada también hipótesis de investigación. Afirmación que se

aceptará si los datos muestrales proporcionaron amplia evidencia de que es falsa

2.- Seleccionar el nivel de significancia.- Nivel de significancia es la probabilidad de rechazar la

hipótesis nula cuando es verdadera. Al nivel de significación se le denomina , también se le conoce con

el nombre de nivel de riesgo.

Generalmente se usa el nivel del 5% para proyectos de investigación, 1% para el aseguramiento de

calidades y 10% para encuestas políticas.

En el proceso de probar una hipótesis podemos cometer dos tipos de errores: error del tipo I o del tipo II.

Error tipo I es rechazar la hipótesis nula ( cuando en realidad es verdadera.

Error tipo II es aceptar la hipótesis nula ( cuando en realidad es falsa

Hipótesis nula Se acepta Se rechaza

Ho es verdadera Decisión Correcta ErrorHo es falsa Error Decisión Correcta

3.-Calcular el valor estadístico de prueba.- Existen muchos valores estadísticos de prueba: z, t, chi

cuadrado, F, etc.

Es el valor obtenido a partir de la información muestral que se utiliza para determinar si se rechaza la

hipótesis nula.


2/63


2

4.- Formular la regla de decisión.- Es un enunciado de las condiciones según las que se acepta o se

rechaza la hipótesis nula.

Valor crítico es el valor que es el punto divisorio entre la región de aceptación y la región de rechazo de la

hipótesis nula

5.-Toma de decisión.- Es aceptar o rechazar la hipótesis nula.

Potencia de una prueba.- Es la probabilidad de tomar la decisión acertada de rechazar cuando esta

es falsa o de aceptar cuando esta es verdadera. La potencia de una prueba se calcula mediante 1 .

Prueba para la media de la población: Muestra grande

Prueba de hipótesis con muestras grandes (n 30) respecto a una media de población para una

prueba de dos colas (bilateral) de la forma:

Ho µ =

Ha µ

Estadístico de prueba: conocida

Z=

Estadístico de prueba: desconocida:

Z=

Regla de rechazo a un nivel de significancia :

Rechazar si Z - Z ó Z Z

Ejemplo

La tasa anual de resurtido de botellas de aspirinas es 6.0 (esto indica que las existencias del medicamentotienen que renovarse en promedio 6 veces al año en un establecimiento). La desviación estándar es 0,50.


3/63


3

Se sospecha que el volumen de ventas promedio ha cambiado y no es 0,60. Se utilizará el nivel de

significancia de 0.05 para probar esta hipótesis.

a.- Plantee la hipótesis nula y alternativa

b.- ¿Cuál es la probabilidad de un error tipo I?

c.- Proporcione la fórmula para el valor estadístico de la prueba.

d.- Enuncie la regla de decisión

e.- Se selecciona una muestra aleatoria de 64 frascos de tal producto, con una media de 5.84, ¿Deberechazarse la hipótesis de que la media poblacional es 0.60? Interprete los resultados.

Solución:

a. Ho µ = 6Ha µ

b.-

c.- El valor estadístico de la prueba es: Z=

d.- El valor crítico de 1.96

Si el valor del estadístico de prueba resulta mayor a 1.96 o menor a -1.96 se rechaza la

hipótesis nula

Z= ═ ═ - 2.56

Como el valor de la prueba está en la región de rechazo, se rechaza y, por lo tanto, se acepta (la

tasa media no es igual a 6).

Ejemplo

El supermercado local gastó en una remodelación miles de nuevos soles durante muchas semanas.

Aunque la interrupción espantó a los clientes temporalmente, el gerente espera que los clientes vuelvan a

disfrutar de las nuevas comodidades. Antes de remodelar, los recibos de la tienda promediaban $ 32 533

por semana. Ahora que se ha terminado la remodelación, el gerente toma una muestra de 36 semanas para

ver si la construcción afectó de alguna manera el negocio. Se reportó una media de $34 166 y una

desviación estándar de $12 955 ¿Qué puede decir el gerente a un nivel de significancia del 1%?

Solución

Ho µ = 32 533

Ha µ


4/63


4

Rechazar Ho si:

Z - 2.576 ó Z 2.576

El estadístico de la prueba:

Z

0.756

El valor de prueba está dentro de la zona de aceptación, entonces se acepta Ho Es decir la media es 32

533

Prueba de hipótesis con muestras grandes (n 30) respecto a una media poblacional para pruebas

de una cola (unilateral) de la forma

H0

Ha: µ µo


Z=


Z=

Regla de rechazo a un nivel de significación

Rechazar si Z Z α

Prueba de hipótesis con muestras grandes (n 30) respecto a una media poblacional para pruebas

de una cola (unilateral) de la forma

H0: µo

Ha: µ µo


Z=


Z=


5/63


5


Rechazar si Z - Zα

Ejemplo.- Una encuesta nacional reciente, encontró que estudiantes de la Universidad miraban un

promedio de 6.8 DVD por mes. Una muestra aleatoria de 36 estudiantes universitarios de la facultad de

Agronomía, reveló que el número medio de DVD observado el mes pasado fue de 6.2, con una

desviación estándar de 0.5. En el nivel de significancia de 0.05. ¿Puede concluirse que los estudiantes de

la facultad de Agronomía ven menos DVD al mes que los de la Universidad?

H0: 6.8

Ha: µ 6.8

Regla de la decisión

Rechazar si Z - 1.645

Valor de la prueba

Z= ═ ═ - 7.2

Como el valor de la prueba está en la zona de rechazo se concluye rechazando la hipótesis nula, esto es,que los estudiantes de la facultad de Agronomía ven menos DVD, en promedio, que los estudiantes de la

Universidad

Pruebas respecto a la proporción poblacional.

La prueba de hipótesis sobre proporciones se usa cuando queremos determinar si la proporción de los

elementos en una población, que tiene cierta característica, es mayor, igual o menor que algún valor

especifico.

Relación proporcional:

Es la relación por cociente, o porción relativa, que tiene un atributo particular de interés.


6/63


6

Antes de probar una relación proporcional debemos considerar algunos supuestos y cumplirse algunas

condiciones:

- Los datos muestrales recopilados son el resultado de conteo- El resultado de un experimento se clasifica como éxito o fracaso- La probabilidad de éxito se mantiene igual en cada ensayo- Los ensayos son independientes- La prueba es adecuada cuando n y n( 1- ) valen al menos 5

El valor estadístico de prueba Z viene dado por:

Z ═

Donde:

═ Relación proporcional poblacional

Relación proporcional muestral

n ═ Tamaño de muestra

Prueba para la proporción poblacional

Prueba de hipótesis respecto a una proporción poblacional para pruebas de una cola (unilateral) de

la forma:

El estadístico de la prueba

Z ═


Ejemplo

Una investigación en la Universidad de Toledo indica que el 50% de los estudiantes cambian su área

principal de especialización después del primer año en el programa de estudios. Una muestra de 100

alumnos en la escuela de Administración reveló que 48 de ellos cambió de dicha área después del lapso

mencionado. ¿Ha habido un decremento significativo en la proporción de estudiantes que cambian su área

de especialización después del primer año en el programa? Realice la prueba al nivel de significancia de

0.05.

n: 100


7/63


7

: ═ 0.48

0.05

Regla de decisión

Rechazar si Z - 1.645

El estadístico de la prueba

Z ═ ═ ═ - 0.4

Como Z ═ - 0.4, entonces se acepta , es decir, la proporción de estudiantes que cambian de carrera

después del primer año no ha tenido un decremento significativo.

Prueba de hipótesis respecto a una proporción poblacional para prueba de una cola (unilateral) de

la forma:

Estadístico de prueba

Z ═

Rechazar si Z Zα Ejemplo Un artículo en la publicación Piura 21 reportó que solo hay un empleo disponible para uno de

cada tres egresados de la Universidad. Las principales razones aportadas fueron que existe una

sobrepoblación de estos últimos y una economía débil. Suponga que una encuesta de 200 egresados

recientes de la Universidad de Jaén reveló que 80 tenían empleo. Al nivel de significancia de 0.02, ¿Se

puede concluir que tienen trabajo una proporción mayor de egresados de la Universidad de Jaén?


8/63


8

n

Regla de la decisión.

Rechazar si Z 2.054

Valor de la prueba:

Z ═ ═ ═ 2

Se acepta por lo tanto, la proporción de egresados que tienen trabajo es menor o igual a

Prueba de hipótesis respecto a una población poblacional para pruebas de dos colas (bilateral) de la

forma:


Z ═

Regla de rechazo a un nivel de significancia α


9/63


9

Rechazar s ó

Ejemplo

Se establece la siguiente hipótesis:

: p = 0.4

: p

Una muestra de 120 observaciones reveló al nivel de significación de 0.05 ¿Puede rechazarse

la hipótesis nula?

a,. Establezca la regla de decisión.

b.- Calcule el valor estadístico de la prueba.

c.- ¿Cuál es su decisión respecto a la hipótesis nula?

Solución

a.- Regla de decisión

Rechazar si Z -1,96 ó Z 1.96

b.- Valor de prueba

Z = -2.24

c.- Se rechaza , pues el estadístico de prueba cae en la zona de rechazo.

Prueba de hipótesis con muestras grandes (n respecto a dos medias poblacionales

Prueba de hipótesis con muestras grandes (n 30) respecto a dos medias poblacionales para una

prueba de dos colas (bilateral) de la forma

:

:


Conocida desconocida

Z Z

Donde


10/63


10

Tamaño de muestra Media muestral Variancia poblacional

Población 1

Población 2

Regla de rechazo a nivel de significancia Z ó Z Ejemplo

Una importante compañía de transporte público de Chiclayo debe decidir entre dos marcas de llantas para

su parque automotor, con un nivel de confianza del 95%. Para tomar una decisión seleccionó una muestra

aleatoria de 100 llantas de cada marca y encontró que la marca 1 tiene una vida útil de 98 000 Km, en

promedio, con una desviación estándar de 8 000 Km.

Por otro lado, las estadísticas calculadas para la marca 2 son, en promedio, de 101 000 Km y desviación

estándar de 12 000 Km

Que marca de llantas debería adquirir la compañía de transporte si la diferencia de precios es mínima?

Solución

= 98 000 = 101 000

Regla de decisión

Rechazar Z ó Z Valor de la prueba


11/63


11

Z = = - 2.08

Como -2.08 está en la zona de rechazo, se rechaza

a un nivel de significancia del 5%. Esto es, existe

diferencia significativa entre la vida útil promedio de ambas marcas. Sin embargo, no hemos contestado a

nuestra pregunta inicial de qué marca de llantas se debe adquirir. Realizamos una nueva prueba de

hipótesis suponiendo que la vida útil media de la marca 2 es mayor que la de la marca 1. Para lo cual

establecemos la prueba de hipótesis para una cola

Prueba de hipótesis con muestras grandes (n respecto a dos medias poblacionales para unaprueba de 1 cola de la forma:

:

:

0

: : 0Estadístico de prueba


Z Z

Regla de rechazo a un nivel de significancia

Rechazar si Z -

Prueba de hipótesis con muestras grandes (n respecto a dos medias poblacionales para unaprueba de 1 cola de la forma:

: : 0 : : 0Estadístico de prueba



12/63


12

Z Z


Rechazar si Z Del ejercicio anterior, para decidir qué marca comprar, realizamos una nueva prueba de hipótesissuponiendo que la vida útil promedio de la llanta de marca 2 es mayor que la vida útil promedio de la

marca 1, esto es :

Usando los mismos datos anteriores tenemos

Con los datos mostrados se calcula Z

Z = = - 2.08

Como – 2.08 está en la zona de rechazo tenemos que la marca 2 tiene mayor vida útil promedio que la

marca 1.Por lo tanto, la compañía de transporte debe abastecerse de la marca 2

Prueba de hipótesis con muestras grandes (n para la diferencia entre dos proporciones:La prueba de hipótesis para la diferencia entre dos proporciones se realiza cuando queremos determinar si

las proporciones de dos poblaciones son o no iguales. La lógica del procedimiento es idéntica para la

diferencia de las medias poblacionales.


13/63


13

Tomamos una muestra aleatoria de cada población y calculamos las proporciones muestrales; si la

diferencia entre estas proporciones se puede atribuir al azar, aceptamos la hipótesis de que las dos

poblaciones tienen igual proporciones.

Valor estadístico de prueba.

Z= Tamaño de muestra Proporción Proporción

muestral ponderada

Población 1 Población 2

= = Alternativamente

Ejemplo

El departamento de investigación en la casa Matriz de una compañía aseguradora, realiza una

investigación acera de las causas de accidentes automovilísticos, las características de los conductores,

etc. Se seleccionó una muestra aleatoria de 400 pólizas de seguros expedidas a personas solteras. Se

descubrió que en el periodo anterior de tres años, 120 sufrieron al menos un accidente automovilístico. Enforma semejante, una muestra de 600 pólizas expedidas a personas casadas reveló que 150 habían tenido

al menos un accidente. Al nivel de significancia de 0.05, ¿Hay diferencia significativa en las personas

solteras y casadas que sufrieron un accidente durante un lapso de tres años?

Solución

400 600 = 0.30 = 0.25

Regla de decisión

Rechazar Z ó Z


14/63


14

Valor de la prueba

Z=

= = = 0.27Z=

= 1.74Como 1.74 está en la región de aceptación se acepta , no hay diferencia significativaentre las proporciones de personas solteras y casadas que sufrieron un accidente durante un lapso de tres

años.

Prueba de hipótesis para muestras pequeñas

En los casos en los que se desconoce y el número de observaciones en la muestra es menor a 30, se puede utilizar la desviación estándar muestral, s, como una estimación de , pero no puede utilizar ladistribución de Z como valor estadístico de prueba. La t de Student o distribución t , sirve como valor

estadístico de prueba.

Prueba para la media poblacional

Se utiliza el mismo procedimiento que en el caso de la muestra grande pero el valor estadístico de prueba

es el siguiente:

=

√

Ejemplo

Por registros pasados se sabe que la vida útil promedio de una pila eléctrica que se utiliza en un reloj

digital es de 305 días. La vida útil de las pilas se distribuye normalmente. Tal elemento eléctrico fue

modificado recientemente para que tenga mayor duración. Se probó una muestra de 20 pilas modificadas

y se encontró que la vida media era de 311 días con una desviación estándar de la muestra de 12 días. Al

nivel de significancia de 0.05. ¿La modificación incrementó la duración promedio de la pila?

a.- Plantear la hipótesis nula y alternativa.

b.- Ilustrar gráficamente la regla de decisión.

c.- Calcular t y llegar a una decisión. Resuma la manera breve el resultado.

Solución:

Grados de libertad (g.l.): 20 – 1 = 19 Regla de decisión:


15/63


15

Rechazar si t Valor de prueba:

t = √ √ = 2.24

Por lo tanto se rechaza porque 2.24 está en la zona de rechazo. Prueba de dos medias poblacionales: Muestras aleatorias independientes

Valor de prueba

t t con – grados de libertad:

Donde:

Tamaño de muestra Media muestral Varianza ponderada

Población 1 Población 2 Grados de libertad: – 2Observación

Las varianzas son desconocidas, pero iguales:

Donde es un estimador insesgado de Ejemplo:

Una muestra de calificaciones en un examen presentado en un curso de Estadística (en escala 100) es:

Hombres: 72, 69, 98, 66, 85, 76,79 80,77

Mujeres: 87, 90, 78, 81, 80, 76

Al nivel de significancia de 0.01, ¿La calificación de las mujeres es más alta que la calificación de los

hombres?


16/63


16

Solución: : : H M 78 82

s 9.49 5.40

n 9 6

Regla de decisión:

Rechazar si t Valor de la prueba

t = 66.6153

t = 0.10Se acepta porque 0.42 está en la zona de aceptación. Por lo tanto, no se puede afirmar que la

calificación de las mujeres es más alta que la calificación de los hombres.

Prueba para la diferencia entre dos medias poblacionales: una prueba de diferencia pareada

Hay dos casos:

a.- Caso I:

< 30Variancias poblacionales desconocidas pero iguales

1.-Hipótesis nula: Ho: (µ1 – µ2) = µd = 0

2.- Hipótesis nula:

Prueba de una cola Prueba de dos colas

Ha: µd> 0 Ha: µd 0ó

Ha: µd < 0


17/63


17

3.- Estadístico de prueba

t = √ ⁄ = √ ⁄

=

1 –

2

4.- Región de rechazo: Rechazar Ho cuando

Prueba de una cola Prueba de dos colas

t > t t> ⁄ ó t – t Ejemplo.- Antes de contratar la instalación de un sistema que trasmita música a las oficinas de unaempresa, el gerente selecciona al azar 7 oficinas para instalarles el nuevo sistema. El tiempo promedio en

minutos que pasaban los empleados fuera de esas oficinas, fue registrado antes y después de instalarse el

sistema de música, obteniéndose los siguientes resultados

Numero de oficina 1 2 3 4 5 6 7

No música 8 9 5 6 5 10 7Con música 5 6 7 5 6 7 8

¿Sugeriría Ud. que el ejecutivo proceda con la instalación? = 0.05Solución

Ho: µd = 0

Ha: µd > 0

No música Con música d8 5 39 6 35 7 – 26 5 15 6 – 110 7 37 8 – 1

=7,14 =6,28 =0,85 =2,6457t = √ ⁄ = √ ⁄ = √ ⁄ =1,025

En las tablas t (7-1) 0,05 1,943


18/63


18

Conclusión: No hay una evidencia estadística para afirmar que con la instalación de la música en lasoficinas, los empleados pasaran más tiempo en estas.

b.. Caso II:

Variancias poblacionales desconocidas pero diferentes Las hipótesis son las mismas, pero la prueba estadística será:

Los grados de libertad se calculan de la siguiente manera:

g.l.

Los demás pasos son los mismos

Prueba de hipótesis para la Varianza

Hay casos que se tiene el problema de desconocer la varianza, o desviación estándar de la población, en

donde las distribuciones son normales. Si se desea probar una hipótesis acerca de la varianza se puede

hacer utilizando la distribución de Ji cuadrada (Chi cuadrada). Así mismo, supóngase que se tiene interés

en dos poblaciones normales independientes, donde las medias y las varianzas de la población son

desconocidas. Se desea probar la igualdad de las dos varianzas, ya que para poder comparar las medias de

estas dos poblaciones se ha utilizado la distribución de t de Student, en la cual podemos tener varianzas

iguales o diferentes en la población.

Par conocer esto último se requiere de la distribución F de Fisher, y después de utilizarla se tomará ladecisión de tener o no varianzas iguales en la población, dando pie a realizar la comparación de las dos

medias según sea el caso. En un primer caso en el que las varianzas de la población son desconocidas,

pero iguales, o en un segundo caso, donde se tiene varianzas desconocidas, pero diferentes

Prueba de hipótesis para la varianza de un distribución normal

A continuación se desarrollará el procedimiento para contrastar hipótesis sobre la varianza

poblacional , a partir de una muestra aleatoria de n observaciones de una población normal.Prueba bilateral de la varianza de una población

Estadístico de prueba: =

Regla de decisión a un nivel de significancia


19/63


19

Rechazar si: ó

Ejemplo

Una manera de evaluar la eficacia de un profesor ayudante es analizar las calificaciones obtenidas por sus

estudiantes en un examen al final del curso. Evidentemente, es interesante la puntuación media, sin

embargo, la varianza también contiene información útil; algunos profesores tienen un estilo que funciona

muy bien con los estudiantes más sobresalientes, pero es ineficiente con los estudiantes con menos

capacidad o menos motivados. Un profesor realiza un examen al final de cada semestre para todas las

secciones del curso, la varianza de las calificaciones de este examen suelen estar muy próximos a 300 :

Un nuevo ayudante tiene una clase de 30 estudiantes, cuyas calificaciones en el examen tuvieron una

varianza de 480; considerando estas calificaciones como una muestra aleatoria de una población normal,

contrastar la hipótesis nula de que la varianza poblacional de sus calificaciones es 300 frente a una

alternativa bilateral con 0.05

Regla de decisión

Rechazar si: ó Valor de prueba

= = 46.40Entonces dado que 45.72, se rechaza , lo cual significa que la varianza es diferente de 300


20/63


20

Prueba unilateral derecha de la varianza de una población


=

Regla de decisión a un nivel de significancia Rechazar si:

Ejemplo

Un producto, se debe maquinar determinada parte con tolerancias muy estrechas, para que los clientes la

puedan aceptar. Las especificaciones del producto piden que la varianza máxima de las longitudes de las

partes sea 0.0004. Suponga que en 30 partes, la varianza de la muestra resultó ser 0.0005. Pruebecon un

0.05 si se ha violado la especificación de varianza de la población


= = = 36.25

Regla de decisión a un nivel de significancia Rechazar si:

Regla de decisión

Rechazar si: Entonces dado que

, se acepta la Ho, lo cual significa que las especificaciones del producto

no han sido violadas.


21/63


21

Prueba unilateral izquierda de la varianza de una población


=

Regla de decisión a un nivel de significancia Rechazar si: Inferencia acerca de la varianza de dos poblaciones normales

Distribución de F

Denominada así por sir Ronald Fisher, uno de los fundadores de la ciencia estadística moderna. Esta

distribución se utiliza como la entidad estadística de prueba en varios casos, sirve para probar si dos

muestras proceden de poblaciones con varianzas iguales. Asimismo, también sirve cuando se desea

comparar simultáneamente varias medias poblacionales, esta comparación simultanea de varias de tales

medias se denomina análisis de varianza (ANAVA) ó (ANOVA), en estos dos casos las poblacionesdeben ser normales.

Prueba de hipótesis bilateral respecto a la varianza de dos poblaciones

Estadístico de prueba F Regla de decisión a un nivel de significación Rechaza sí:F ó F


22/63


22

Prueba unilateral derecha acerca de la varianza de dos poblaciones normales.


F Regla de decisión a un nivel de significación Rechaza sí:

F

Observación.- La varianza muestral más grande se coloca en el numerador, en consecuencia, la razón F

siempre es mayor a 1. Por lo tanto, el valor crítico de la cola de valores superiores es el único que se

necesita

( ) ( ) Ejemplo:

La compañía Piura Com realizó un estudio acerca de los hábitos de escuchar radio por parte de los

hombres y las mujeres. Un aspecto del estudio comprendió el tiempo promedio de audición. Se descubrió

que tal tiempo para los varones es de 35 minutos al día. La desviación estándar de la muestra de 11

personas de sexo masculino que se estudiaron fue de 10 minutos diarios. El tiempo promedio de audición

para las 13 mujeres en el estudio fue también de 35 minutos, pero la desviación estándar de la muestra,

resultó 12 minutos. Al nivel de significancia de 0.10, ¿es posible concluir que existe diferencia en la

variación del número de minutos que los hombres y las mujeres escuchan la radio?


23/63


23

Recuerde que

0.36

Rechaza sí:F ó F Estadístico de prueba

F 1.44Por lo tanto, al ser F 1.44 se acepta , lo cual significa que la variación del número de minutos queescuchan radio los hombres es igual al de las mujeres.

Ejemplo

En su incansable búsqueda de un sistema de llenado adecuado, cierta empresa prueba dos máquinas.

Robot Fill se usa para llenar 16 tarros y resulta una desviación estándar de 1.9 onzas en el llenado. Con

Automatic Fill se llenan 21 frascos que dan desviación estándar de 2.1 onzas. Si la empresa tiene que

elegir uno de estos sistemas en función de la uniformidad de llenado, ¿Cuál deberá seleccionar? Useun 0.05Solución

Robot Fill Automatic Fill


24/63


24

De acuerdo a la tabla de F:

Regla de decisión a un nivel de significación Rechaza sí: F Estadístico de prueba

F Dado que el valor de F es 1.22 se acepta Ho. Por lo tanto, se elige el proceso Automatic Fill porque es el

que presenta mejor uniformidad de llenado.

Prueba de bondad de ajunte e independencia

Prueba de Una medida de la diferencia existente entre las frecuencias observadas y esperadas es suministrada por el

estadístico, dado por: ∑

Donde

Frecuencia observada Frecuencia esperada.Ejemplo

La siguiente tabla muestra las frecuencias observadas al lanzar un dado 120 veces. Ensayar la hipótesis de

que el dado está bien hecho al nivel de dignificación de 0.05

Cara 1 2 3 4 5 6

Frecuencia observada 25 17 15 23 24 16

Solución

Hipótesis: : Las frecuencias observadas y esperadas son significativamente iguales (dado bienhecho). : La frecuencias observadas y esperadas son diferentes (dado cargado)

Primero se procede a encontrar los valores esperados. La probabilidad de obtener cualquier numero en un

dado no cargado es de Cara 1 2 3 4 5 6 Total

Frecuencia observada 25 17 15 23 24 16 120

Frecuencia esperada 20 20 20 20 20 20

Buscamos el valor en la tabla para K – 1 = 6 – 1 = 5 grados de libertad


25/63


25

Regla de decisión

Rechazar

11.07

Valor de la prueba

∑ + = 5Como 5 es menor que 11.07 se acepta la

y se concluye con una significación de 0.05, que el dado está

bien hecho

Tabla de contingencia

En muchas ocasiones, los n elementos de una muestra tomada de una población puede clasificarse con

dos criterios diferentes. Por tanto, es interesante saber si los dos métodos de clasificación son

estadísticamente independientes.

El interés recae en probar la hipótesis de que los dos métodos de clasificación renglón – columna son

independientes. Si se rechaza esta hipótesis, entonces, se concluye que existe alguna interacción entre los

dos criterios de clasificación.

Ejemplo

Una asociación de profesores universitarios quiere determinar si la clasificación en el trabajo es

independiente de la categoría académica. Para ello se realizó un estudio nacional entre los académicos

universitarios y encontró los resultados que se muestran a continuación, Con α al 0.05 haga una prueba

para saber si son dependientes la satisfacción en el trabajo y la categoría académica

CategoríaProfesorAsistente

Profesorauxiliar

Profesorasociado

Profesorprincipal

Satisfacción Mucha 40 60 52 63En el Regular 78 87 82 88trabajo Poca 57 63 66 64

.

Solución

Planteamiento de las hipótesis

La satisfacción en el trabajo y la categoría académica son independientes La satisfacción en el trabajo y la categoría académica no son independientesGrados de libertad: (r – 1)(c – 1) = (3 -1)(4 -1) = 6


26/63


26

Regla de decisión

Rechazar 12.59Se procede a calcular los valores esperados de cada celda: Donde: i= fila j = columna

Se toma en cuenta los totales del renglón y la columna

categoríaProfesorasistente

Profesorauxiliar

Profesorasociado

Profesorprincipal

Total

Satisfacción Mucha 40 60 52 63 215En el Regular 78 87 82 88 335trabajo Poca 57 63 66 64 250

Total 175 210 200 215 800

Valor de la prueba:

∑

= = 47.03 = = 56.44 = = 53.75 = = 57.78

= = 73.28 = = 87.94 = = 83.75

= = 90.03

= = 54.69 = = 65.62 = = 62.50 = = 62.50

categoríaProfesorasistente

Profesorauxiliar

Profesorasociado

Profesorprincipal

Total

Satisfacción Mucha 47.03 56.44 53.75 57.78 215En el Regular 73.28 87.94 83.75 90.03 335trabajo Poca 54.69 65.62 62.50 67.19 250

Total 175 210 200 215 800


27/63


27

+ = 2.75Como 2.75 es menor que el valor critico 12.59, por lo tanto, no se rechaza

y se concluye con un α =

0.05, que la satisfacción en el trabajo y la categoría académica son independiente.

Análisis de regresión y correlación

Análisis de correlación

Conjunto técnicas estadísticas empleadas para medir la intensidad de la asociación de dos variables.

Diagrama de dispersión

Gráfica que presenta la relación entre dos variables.

Variable dependiente

Es aquella cuyos datos dependen de otras variables.

Variable independiente

Son los valores que no tienen relación de dependencia con otras variables.

Por convención, la variable conocida o independiente se grafica en el eje de abscisas (x), y la variable

independiente o estimada en eje de las ordenadas (y)

Ejemplo

La empresa Rázuri Hnos. un negocio familiar que ha vendido al menudeo en Piura durante muchos años,

se anuncia ampliamente por radio y televisión, destacando sus bajos precios y accesibles condiciones decrédito. Al dueño le gustaría analizar la relación entre las ventas y lo que gasta en publicidad. A

continuación se muestra la información acerca de las ventas y lso gastos de publicidad durante los últimos

cuatro meses.

Mes Gastos de publicidad(miles de dólares)

Ingreso por ventas(miles de dólares)

Julio 2 7Agosto 1 3

Setiembre 3 8Octubre 4 10

Se plantea la hipótesis de que a medida que aumentan los gastos de publicidad, aumentan los ingresos por

ventas.

Debemos comenzar por el diagrama de dispersión, que nos permite tener una idea sobre el grado

(intensidad) y la naturaleza (forma) de la relación entre las dos variables. Entonces podemos dar cuenta si

la relación es lineal o no lineal, positiva o negativa, o simplemente no existe una relación aparente.


28/63


28

Observando el diagrama podremos establecer lo siguiente:

1.- Existe una relación lineal entre los gastos de publicidad y el ingreso por ventas en ese periodo de 4

meses. Por lo tanto, es posible trazar una línea recta que se ajuste a los puntos graficados en eldiagrama de dispersión

2.- La relación no es determinística; vale decir, cualquiera que sea la línea recta que se trace, la mayoría

de los puntos estarán por encima o por debajo de dicha recta.

Coeficiente de correlación

Medida de la intensidad de la relación lineal entre dos variables. Para determinar el valor numérico del

coeficiente de correlación se utiliza la siguiente expresión

r =

Donde:

n= Número de pares de observaciones

∑x = Suma de los valores de la variable x

∑y = Suma de los valores de la variable y

∑ = Suma de los valores de x elevados al cuadrado

Cuadrado de la suma de los valores de x

∑= Suma de los valores de y elevados al cuadrado = Cuadrado de la suma de los valores de y∑xy = Suma del producto de x e y

El coeficiente de correlación ( r ) puede tomar cualquier valor de -1.00 a +1.00 inclusive. Un coeficiente

de correlación -1.00 ó de +1.00 indica una correlación perfecta

Un coeficiente cercano a cero indica que la relación es débil.

Con los datos del problema tenemos:


29/63


29

Total

r = r =

= 0.96Por lo tanto existe una fuerte correlación entre el gasto en publicidad y el ingreso por ventas.

Análisis de regresión

A través del análisis de regresión buscamos que la línea de ajuste se aproxime lo mejor posible a todos los

puntos del diagrama de dispersión. La ecuación para la línea recta empleada para calcular y con base en

x se conoce como ecuación de regresión.

Ecuación de regresión

Expresión matemática que define la relación entre dos variables.

Principio de mínimos cuadrado

Técnica empleada para obtener la ecuación de la regresión, minimizando la suma de los cuadrados de las

distancias verticales entre los valores y verdaderos y los valores pronosticados .Dicha recta se define como:

y = a +bx

Par determinar la calidad estimadora de esta recta necesitamos alguna medida de la distancia de los

puntos ( a esta recta. El siguiente grafico muestra, para un solo punto, como se mide esta distancia.Para el valor el correspondiente valor y en nuestra recta es a + bx mientras que el valor realmenteobservado para la variable dependiente es .La diferencia entre los dos es:

x y xy 2 7 14 4 491 3 3 1 93 8 24 9 644 10 40 16 100

10 28 81 30 222


30/63


30

Ahora bien, cualquier estimador razonable de la recta de regresión verdadera dejará algunos de los datos

observados por debajo y otros por encima de la recta estimada. Por lo tanto, algunos de los serán positivos y otros negativos

a = b =

b =

La recta:

̂ = a + bxSe denomina recta de regresión muestral de y sobre x

El coeficiente b significa que cada unidad adicional de x incrementa el valor de y en b unidades

El valor a solo tiene interpretación matemática, indica el punto de corte de la recta con el eje y.

Ejemplo

Los datos siguientes muestran las ventas (en millones) de cajas y los gastos de publicidad (en millones de

dólares) para 7 marcas principales de refrescos:

Marca Gastos depublicidad

Ventas de cajas

Coca cola 131.3 1929.2Pepsi 92.4 1384.6Kola real 60.4 811.4Sprite 55.7 541.5Inca cola 40.2 536.9Concordia 29.0 535.67 up 11.6 219.5

a.- Trace un diagrama de dispersión para estos datos, con los gastos de publicidad como variable

independiente.

b.- ¿Qué parece indicar este diagrama acerca de la relación entre las dos variables? trace una recta que pase por los datos, para aproximar una relación lineal entre los gastos de publicidad y las ventas.

c.- Aplique el método de mínimos cuadrados para plantear la ecuación estimada de regresión

d.- Presente una interpretación de la pendiente de esta ecuación

Solución:

Variable independiente: Gastos de publicidad

Variable dependiente: Ventas de cajas

Diagrama de dispersión.


31/63


31

El diagrama parece indicar que la relación entre las variables es linealmente positiva.

Ahora encontraremos los valores de r , a y b

Gastos de Publicidad Ventas de cajasx y xy

131.3 17 239.69 1929.2 3 721 812.64 253 303.96

92.4 8 537.76 1 384.6 1 917 117.16 127 937.04

60.4 3 648.16 811.4 658 369.96 49 008.56

55.7 3 102.49 541.5 293 222.25 30 161.55

40.2 1 616.04 536.9 288 261.61 21 583.38

29 841 535.6 286 867.36 15 532.4

11.6 134.56 219.5 48 180.25 2 546.2

Sumas 420.6 35 119.7 5 958.7 7 213 831.23 500 073.09

r =

r = = 0.97810014Como r se aproxima a uno, entonces diremos que la relación que hay entre las dos variables es bastante

fuerte o intensa.

La ecuación que mejor se ajusta a los datos es una recta, como se aprecia en el siguiente gráfico.


32/63


32

b =

b =

= 14.42378282a =

a = = - 15.42Por lo tanto la ecuación de la recta seria:

y = a +bx

y = - 15.42 + 14.424x

La interpretación que tiene a es solo matemática, esto es el punto de corte con el eje y

El valor que toma b se interpreta como: por cada incremento en la variable dependiente se espera una

variación de 14.424 en la variable dependiente

Coeficiente de determinación ( )Es el estadístico que mide la proporción de la variación total en y que puede ser explicada por la

variación en x.

El coeficiente de determinación se calcula elevando al cuadrado el coeficiente de correlación.

En el ejemplo anterior como r = 0.9781, el coeficiente de determinación será 0.9567, luego pudedecirse que 95.67% de la variación en el número de cajas vendidas se explica por la variación en los

gastos de publicidad.

Prueba de significancia del coeficiente de correlación

Es importante estudiar si r es significativo (distinto de cero) ya que ello implica que el modelo de

regresión lineal es significativo.

Planteamiento de hipótesis:

0 (la correlación en la población es nula) (la correlación en la población no es nula)


t √ √ , con n – 2 grados de libertad


33/63


33

Rechazar si:T ó t

Del ejemplo anterior, pruebe la hipótesis de que no existe correlación en la población. Emplee 0.02 de

nivel de significancia

Solución

Planteamiento de hipótesis

0 (la correlación en la población es nula) (la correlación en la población no es nula)Regla de la decisión

Rechazar si:T ó t


t √ √ = √ √ = = 10.5093Se acepta la hipótesis alternativa, es decir existe relación entre las variables en estudio

ERROR ESTÁNDAR DE LA ESTIMACIÓN:

Mide la dispersión de los valores observados, con respecto a la recta de regresión.

=

–

=

– ––

MarcaGastos dePublicidad

x

Ventas deCajas

y RendimientoPronosticado

Desviacionesy -

Desviacionesal cuadrado

Coca cola 131.3 1929.2 1878.45 50.75 2575.56Pepsi 92.4 1384.6 1317.35 67.25 4522.56

Kola real 60.4 811.4 855.78 - 44.38 1969.58Sprite 55.7 541.5 787.99 - 246.49 60757.32

Inca cola 40.2 536.9 564.42 - 27.52 757.35Concordia 29.0 535.6 402.87 132.73 17617.25

7 up 11.6 219.5 151.89 67.61 4571.11


34/63


34

= – = – = 136.21ESTIMACIÓN DE LOS INTERVALOS DE CONFIANZA

El error estándar de la estimación es una medida válida para utilizarla al fijar los intervalos de confianza

cuando el tamaño de muestra es grande y de alguna forma la dispersión con respeto a la recta de la

regresión está distribuida de manera normal.

Un intervalo de confianza se determinará para:

1.- El valor medio de Y para un valor dado de X

2.- Un valor individual de Y para un valor dado de X

t(Syx)

( )

De donde

Y' = es el valor pronosticado para cualquier valor X seleccionado

X = es cualquier valor seleccionado de X = es la media de Xn = en el número de observaciones

Syx = es el error estándar de la estimación

t = es el valor de t tomado para n – 2

Ejemplo

De acuerdo a los datos anteriores. Calcular los intervalos de confianza para la venta de cajas de gaseosascuando la inversión en publicidad es 100.00 (millones de dólares) = es 1426.98 para un x igual a 100= es 60.0857n = es 7

Syx = 136.21

t (n – 2) =t(7 -2)(0,05)= 2.5711426.98 –

1426.98 195.1291 = 1622.1091 y 1231.8509 Interpretación.-

Cuando se invierte 100 millones de dólares en publicidad, se espera que la venta de gaseosas esté

comprendida entre1622.1091 y 1231.8509 miles de cajas

Pero cuando a se trata de un valor individual la fórmula es:

t(Syx) ( )


35/63


35

Ejemplo.

- Cuanto será la venta de cajas de Inca cola, cuando esta compañía invierta 100 millones en publicidad:

1426.98 1426.98 1972.305y 881.655

Interpretación.-

Con una probabilidad del 0,95 se puede afirmar que cuando la Inca Cola invierta 100 millones en

publicidad sus ventas estarán comprendidas entre 1972.305 y 881.655 cajas..

RELACIÓN ENTRE COEFICIENTE DE CORRELACIÓN, COEFICIENTE DEDETERMINACIÓN Y ERROR ESTANDAR DE ESTIMACIÓN

Un medio conveniente para mostrar la relación entre estas tres medidas es la ANAVA, recordemos que:

El error estándar de la estimación mide cuán cerca de la recta de regresión se encuentra los valores reales.Cuando el valor es pequeño indica que las dos variables están relacionadas muy de cerca.

El coeficiente de correlación mide la fuerza de la asociación entre dos variables. Cuándo los puntos del

diagrama de dispersión parecen cercanos a la línea recta, se observa que el coeficiente de correlación

tiende a ser grande. Luego el error estándar de la estimación y coeficiente de correlación indican la misma

información, pero utilizan escalas diferentes.

El coeficiente de determinación mide el porcentaje de la variación de Y que se explica por la variación de

A N A V A

Fuentes deVariación Suma deCuadrados Grados deLibertad CuadradoMedio Prueba designificación SignificaciónestadísticaRegresión 1 ⁄ ⁄ Error n – 2 ⁄ Total n – 1SC r = – SC e= ∑( – ) =SC t – SC rSC t = ∑ ( – )

y ( – ) ( ) – ( – ) ( ) 1929.2 1878.45 851.2428 1077.9572 1161991.725 50.75 2575.5625 1027.2072 1055154.632

1384.6 1317.35 851.2428 533.3572 284469.9028 67.25 4522.5625 466.1072 217255.9219

811.4 855.78 851.2428 - 39.8428 1587.4487 -44.38 1969.5844 4.5372 20.5861

541.5 787.99 851.2428 -309.7428 95940.6021 -246.49 60757.3201 -63.2528 4000.9167

536.9 564.42 851.2428 -314.3428 98811.3959 -27.52 757.3504 -286.8228 82267.3186

535.6 402.87 851.2428 -315.6428 99630.3771 132.73 17617.2529 -448.3728 201038.1678

219.5 151.89 851.2428 -631.7428 399098.9654 67.61 4571.1121 -699.3528 489094.3389


36/63


36

A N A V A

Fuentes deVariación

SC GL CM F Sign.Estad.

Regresión 2048831.882 1 2048831.882 110.4244 **Error 92770.7449 5 18554.1489Total 2141530.417 6

F (1,5)= 6.61 ( 16.26 ( Interpretación:

Realizado el análisis de variancia (ANAVA) para la regresión se encontró una alta significación

estadística para la regresión, por lo tanto podemos decir que existe asociación entre ambas variables en

estudio

= = 1 – = = 1 – = 0,9567 = 95.67%

El 95.67% de las variaciones de la venta de cajas de gaseosas (Y) es explicado por la inversión que se

hizo en publicidad (X)

r = = 0.9781 (Coeficiente de correlación)1 – = 4.33% (Coeficiente de no determinación)

El error estándar de la estimación también puede ser calculado de la siguiente forma

S yx= – = – = 136.2136Por último se como se observa que conforme la Suma de Cuadrado del error disminuye

ta y por el contrario, conforme disminuye el error estándar se incrementa r 2

Análisis de regresión múltiple

Estudia la influencia de dos o más variables independientes sobre la dependencia de otra variable

dependiente.

La ecuación será:

= bo + b1X1 +b2X2X 1,X2 = son las dos variables independientes

bo = es la intersección en Y, es decir, la ordenada con el eje del punto de intersección con el

eje Y

b1= es el cambio neto en Y por cada cambio unitario de X1 manteniendo x2 constante (o sea

sin cambios). Se denomina coeficiente de regresión parcial, coeficiente de regresión

neta, ó más brevemente, coeficiente de regresión.

b2 = Es el cambio neto en Y por unidad de cambio en X2, manteniendo X1 constante (sin

cambios). También se denomina coeficiente de regresión parcial o simplemente

coeficiente de regresión.


37/63


37

La ecuación de la regresión múltiple se puede ampliar a más variables independientes.

Y' = bo +b1X1 + b2X2 +b3X3 +……………+bk Xk

El método de mínimos cuadrados, minimiza la suma de cuadrados de las desviaciones verticales con

respecto a la línea de la regresión, principios que se cumple para la regresión lineal como para la

regresión múltiple.En el caso de dos variables independientes es necesario resolver las siguientes ecuaciones:

∑Y = na + b1∑X1 +b2∑X2

∑X1Y = bo∑X1 + b1∑ + b2∑X1X2 ∑X2Y = bo∑X2 + b1∑X1X2 + b2∑

Este sistema de ecuaciones se puede resolver de diferentes maneras, una de ellas es empleando matrices

Ejemplo.- El director de personal de una empresa que tiene un importante grupo de vendedores, debeentrevistar y seleccionar nuevo personal. Ha diseñado una prueba que ayuda a seleccionar los mejores

aspirantes para su personal de ventas A fin de verificar la validez de una prueba como instrumento de predicción de las ventas semanales. Eligió al azar a cinco vendedores y aplicó la prueba a cada uno. Los

importes de ventas semanales se aparearon con el puntaje obtenido en la prueba y con la calificación que

se les hizo a su desempeño

1.- ¿Cuál será la ecuación de regresión múltiple?

2. ¿Supóngase que un solicitante de empleo en el departamento de ventas tuvo un puntaje de 6,0 en la

prueba y una calificación de desempeño de 3,8. ¿Cuáles son las ventas semanales estimadas del

solicitante?

Vendedor Ventas semanales(en miles de soles) Y

Puntaje de laPrueba

Calificación deDesempeño

Juan 5 4 2Milagritos 12 7 5Raúl 4 3 1Steffany 8 6 4Eduardo 11 10 6

Solución:1.- La ecuación podrá ser calculada de la siguiente forma:

–

=

Total

Reemplazamos en el arreglo matricial

Y 5 4 2 16 4 8 20 10

12 7 5 49 25 35 84 60

4 3 1 9 1 3 12 4

8 6 4 36 16 24 48 32

11 10 6 100 36 60 110 66

40 30 18 210 82 130 274 172


38/63


38

– =

Encontramos determinante de la matriz 3x3

|| Procedemos a invertir la matriz cuadrada 3x3

* + = 320 * + = 120 * + = 120* + =120 * + = 86 * + = 110* + = 120 * + = 110 * + = 150

– – –

–

=

Calculamos los coeficientes de la regresión múltiple

[(–)] = 3,5 =[(–)–] = – 0,975

= [(–)] = 2,875Luego la ecuación será igual a: = bo + b1X1 + b2X2 = 3,5 + ( – 0,975) X1 + 2,875X22.- Y' = 3,5 + ( – 0,975)6,0 + 2,875(3,8)

Y' = 8,575 miles de nuevos soles.


39/63


39

ERROR ESTÁNDAR MÚLTIPLE DE LA ESTIMACIÓN:

El error estándar de la estimación en el análisis de la regresión múltiple mide el error para valores de Y

con respecto al plano de regresión si es que intervienen dos variables independientes.

Sy.12 =

–

–

Puntaje dePrueba

CalificacióndeDesempeño

Ventassemanales(miles desoles)

VentassemanalesPronosticadas(miles de soles)

( ) Juan 4 2 5 5,35 – 0,35 0,1225

Milagritos 7 5 12 11,05 0,95 0,9025

Raúl 3 1 4 3,45 0,55 0,3025

Steffany 6 4 8 9,15 – 1,15 1,3225

Eduardo 10 6 11 11,00 0,00 0,0000

Total 0,00 2,6500

Sy.12 = – = 1,151 miles de solesCOEFICIENTE DE CORRELACIÓN MULTIPLE. (r)

Es la medida de la fuerza de la asociación entre la variable dependiente y dos o más variables

independientes

Este coeficiente toma valores entre 0 y a 1 inclusive, siempre es positiva Ejemplo Un coeficiente de 0,94

indica una asociación muy fuerte entre las variables dependiente e independiente. Un coeficiente de 0,09

revela una relación muy débil

Correlación Correlación Correlación pequeña moderada grande

0 0,50 1,00

sin correlacion correlación perfecta

COEFICIENTE DE DETERMINACIÓN MÚLTIPLE (r2).-- Proporción (porcentaje) de la variación

total en la variable dependiente Y que se explica por medio del conjunto de variables independientes

COEFICIENTE DE NO DETERMINACIÓN MÚLTIPLE (1 – r2).- mide la proporción de lavariación total en la variable dependiente Y, que no se debe a las variables independiente.

A N A V A

Fuentes deVariación

Suma deCuadrados

Grados deLibertad

CuadradoMedio

Prueba designificación

Significaciónestadistica

Regresión K ⁄ ⁄ Error n – ⁄ Total n – 1El coeficiente de determinación se puede calcular de la siguiente manera:


40/63


40

Error estándar de la estimación múltiple será igual a:

Sy.12 = – –

Total

A N A V A

Fuentes devariación

SC GL CM F SIG

Regresión 47.35 2 23.675 17.87 N.S.Error 2.65 2 1.325Total 50 4

F(2,2)= 19,00 ( 99,50 (

Coeficiente de determinación:

=

%

Quiere decir que el 94,70% de la variación es explicado por la regresión

Coeficiente de regresión múltiple

r = √ = 0,9731Error estándar de la estimación múltiple:

Sy.12 = – – = – = 1,1510FUNDAMENTOS DE LA EXPERIMENTACIÓN AGRÍCOLA;

DISEÑOS EXPERIMENTALES

La estadística es uno de los elementos básicos de la experimentación agrícola, ya que mediante ella se

pueden obtener algunas conclusiones acerca de tales experimentos.

El desarrollo agrícola de un país se basa en las investigaciones que se realizan en ese campo, valiéndose

de la experimentación. Cualquier modalidad en las técnicas de cultivo, al introducirse por primera vez a

una región, necesita de la experimentación para poder adaptarlo y divulgarlo entre los agricultores. Esto

se debe a que las condiciones de clima y suelo varían en cada región, estación y año.

y – – – 5 5,39 8 – 3 9 – 0,35 0,1225 – 2,65 7,022512 11,05 8 4 16 0,95 0,9025 3,05 9,30254 3,45 8 – 4 16 0,55 0,3025 – 4,55 20,70258 9,15 8 0 0 – 1,15 1,3225 1,15 1,322511 11 8 3 9 0 0 3 940 40 0 50 0 2,65 0 47,35


41/63


41

Para el aprovechamiento óptimo de los recursos disponibles, los experimentos se deben diseñar de

acuerdo con los principios estadísticos que permiten al experimentador llegar a conclusiones correctas

acerca de un problema específico. Los experimentadores y estadísticos deben planear los experimentos

conjuntamente. Para ello el estadista debe tener un criterio práctico y el experimentador un criterio

estadístico.

Las etapas de todo trabajo de investigación se pueden resumir de la siguiente manera:

a) Enunciado del problema. b) Colaboradores.c) Formulación de hipótesis.d) Selección del procedimiento y diseño experimentales.e) Realización del experimento.f) Aplicación de los métodos estadísticos a los resultados,g) Interpretación de resultados.h) Análisis económico y su utilidad práctica para la comunidad.

La biometría es primordial para analizar e interpretar los datos y se manifiesta en diversas formas:

a) Estudio de la variación de una población de seres vivos. b) Comparación entre poblaciones y muestras para juzgar su semejanza.c) Interpretación de resultados de experimentos biológicos y agropecuarios, en donde se comparan

poblaciones o muestras sometidas a diferentes estudios o pertenecientes a diferentes variedades o

razas.

d) Determinación de la relación entre dos o más variedades (correlación y regresión).e) Aplicación de métodos para reducir las fuentes de error en la correlación de datos.f) En poblaciones segregadas, separación de la variación atribuible a la sección de los genes debido

al medio, en estudios de herencia cuantitativa.

En general, la experimentación agrícola la deben realizar los profesionales relacionados con las ciencias

agronómicas y biológicas.

Diseñar un experimento significa planear un trabajo de modo que reúna la información aplicable al

problema en investigación. Steel y Torrie consideran un experimento como una pregunta que detectará

nuevos hechos, confirmará los resultados de ensayos anteriores y dará recomendaciones de aplicación

práctica.

El experimento es el conjunto de reglas usadas para obtener una muestra de la población y al concluir el

ensayo obtener información acerca de la población. Little y Jackson afirman que el experimento es un

elemento de investigación utilizada para descubrir algo desconocido, o para probar un principio o una

hipótesis. Es un caso importante del método científico, ya que las preguntas que el experimento pretende

contestar serán fundamentales para apoyar o rechazar una hipótesis.


42/63


42

TRATAMIENTO

Es una de las formas que, en cantidad o calidad, el factor a estudiar toma durante el experimento. Por

ejemplo, sí el factor a estudiar es variedad de arroz, un tratamiento es la variedad NIR si el factor a

estudiar es cantidad de lisina, cada una de las dosis de lisina aplicada durante el experimento es un

tratamiento. Los tratamientos a estudiar durante el experimento pueden ser una combinación de varios

factores simples: si quiere estudiarse la distancia entre hileras y la distancia entre plantas en un cultivo, se

pueden considerar tratamientos simples como 80 cm. entre hileras o 3 cm entre plantas, o tratamientos

combinados como 80 cm entre hileras y 3 cm entre plantas.

Por ejemplo, en la industria el productor de detergentes puede establecer como tratamiento el tipo de agua

(dura o suave), la temperatura del agua, la duración del lavado, la marca y el tipo de lavadora. En los

estudios sociológicos y psicológicos, los tratamientos se pueden referir a edad, sexo, grado de educación,

religión, etcétera.

Unidad experimental

es el material experimental al que se aplica un tratamiento de manera uniforme. Puede ser un animal, un

conjunto de semillas, una parcela, una maceta, un árbol, un tubo de ensayo, etcétera.

Tratamiento testigo

Es un tratamiento que se compara. Por ejemplo, si se quiere probar en una región el grado de adaptación y

rendimiento de una variedad nueva de plátano, se planeará el ensayo de tal manera que se incluyen

variedades locales como testigos. Si la nueva variedad presenta mayor resistencia a enfermedades,insectos, vientos, precipitación, etc., y en consecuencia produce mayor rendimiento por hectárea, esa

variedad se recomendará para la zona.

En investigación con animales se pueden probar sexos, localidades, raciones, épocas, sistemas de

pastoreo, carga de animal óptima, tipos de vacuna, uso de vitaminas y minerales, etc. En tales casos, se

forman grupos de animales tan homogéneos como sea posible para la investigación. Para formar los

grupos se deben considerar aspectos como edad, sexo y raza. Si a varios grupos de animales se les

administran diferentes dosis de vitaminas, pero no a un grupo testigo, el análisis estadístico dará

información acerca del aumento de peso, altura y precocidad de los animales que recibieron la vitamina

comparados con los que no la recibieron.

REPETICIÓN

Cuando en un experimento se tiene un conjunto de tratamientos para poder estimar el error experimental,

es necesario que dichos tratamientos aparezcan más de una vez en el experimento, para así aumentar la

precisión de éste, controlar el error experimental y disminuir la desviación estándar de la media. Por lo

tanto, se entenderá por repetición al número de veces que un tratamiento aparece en el experimento.


43/63


43

DISEÑO EXPERIMENTAL

Es el procedimiento que se sigue para asignar los tratamientos a las unidades experimentales. Es un

método aleatorio, o sea, de asignación al azar, porque se decide el tratamiento que corresponde a cada

unidad experimental mediante un sorteo o por medio de una tabla de números aleatorios.

BLOQUE O REPETICIÓN

Es un conjunto de unidades experimentales lo más homogéneas posibles, en el cual aparecen todos los

tratamientos una sola vez; dicho bloque se debe colocar perpendicular al gradiente para tratar de

minimizar el error.

ERROR EXPERIMENTAL

Los resultados experimentales varean no solo por la acción de los tratamientos, sino también por

variaciones ambientales que tienden a enmascarar el efecto de los tratamientos. Por lo general. Paraexpresar estas variaciones se usa el término error experimental. Pero el término error no quiere decir

equivocación, sino que incluye todo tipo de variación externa ajena al material experimental.

El error experimental es la medida de variación que existe entre las observaciones de unidades

experimentales en el mismo tratamiento, es decir, la variación no proviene de los tratamientos. Existen

dos clases de variaciones; la variación inherente al material experimental, al que se aplican los

tratamientos, y la que proviene de la falta de uniformidad en la realización física del experimento. Si los

resultados obtenidos tienen la precisión necesaria para llegar a conclusiones validas, ninguna de las dos

fuentes de variación deben preocupar al investigador.

El error experimental no se puede eliminar, pero sus efectos se pueden reducir para obtener una mejor

estimación de los efectos de los tratamientos. Las modalidades más recomendadas para disminuir error

son:

a.-Utilizar unidades experimentales muy uniformes, como suelo homogéneo, riegos, densidad de

siembra, fertilización, control de plagas y hierbas, etcétera.

b.- Tamaño adecuado de la unidad experimental.

c.- Eliminación del efecto de orilla y de la competencia entre tratamientos

d.- Distribución adecuada de los tratamientos mediante sorteos.

e.- Usar el número adecuado de repeticiones para cada tratamiento.

f.- Poner todos los tratamientos en iguales condiciones, de manera que si alguno es superior a los

demás, se puede probar.

Existen ciertos detalles técnicos al realizar los experimentos que parecen obvios, sin embargo, muchas

veces pasan inadvertidos. Una vez que se tiene listo el terreno para el experimento, es conveniente marcar

los contornos de los bloques y la posesión de las parcelas de acuerdo con el diseño experimental. Si el

campo está surcado y el número de surcos por parcela es impar se debe marcar el surco central de cada

parcela, y si es par el primer surco de la derecha. Además, las bolsas que contengan las semillas, abonos,

etc., que se aplican a las parcelas, tendrán claramente indicado el número de bloque y parcela a que


44/63


44

pertenecen. Antes de empezar la siembra y su preparación, el experimentador debe verificar que cada

bolsa esté en el campo frente a la parcela correspondiente.

Durante la realización del experimento debe quedar claro que todas las labores se harán con uniformidad

para todo el lote experimental, excepto las que están en estudio. Cuando se efectúan experimentos de

abonamiento, variedades, etc., es importante conocer el origen de cada tratamiento, las características de

las variedades y el análisis de los abonos. Los materiales para aplicar los tratamientos se deben conseguir

y preparar oportunamente, y nunca esperar hasta el día del inicio del experimento.

La siembra, abonamiento, labores culturales y otras, se deben realizar el mismo día para todo el

experimento. Lo anterior es necesario en los lugares lluviosos, porque las labores realizadas antes y

después de llover encuentran el terreno en condiciones diferentes, lo cual puede causar variabilidad en la

germinación, efecto de los abonos, etc. Si no es posible realizar las labor completa en un día se debe

evitar dejar bloques sin terminar

Si se trata de experimentos comparativos de variedades es útil compara las características de las

variedades sembradas, con aquellas que se obtienen al momento de la cosecha, para determinar cómo se

adaptan a las condiciones ecológicas de la localidad. También es muy importante que una parte de la

semilla de las variedades introducidas se cultive aparte para mantener su pureza, además de multiplicarla

y aclimatarla, ya sea para utilizarla en experimentos siguientes o para distribuirla entre los agricultores.

En ciertos casos, para mantener la pureza de la variedad es necesario ir al embolsado de las flores para

evitar la polinización cruzada.

Cuando se trabaja con varios obreros de campo es importante cuidar que ninguno se dedique a un mismo

tratamiento en todas las repeticiones del experimento. Ya que, un obrero puede trabajar mejor que otro y,

en consecuencia, el tratamiento que realice estará en ventaja.

Un experimento nunca se debe sembrar fuera de época porque pierde su valor. En los experimentos de

abonamiento no debe descartarse el testigo sin abono, ni el testigo que representa la práctica de la

localidad. Debido a que muchos experimentos se pierden por los daños que causan los animales se debe

extremar la vigilancia, especialmente en la época próxima a la cosecha.

En la toma de datos y observaciones en los experimentos, es importante que el experimentador se libere

de toda preferencia por determinado tratamiento para evitar falsear de manera inconsciente los resultados.

También es importante que él mismo sea quien haga las observaciones y que anote sólo los datos

debidamente comprobados. En los experimentos no deben interesar solamente los rendimientos, ya que de

proceder así no se conocerían las causas que determinan ciertos resultados de buena calidad del producto.

Se aconseja revisar los experimentos cuando menos una vez por semana, para hacer las observaciones

oportunamente. Todas las observaciones se deben anotar cuidadosamente sin dejan nada al azar ni confiar

en la memoria. Los datos deben estar en orden, de tal manera que otro experimentador pueda utilizarlos si

es necesario.


45/63


45

Para muchos investigadores el tamaño y la forma de la unidad experimental es únicamente un problema

de control. Sin embargo, investigaciones realizadas en diferentes cultivos con datos de ensayo en blanco,

han indicado que el tamaño adecuado se relaciona con el grado de precisión y con una mejor estimación

de los efectos de los tratamientos, el aspecto del costo por unidad experimental y la precisión del

experimento: aquí se prefiere un mayor número de repeticiones que el tamaño, y la unidad experimental

se orienta de manera que la mayor dimensión se dirija hacia donde esté la mayor variación del suelo.

ELECCIÓN DEL DISEÑO EXPERIMENTAL

Cuando el experimentador ya definió el objetivo del trabajo y los tratamientos por probar, el siguiente

paso es determinar el diseño experimental que se debe usar. Para un experimento específico, el mejor

diseño es el más sencillo y el que usa la menor cantidad de material para lograr el objetivo.

En la práctica, las unidades experimentales, las condiciones ambientales y de manejo no son iguales, y los

métodos de medida son inexactos. Por ello, es necesario hacer repeticiones y utilizar un diseño

experimental.

Si se considera que el experimentador estudia un fenómeno complejo (como la producción de trigo, de

leche o el crecimiento de una colonia de hongos), que mantiene fijos todos los factores que intervienen en

el fenómeno y que los métodos de medida son exactos, el resultado será el mismo cada vez que se realice

el experimento. Entonces, cada combinación de factores determina un resultado que permanecerá

constante si se repite el experimento. El experimentador, de acuerdo con su objetivo, varía uno o más

factores para evaluar el efecto de tales variaciones en el resultado.

TÉCNICA DE ALEATORIEDAD

Debido a la variabilidad del suelo, para evitar que un tratamiento sea favorecido o puesto en desventaja en

forma sistemática en sus repeticiones, Fisher ideó la técnica de aleatoriedad, cuya finalidad es dar una

estimación insesgada del error experimental.

Las parcelas contiguas tienden a correlacionarse, por eso cualquiera de ellas debe recibir al azar algún

tratamiento. La aleatoriedad tiende a destruir la correlación entre errores y hacer válidas las pruebas de

significación. El ejemplo más común de la técnica de aleatoriedad está dado por la rifa de un objeto. Si se

colocan papeles o fichas numeradas en un ánfora y se supone que están completamente mezcladas,

cualquier secuencia en que salgan se considerará aleatoria. Cuando el investigador tiene pocos

tratamientos recurre a esta técnica. Sin embargo, es preferible recurrir a una tabla de números aleatorios.

ANÁLISIS DE VARIANZA

Anteriormente se analizaron datos provenientes de dos muestras o dos tratamientos. Se observó que por

medio de la prueba t de Student es posible determinar si la variedad A es estadísticamente más productiva

que la variedad B, o si un forraje con fertilizante es mejor que un forraje sin fertilizante.


46/63


46

El trabajo del investigador pocas veces se limita a estudiar dos tratamientos a la vez. Para ahorrar tiempo

y esfuerzo, y para aumentar la precisión del experimento, por lo general, se estudian más de dos factores a

la vez, con varios niveles dentro de cada factor.

Sir Ronald Fisher introdujo el análisis de varianza (ANAVA), que es un procedimiento aritmético que

consiste en desdoblar la suma de cuadrados total (variación total) en fuentes de variación reconocidas,

con todo y la variación que no se pudo medir (proveniente de la variabilidad inherente al material

experimental o de la falta de homogeneidad del ambiente donde se realizó el experimento); fuente de

variación que se conoce como residuo o error experimental. Por ejemplo, cuando se trató lo concerniente

a regresión, la suma de cuadrados total se descompuso en suma de cuadrados debido a la regresión, más

la suma de cuadrados debido al error.

El ANAVA se utiliza en todos los campos de investigación cuando los datos se miden cuantitativamente.

Su uso ha sido muy ventajoso en el diseño experimental. Las suposiciones básicas del ANAVA son

a) Los efectos de tratamientos y ambientales son aditivos. b) El error experimental es un elemento aleatorio, normal e independiente, distribuido con media

cero y varianza común.

GRADOS DE LIBERTAD

Los grados de libertad son el número de contrastes ortogonales menos el número de restricciones

impuestas, que se pueden hacer en un grupo de datos. Por ejemplo, si se supone que el rendimiento de

cinco variedades de un cultivo es de 25, 26, 27, 28 y 29 kg, la medía es 27 kg. Las desviaciones de los

números con respecto a su medida (que deben sumar cero) son:

25 26 27 28 29

-2 -1 0 +1 +2

En esta muestra de cinco datos, uno queda fijo (la restricción está dada por X= 27), porque X se utilizó

como el origen para las desviaciones. Entonces quedan cuatro valores (cuatro grados de libertad) que se

pueden comparar independientemente con la media, o sea que el número de grados de libertad de una

muestra de datos está dado por el total de observaciones menos uno (n - 1).

La varianza de la muestra está dada por:

= ( ) = Es decir, la varianza es el cociente que resulta de dividir la suma de cuadrados entre el número de grados

de libertad. Dentro del ANAVA, y para obtener el valor F (que denota la significación entre tratamientos)

se divide el cuadrado medio del tratamiento entre el cuadrado medio del error.


47/63


47

Al comparar el valor de F calculado con el F tabulado, se podrá establecer si existe significancia. Habrá

significancia en caso de que el valor F calculado sea mayor que el valor F tabulado. Este último se

encuentra en la tabla de F, con el nivel de significancia apropiado, los grados de libertad del error en la

vertical. Si se rechaza la hipótesis nula de que no existen diferencias en los tratamientos, el siguiente paso

es efectuar la prueba de significancia entre medias de tratamiento, para conocer cuáles de ellos son

mejores.

DISEÑO COMPLETAMENTE AL AZAR

El diseño completamente al azar es el diseño más simple y se usa cuando las unidades experimentales son

homogéneas, y la variación entre ellas es muy pequeña. Tal es el caso de experimentos de laboratorios,

invernadero, gallineros, porcinas, etc. En experimentos en que las condiciones ambientales son

controladas, tal diseño es una prueba con un solo criterio de clasificación.

Las ventajas de este diseño son:

a.- Es fácil de planear.

b.- Es flexible en cuanto al número de tratamientos y repeticiones, el límite está dado por el número de

unidades experimentales en general.

c.- No es necesario que el número de tratamientos sea igual al número de repeticiones.

d.- No se estima parcelas perdidas.

e.- El número de grados de libertad para el error aumenta al no tener muchas restricciones.

Las desventajas del diseño son:

a.- No es eficiente con material experimental heterogéneo.

b.- Puesto que no existen restricciones en cuanto a la aleatoriedad, el error experimental incluye la

variación total entre unidades experimentales

A N A V A

FUENTE DE

VARIACION

SUMA DE

CUADRADOS

SC

GRADOS DE

LIBERTAD

GL

CUADRADO

MEDIO

CM

PRUEBA

ESTADISTICA

F

Tratamiento – TC t – 1 ⁄ ⁄ Error SC tot. – SCtra. t(r – 1) ⁄ Total

– TC tr – 1

Termino de corrección (TC) =

DISEÑO COMPLETAMENTE AL AZAR CON IGUAL NÚMERO DE UNIDADES POR

TRATAMIENTO

En un ensayo con macetas se aplicaron cinco tratamientos a clones de pasto estrella. Se tomaron cuatro

macetas por tratamiento. Los rendimientos se presentan a continuación. Probar las hipótesis

correspondientes.


48/63


48

T R A T A M I E N T O SMacetas 1 2 3 4 5

1 101 51 83 67 292 93 61 68 40 453 93 59 72 46 514 96 58 75 52 42

Total 383 229 298 205 167 128

Media 93,7

57,2

74,5

51,2

41,7

No existe diferencia entre tratamientosSi existe diferencia entre tratamientosTC 82176SC total – TC = 8168SC tratamientos =

7286SC error = SC total – SC tratamientos

= 82176 – 7286 = 882

A N A V A

Fuentes de Variación SC GL CM F SIG

Tratamiento 7286 4 1821,5 30,98 **Error 882 15 58,15Total 8168 19

F 0.05 = 3,06

0,01= 4,89

C.V. =√ √ 100= 46,33%

El coeficiente de variabilidad o coeficiente de variación indica la confiablidad en los datos, a medida quesu valor disminuye la confiabilidad es mayor.

Prueba de significación de t

- Las pruebas de hipótesis serán:1 vs 2 1 vs 3 1 vs 4 1vs 5

Ho Ho Ho Ho Ha Ha Ha Ha 2 vs 3 2 vs 4 2 vs 5

Ho Ho Ho Ha Ha Ha 3 vs 4 3 vs 5

Ho Ho Ha Ha 4 vs 5

Ho Ha


49/63


49

- El error estándar será S = = = 5, 39Se busca en las tablas de t

t

0,05= 2,131

t 0,01= 2,947Comparaciones

t = se repite para cada par de comparaciones

t = = = 6, 77**

t =

=

= 3, 57**

t = = = 7, 88**t =

= = 9, 64**t =

= = – 17, 25 *t =

= = 1, 11 N.S.t = = = 2, 87*t =

= = 4, 31**t =

= = 6, 07**t =

= = 1, 76 N.S.Prueba de D. L. S.

D.L.S. = t . S = 2,131 x 5,39= 11.481 vs 2 = 93,75 – 57,25 = 36,5*

1 vs 3 = 93,75 – 74,50 = 19,25*

1 vs 4 = 93,75 – 51,25 = 42,5*

1 vs 5 = 93,75 – 41,75 = 52,00*

2 vs 3 = 57,25 – 74,50 = – 17,25*

2 vs 4 = 57,25 – 51,25 = 6,00 N.S.

2 vs 5 = 57,25 – 41,75 = 15,50*


50/63


50

3 vs 4 = 74,50 – 51,25 = 23,25*

3 vs 5 = 74,50 – 41,75 = 32,75*

4 vs 5 = 51,25 – 41,75 = 9,5 N.S.

Prueba de significación de Duncan

Esta prueba tiene en cuenta el orden de los promedios de cada uno de los tratamientos.

S = = =3,81Con los grados de libertad del error buscamos en la tabla de Duncan

(A.E.S) 3,01 3,16 3,25 3,31Encontramos la A.L.S.

A.L.S. =A.E.S. x S 2 3 4 5

A.E.S. 3.01 3.16 3.25 3.31

S 3.81 3.81 3.81 3.81A.L.S. 11.46 12.03 12.38 12.61

Ordenamos en orden creciente los promedios

Tratamiento 5 4 3 2 1

Promedio 41,75 51,25 57,25 74,50 93,73

Comparamos los promedios desde el mayor hasta el menor

1 – 5 = 93,73 – 41,75 = 51,98 > 12,61 *

1 – 4 = 93,73 – 51,25 = 42,48 > 12,38 *

1 – 2 = 93,73 – 57,25 = 36,48 > 12,03 *

1 – 3 = 93,73 – 74,50 = 19,23 > 11,46 *

3 – 5 = 74,50 – 41,74 = 32,76 > 12,38 *3 – 4 = 74,50 – 51,25 = 23,25 > 12,03 *

3 – 2 = 74,50 – 57,25 = 17,00 > 11,46 *

2 – 5 = 57,25 – 41,75 = 15,50 > 12,03 *

2 – 4 = 57,25 – 51,25 = 6,00 < 11,46 N.S.

4 – 5 = 51,25 – 41,75 = 9,50 < 11,46 N.S.


51/63


51

Otro método

Tratamiento Promedio

1 93,703 74,502 57,25

4 51,25

5 41,75

Los tratamientos bajo la misma recta son estadísticamente iguales.

Prueba de significación de Tukey

S = = =3,81Buscamos en la tabla de Tukey con los grados de libertad del error y el número de tratamientos.

A.E.S. (T) = A.E.S. (15 y 5) = 4,37

A.L.S. = S A.E.S. (T)A.L.S. = 3,81 X 4,37 =16,64

Realizamos las comparaciones múltiples

Tratamiento Promedio

2 93,704 74,502 57,25

4 51,25

5 41,75

Los promedios bajo la misma recta son estadísticamente iguales

DISEÑO COMPLETAMENTE AL AZAR CON DIFERENTE NÚMERO DE UNIDADES POR

TRATAMIENTO

A veces se presenta el caso de que por insuficiencia de material para todos los tratamientos, o porque se

han perdido unidades experimentales, no se dispone de igual número de observaciones por tratamiento.Esta es una de las ventajas del diseño completamente al azar, ya que los datos se pueden analizar

directamente sin necesidad de estimar parcelas perdidas.

Por ejemplo se analizó un experimento de cuatro raciones para cerdos con nueve cerdos por ración.

Durante el experimento se presentó una enfermedad y murieron 16 cerdos.

La hipótesis a probar es: No existe diferencia entre los tratamientosHa Si existe diferencia entre los tratamientos


52/63


52

R A C I O N E SRepeticiones 1 2 3 4

1 45 35 34 412 46 33 34 413 49 35 444 44 34 435 33 41

6 427 448 419 41

Total 184 68 170 378 800 Gran Total 46 54 34 42TC =

= SC trat. =

SCtotal= – 32 000=464SC error = SC total – SC tratamientos =464 – 432 = 32A N A V A

Fuentes de Variación SC GL CM, F SIG

Tratamiento 432 3 72 36 **

Error 32 16 2

Total 464 19

F 0.05 3,24

0,01 5,29

C.V. = √ √ x 100= 3,52%Como F es altamente significativo, nos permite rechazar la hipótesis nula de que no hay diferencias entre

los tratamientos

El coeficiente de variabilidad o coeficiente de variación indica la confiablidad en los datos, a medida que

su valor disminuye la confiabilidad es mayor.

DISEÑO DE BLOQUES COMPLETOS AL AZAR

El objetivo del diseño bloques completos al azar es reunir las unidades experimentales a las cuales se

aplicaran los tratamientos, en bloques de cierto tamaño, de tal modo de que los tratamientos se efectúen

dentro de cada bloque. La variabilidad entre unidades experimentales de bloques diferentes será mayor

que entre unidades dentro del mismo bloque, como consecuencia, las diferencias encontradas entre

unidades, se deben principalmente a discrepancias entre tratamientos. La disparidad que no se deba a

tratamientos, se elimina por el diseño y forma parte del error experimenta. De acuerdo con esto, es fácil

observar que la variabilidad entre bloques no afecta las diferencias entre medias de tratamientos, porqueen cada bloque aparece una vez por tratamiento, y así los bloques y tratamientos son ortogonales.


53/63


53

Durante el experimento todas las parcelas dentro del bloque se deben tratar igual, excepto cuando se

aplique un tratamiento cuyo efecto se quiere medir. Por ejemplo, si los tratamientos son niveles de

fertilización, todos los demás factores como preparación del suelo, época, densidad de siembra, labores de

cultivo, uso de plaguicidas, riegos y variedades deben ser exactamente iguales para todas las parcelas, si

no es así, se introducirían otras fuentes de variación cuyo efecto no se podría medir, y ocultarían el efecto

de los tratamientos en estudio.

El diseño bloque completo al azar se caracteriza por su equilibrio, fácil planeación y procedimiento de

cálculo simple. Su única desventaja es que cuando el número de tratamientos es alto, aumenta la

superficie del terreno dentro de cada bloque y también el error experimental.

R E P E T I C I O N E S

J=1,2,3,…………r

Suma Media

Tratamiento

i=1,2,3…t

1 2 r

1 2 t

Suma Media

A N A V A

TC = El siguiente ejemplo presenta los resultados de seis variedades de frijol (rendimiento expre

DISE+æOS EXPERIMENTALES UCV

Documents

Transcript of DISE+æOS EXPERIMENTALES UCV