ESTADISTICA - MSST

55
ESTADÍSTICA Profesor: Lorenzo Pérez Vargas [email protected]

description

.

Transcript of ESTADISTICA - MSST

Page 1: ESTADISTICA - MSST

ESTADÍSTICAProfesor: Lorenzo Pérez Vargas

[email protected]

Page 2: ESTADISTICA - MSST

ESTADISTICA

Trata con la información cuantitativa o numérica.A la información cuantitativa se le llaman datos estadísticos.

La estadística se ocupa de la recopilación, organización presentación, análisis e interpretación de la información con el fin de tomar decisiones.

La estadística se divide en: Estadística descriptiva Estadística inductiva e inferencial

Page 3: ESTADISTICA - MSST

• Incluye los métodos de recopilación, organización, presentación, análisis e interpretación de un grupo de datos, sin ningún intento para hacer una predicción o generalización con respecto a la población.

Estadística

descriptiva

• Es la que incluye los métodos de estimación, predicción o generalización de las características de una población basados en una muestra.

Estadística

inductiva e

inferencial

Page 4: ESTADISTICA - MSST

DEFINICIONES

Población o universo: Es un conjunto de individuos o de elementos que guardan similitud entre sí en los aspectos que son relevantes para los objetivos de la investigación.

Población de estudio: Se caracteriza por ser finita, poseer atributos o características particulares, temporal y geográficamente disponible para ser estudiada.

Muestra: Es un subconjunto de la población y se define como un conjunto de elementos representativos extraídos de una población.

Variables: En estadística se consideran 2 clases de variables.

a) Variable cuantitativa Son medibles

b) Variable cualitativa No son medibles

Page 5: ESTADISTICA - MSST

VARIABLES

Variable cuantitativa: Son expresadas mediante números o cantidades y pueden ser de 2 clases:

Continuas: Toman cualquier valor dentro de su recorrido.

Discretas: Únicamente toman valores enteros.

Variable cualitativa: Son las que se describen mediante palabras y pueden ser de 2 clases:

Nominal: Se utiliza cuando sus características se clasifican en varias categorías y no importa el orden en el que se ubiquen.

Ordinal: Se utiliza cuando sus características son ordenadas de manera creciente o decreciente.

Page 6: ESTADISTICA - MSST

• Dentro de la institucióna. Datos internos

• Primarios o secundariosb. Datos publicados

• Por teléfono• Por correo• En forma personal

c. Datos provenientes de encuesta

RECOPILACIÓN DE DATOS

Existen 3 clases de datos:

Page 7: ESTADISTICA - MSST

ORGANIZACIÓN DE DATOS

Es el segundo paso en un estudio estadístico e incluye 3 pasos que son: Revisión y corrección de los datos recopilados

Clasificación de los datos

La tabulación de los datos

PRESENTACIÓN DE DATOS

En general hay 3 formas para presentar datos organizados: Mediante palabras Mediante tablas o cuadros estadísticos Mediante gráficas

Tiempo (cronológico)Lugar (geográfico)Cantidad (cuantitativas)Cualidad (cualitativas)

Page 8: ESTADISTICA - MSST

PARTES PRINCIPALES DE UNA TABLA ESTADISTICA

Numeración Título Encabezado Concepto o columna matriz Cuerpo Fuente Nota de encabezado

Page 9: ESTADISTICA - MSST

GRÁFICAS

Es la representación de una información dada

PARTES PRINCIPALES DE UNA GRÁFICA

Numeración Título Escala Diagrama Fuente Nota de encabezado

Page 10: ESTADISTICA - MSST

TIPOS COMUNES DE GRÁFICAS

Gráfico lineal

Cuantitativa

Cronológica

Gráfico de barras

Vertical:CuantitativaCronológica

Horizontal:CualitativaGeográfica

Gráfico circular

Cualitativa

Geográfica

Gráfica partes

componentes

Lineal:CuantitativaCronológica

Barras:a. VerticalCuantitativaCronológica

b. HorizontalCualitativaGeográfica

Page 11: ESTADISTICA - MSST

DISTRIBUCIÓN DE FRECUENCIA

Es una tabla en la cual se agrupan los valores de la variable: En una forma individual, si se trata de una variable discreta o cualitativa. En intervalos de clases, si se trata de una variable continua o

cuantitativa.En ella se registra el número de valores observados que corresponde a cada valor de la variable o cada intervalo de clase y recibe el nombre de frecuencia absoluta.

Los datos organizados en una distribución de frecuencia se denominan datos agrupados.

Ej: Se seleccionó una muestra de 10 trabajadores para conocer su estado

civil. Los resultados fueron los siguientes: casado – soltero – unión libre, casado – soltero – soltero, viudo – unión libre – casado – casado.

Se ha seleccionado una muestra de 15 familias en l ciudad para conocer el número de hijos que tiene, obteniéndose los siguientes resultados: 2 – 1 – 0 – 1 - 2 – 0 – 1 – 3 – 3 – 2 – 0 – 2 – 3 – 2 - 3

Page 12: ESTADISTICA - MSST

REGLA PARA CONSTRUIR UNA DISTRIBUCIÓN DE FRECUENCIA

1. Se determina el rango. El rango es la diferencia existente entre el dato mayor y el dato menos de un conjunto de datos.

2. Se divide el rango en un número conveniente de intervalos de clase de igual tamaño. Si esto no es posible se debe utilizar intervalos de desigual tamaño o intervalos de clases abiertas. El número de intervalos por lo general se toma entre 5 y 15.

Matemáticamente se calcula así:

No. de clases = 1 + 3.3 Log n

3. Se calcula el número de observaciones que caen dentro de cada intervalo de clase, es decir, se calculan las frecuencias de clase.

Page 13: ESTADISTICA - MSST

Punto medio o marca de clase: Al valor promedio de un intervalo de clase se le llama punto medio y se calcula:

Frecuencia relativa: A la relación existente entre la frecuencia absoluta de una determinada clase y el tamaño de la muestra se le llama frecuencia relativa.

Page 14: ESTADISTICA - MSST

COEFICIENTES NUMÉRICOS

Las medidas numéricas en estadística son:

Medidas de centralización

Buscan características del centro de distribución. Las más utilizadas son:- La media aritmética- La mediana- La moda- La media geométrica- La media armónica

Medidas de posición

Indican una vez esté ordenadas, cuántas observaciones o elementos quedan a la izquierda o a la derecha con respecto a punto dado o de referencia. Las más utilizadas son:- Los cuartiles- Los deciles- Los percentiles

Medidas de dispersión

Proporcionan una idea sobre la variación de los datos con respecto a una medida central generalmente la media aritmética. Las más utilizadas son:- La varianza- La desviación típica o estándar- La desviación mediaEl coeficiente de variación

Medidas de forma

Page 15: ESTADISTICA - MSST

MEDIA ARITMETICA

Es el principal promedio, el más conocido, el más utilizado y se define como la relación existente entre la suma de los valores de la variable y el tamaño de la muestra. Es el valor más representativo dentro de una serie de datos.

Datos no agrupados

Datos agrupados

LA MODA

Se define como el valor que más se repite, dentro de una serie de datos. En una serie de datos. En una serie de datos puede existir más de una moda como no puede existir ninguna.

Cálculo de la moda para datos no agrupados:Se calcula por simple inspección.

Page 16: ESTADISTICA - MSST

Cálculo de la moda para datos agrupados:

C = Amplitud de clase: Diferencia entre el límite superior y el límite inferior de una determinada clase.

LA MEDIANA

Se define como el valor que esta situado en todo el centro de un conjunto de datos. En otras palabras la mediana es aquel valor que supera al 50% de la distribución, pero que a su vez es superado por el 50%.

Cálculo de la mediana para datos no agrupados:

Se ordenan los datos en orden de magnitud, es decir, de menor a mayor.

Si el número de datos es impar, la mediana será aquel número que está situado en todo el centro.

Si el número de datos es par, la mediana será igual al valor promedio de los 2 valores que está ubicados en el centro.

Page 17: ESTADISTICA - MSST

Cálculo de la moda para datos agrupados:

CUARTILES

Son los que dividen a la distribución en 4 partes iguales.

El cuartil uno Q1: Es el valor que supera al 25% de la distribución, pero que a su vez es superado por el 75%.

El cuartil dos Q2: Es el valor que supera al 50% de la distribución, pero que a su vez es superado por el 50%.El cuartil dos es igual a la mediana.

El cuartil tres Q3: Es el valor que supera al 75% de la distribución, pero que a su vez es superado por el 25%.

Page 18: ESTADISTICA - MSST

DECILES DK

Son los que dividen a la distribución en 10 partes iguales.

PERCENTILES PK

Son los que dividen a la distribución en 100 partes iguales.

MEDIDAS DE DISPERSIÓN

La idea de dispersión se relaciona con la mayor o menor concentración de los datos en torno a un valor central, generalmente la media aritmética.

Las medidas de dispersión más importante para la inferencia estadística es: La varianza La desviación estándar o típica

Page 19: ESTADISTICA - MSST

LA VARIANZA

La varianza de una distribución se define como la media aritmética de los cuadrados de las diferencias entre los valores de la variable y su media aritmética.

Datos no agrupados de una muestra

Datos agrupados de una muestra

Datos no agrupados de una población

Datos agrupados de una población

Page 20: ESTADISTICA - MSST

DESVIACIÓN TÍPICA O ESTANDAR

La varianza se expresa en unidades distintas de la variable original, por ejemplo, si estudiamos la variable peso en kilogramos, la varianza se expresará en kgs2, lo cual no tiene sentido o significado, por esto se prefiere utilizar la desviación típica, la cual se define como la raíz cuadrada de la varianza.

Datos no agrupados de una muestra

Datos agrupados de una muestra

Datos no agrupados de una población

Datos agrupados de una población

Page 21: ESTADISTICA - MSST

PROBABILIDAD

La probabilidad trata con los problemas de azar o aleatorios, y se define como la relación existente entre el número de éxitos y el número de casos posibles.

Ejemplo:

Hallar la probabilidad de obtener un seis al lanzar un dado.

Una bolsa contiene 6 bolas blancas y 4 negras. ¿Cuál es la probabilidad que al sacar una bola de la bolsa sea de color blanca?

Page 22: ESTADISTICA - MSST

PROPIEDADES DE LA PROBABILIDAD

1) La probabilidad es un número mayor e igual a cero, pero menor e igual a 1.

2) La suma de las probabilidades será siempre igual a 1.3) La Probabilidad de Éxito más la probabilidad de fracaso es

igual a 1.

P ( Éxito ) + P ( No Éxito) = 1

P ( Éxito ) = 1 – P( Fracaso )

Page 23: ESTADISTICA - MSST

DISTRIBUCIÓN BINOMIAL

Es una distribución discreta de probabilidad que tiene las siguientes características:

1) Concurren 2 eventos o sucesos, uno será éxito y otro fracaso.

2) Los eventos son independientes.

3) La probabilidad de éxito mas la probabilidad de fracaso es igual a 1.

La función:

es la función de probabilidad binomial, que calcula la probabilidad de “x” éxito en “n” pruebas independientes.

Page 24: ESTADISTICA - MSST

Ejemplo: Se ha establecido que 2 de cada 5 trabajadores sufren accidentes de trabajo. ¿cuál es la probabilidad que al seleccionar 8 trabajadores:

a) Exactamente 3 sufran accidentes de trabajob) A lo sumo 2 sufran accidentes de trabajoc) Por lo menos 7 no sufran accidentes de trabajo.

Page 25: ESTADISTICA - MSST

DISTRIBUCIÓN DE POISSON

Es una distribución de probabilidad discreta y se utiliza:

1) Cuando el tamaño de la muestra es grande, por lo general mayor e igual a 30.

2) La media aritmética μ = n*p

3) La media aritmética debe ser menor e igual a 10.

La función de:

Es la función de probabilidad de Poisson que se utiliza para calcular probabilidad de sucesos u ocurrencias en determinado intervalo de tiempo o espacio.

Page 26: ESTADISTICA - MSST

Ejemplo: Si el número promedio de accidentes graves por año en una fábrica es de 5. Encontrar la probabilidad que en el año en curso

Se tenga :a) Exactamente 7 accidentesb) Ningún Accidentec) Máximo 4 accidentesd) Por lo menos 4 accidentes.

Page 27: ESTADISTICA - MSST

DISTRIBUCIÓN NORMAL

Es una distribución continua de probabilidad y es considerada la mas importante. La representación gráfica de la curva normal es en forma de campana y se llama la curva de GAUSS.

Propiedades de la curva normal

1) El área bajo la curva normal es igual a 1 o al 100%.

2) La distribución normal está definida por 2 cantidades, la media aritmética y la desviación estándar.

3) La distribución normal es simétrica, las colas, es decir, los extremos o los lados de la curva se prolongan al infinito en ambas direcciones y nunca tocan al eje de las X.

Page 28: ESTADISTICA - MSST

4) En el punto mas alto de la curva se traza una imaginaria al eje delas X y en el punto donde toca a este eje, se obtiene el valor de la media aritmética, que divide el área en dos partes iguales; 50% a la izquierda de la media y 50% a la derecha.

5) La desviación estándar determinará el ancho de la curva, es decir, a mayor valor de la “S” se tienen curvas mas anchas y viceversa.

Page 29: ESTADISTICA - MSST

Ejemplo: La presión sanguínea sistólica de 400 trabajadores es de

120 mm Hg, con una varianza de 81.a) ¿Cuántos trabajadores tienen una presión sanguínea

sistólica entre 110 y 115 mm Hg?b) ¿Cuál es la presión sanguínea sistólica que por debajo de

ella se encuentra el 35% de los trabajadores?

Los niveles de colesterol en un grupo de obreros de la construcción tienen un promedio de 240 mg/100 ml y una desviación estándar de 20mg/100ml. Calcular la probabilidad, que un individuo elegido al azar, tenga un nivel de colesterol:

a) Entre 180 y 200 mg/100 mlb) Entre 220 y 265 mg/100 mlc) Por lo menos 190 mg/100 mld) ¿Cuál es el nivel de colesterol, tal que el 20% de todos los

obreros tengan un nivel superior a dicho valor?

Page 30: ESTADISTICA - MSST

MÉTODO DE SELECCIÓN DE MUESTRA

De acuerdo con la forma de selección de los elementos de una muestra:

Muestreo de juicio (no probabilístico): Presenta las siguientes características:

1. Sus elementos son seleccionados mediante los puntos de vista de un experto.

2. No se puede medir el error de muestreo.

Page 31: ESTADISTICA - MSST

MÉTODO DE SELECCIÓN DE MUESTRA

Muestreo aleatorio simple: Presenta las siguientes características:

1. Cada elemento en la población tiene una probabilidad conocida de ser seleccionado en la muestra.

2. Los elementos son seleccionados utilizando una tabla de números aleatorios.

3. Cuando la población es infinita es obvio que la tarea de numerar cada elemento de la población es imposible.

Page 32: ESTADISTICA - MSST

MÉTODO DE SELECCIÓN DE MUESTRA

Muestreo sistemático: Presenta las siguientes características:

1. Los elementos son seleccionados en una forma ordenada. La manera de selección depende del tamaño de la población y del tamaño de la muestra.

2. El número de elementos de la población (n) es dividido por el numero de elementos de la muestra, obteniéndose así una constante k.

3. El primer elemento de la muestra se selecciona al azar entre 1 y k.

4. El segundo elemento es igual al valor del primer elemento mas la constante k y así sucesivamente.

Page 33: ESTADISTICA - MSST

MÉTODO DE SELECCIÓN DE MUESTRA

Muestreo estratificado: presenta las siguientes características:

1. La población se divide en grupos llamados estratos.

2. Los elementos que pertenecen a cada estrato son homogéneos.

3. El número de elementos seleccionado de cada estrato como muestra, debe ser proporcional al tamaño del estrato en relación con la población.

4. Los elementos de la muestra en cada estrato, son seleccionados por el método aleatorio simple o por el sistemático.

Page 34: ESTADISTICA - MSST

MÉTODO DE SELECCIÓN DE MUESTRA

Muestreo por conglomerado: Presenta las siguientes características:

1. Se divide la población en grupos llamados conglomerados.

2. Los conglomerados entre si tienden a ser homogéneos, en cuanto a las características de los elementos que la conforman.

3. De los diferentes conglomerados apenas uno de ellos es muestreado.

4. Cada conglomerado tiene igual probabilidad de ser seleccionado aleatoriamente.

Page 35: ESTADISTICA - MSST

ESTIMACIÓN DE PARÁMETROS

Parámetro: Es una medida usada, para describir una característica de una población.

Estadístico: Es una medida usada, para describir una característica de una muestra.

Estimación: Es el proceso de usar un estadístico (muestral), para estimar el correspondiente parámetro poblacional desconocido.

La estimación de un parámetro puede ser expresada de dos maneras:

a. Una estimación de puntoEs un número único, que es usado para representar la estimación del parámetro.

b. Una estimación de intervaloEs un recorrido establecido dentro del cual podemos esperar que esté el parámetro.

Page 36: ESTADISTICA - MSST

En la estimación de intervalo hay que tener en cuenta 3 conceptos importantes, que son:a. Coeficiente o nivel de confianzaEl área bajo la curva normal, la cual representa la probabilidad de tener el verdadero parámetro poblacional dentro de las estimaciones de intervalo es llamado el coeficiente o nivel de confianza.

b. Límites de confianzaLos 2 valores, los cuales especifican el intervalo de confianza, son llamados límites de confianza.

c. Intervalo de confianzaAl recorrido se le llama intervalo de confianza.

Page 37: ESTADISTICA - MSST

ESTIMACIÓN DE LA MEDIA POBLACIONAL(μ) A PARTIR DE UNA MUESTRAL ( )

El siguiente procedimiento deberá ser seguido para estimar la media poblacional (μ).

1. Se calcula la media aritmética de la muestra 2. Se calcula el error estándar de la media

3. Se calcula los límites de confianza, de la siguiente manera:

Límite superior

Límite inferior

Page 38: ESTADISTICA - MSST

RAZÓN DE DISPARIDAD (ODDS RATIO - OR)

El odds ratio se define como el cociente entre dos ratio posible. Un odds ratio en sentido general, es la relación entre la cantidad de enfermos y los no enfermos de una población dada. Como hay dos poblaciones, la expuesta y la no expuesta al factor de riesgo, hay 2 tipos de odds ratio posibles y la tasa entre ambos es el valor del OR.

+ - TOTAL

Factor de riesgo (FR)+

a b a + b

Factor de riesgo (FR)

-

c d c + d

TOTAL a + c b + d n

Page 39: ESTADISTICA - MSST

Si OR = 1 indica que no hay relación alguna entre enfermedad y la exposición al factor de riesgo (FR).

Si OR es mayor a 1 indica que la enfermedad está asociada a la Exposición.

Si OR es menor a 1 indica protección, es decir, el factor de riesgo es un protector a la enfermedad. (Prevención).

El OR no se asocia a pruebas de inferencia que terminan en un nivel de significación. Para determinar si existe asociación o no entre el factor de riesgo y la enfermedad, se calcula el intervalo de confianza al 95% o al 99%, luego se trata de ver si el valor de OR = 1 cae dentro de dicho intervalo, en cuyo caso se piensa que hay independencia entre los factores.

El intervalo de confianza tendrá un límite inferior y otro superior.El límite inferior debe ser superior a 1 para insinuar relación entre el factor de estudio y la enfermedad, hipótesis de causalidad.

Page 40: ESTADISTICA - MSST

Para una hipótesis de prevención, el límite superior del OR es menor de 1.

El OR indica cuantas veces es mas probable que ocurra el suceso de interés, a que no ocurra, es decir, el OR indica cuantas veces es mayor el odds del numerador que el del denominador.

Page 41: ESTADISTICA - MSST

Ejemplo: Se tiene el resultado de un estudio de casos y controles para evaluar el efecto del consumo de cigarrillos (exposición) sobre el cáncer bucofaríngeo (casos ).

CASOS CONTROLES

TOTAL

EXPUESTOS 352 238 390

NO EXPUESTOS

48 122 170

TOTAL 400 360 560

Se pide:

a) Calcular el OR e interpretar el resultado.b) Probar si existe una relación o asociación entre el factor

de riesgo (expuesto) y la enfermedad (casos ).

Page 42: ESTADISTICA - MSST

DETERMINACIÓN DEL TAMAÑO ADECUADO DE LA MUESTRA

Toda investigación lleva implícito en la etapa de diseño, la determinación del tamaño adecuado de la muestra.

Estudios para determinar parámetros: μ, P

Estos estudios se aplican cuando se pretende realizar estimaciones de una media o de una proporción.

1. Cuando se desea estimar una media poblacional

Si la población es infinita:

Si la población es finita:

Page 43: ESTADISTICA - MSST

2. Cuando se desea estimar una proporción: P

Si la población es infinita:

Si la población es finita:

ERROR DE MUESTREO: A la diferencia entre el resultado obtenido de una muestra (estadístico) y el resultado, que deberíamos haber obtenido de la población (parámetro), se llama error de muestreo. Mientras más pequeño sea el error de muestreo, mayor es la precisión de la estimación.

ERROR ESTÁNDAR: A la desviación estándar de una distribución en el momento de un estadístico, se le llama error estándar del estadístico. A la desviación estándar de las medias de todas las muestras posibles del mismo tamaño, extraída de una población, se denomina el error estándar de la media. De igual manera, la desviación estándar de las proporciones de todas las muestras posibles, de igual tamaño, extraídas de una población, se denomina error estándar de la proporción.

Page 44: ESTADISTICA - MSST

DETERMINACIÓN DE LA MUESTRA PARA EVALUACIÓN DE DIFERENCIAS

Cuando únicamente se conoce el tamaño de la población

Variable cuantitativa

Variable cualitativa

Page 45: ESTADISTICA - MSST

PRUEBA DE HIPÓTESIS

Hipótesis estadística: Es una suposición o una conjetura concerniente a la población. Antes de aceptar o rechazar una hipótesis, todo investigador deberá probar la validez de la misma, puesto que puede o no ser verdadera. Un medio seguro de probar la hipótesis, sería un examen de la población, sin embargo, el examen puede llegar a ser imposible. Un modo práctico es probar la hipótesis usando una muestra de acuerdo con la teoría de la probabilidad. El resultado de la prueba conducirá a un estadístico, ya sea a aceptar la hipótesis o a rechazarla. La aceptación o rechazo conducirá al investigador a tomar una decisión.

División de la hipótesis estadística: La hipótesis estadística se divide en hipótesis nula y en hipótesis alternativa.

Hipótesis nula (H0): La hipótesis que es establecida para el propósito de posible rechazo o aceptación se le llama hipótesis nula.

Hipótesis alternativa (H1): Cualquier hipótesis que difiere de la hipótesis nula, es llamada una hipótesis alternativa. En una prueba dada, hay usualmente sólo una hipótesis nula, pero puede haber varias hipótesis alternativas.

Page 46: ESTADISTICA - MSST

Error tipo I (α): Consiste en rechazar una hipótesis nula, cuando realmente es verdadera.

Error tipo II (β): Consiste en aceptar una hipótesis nula, cuando realmente no es verdadera.

Nivel de significación: A la máxima probabilidad de cometer un error tipo I, especificada en una prueba de hipótesis, es llamado nivel de significación. El nivel de significación es usualmente especificado antes de que una prueba sea hecha. En la práctica, el valor de 5% y 1% son frecuentemente usados para establecer el nivel de significación.

Prueba de un extremo y dos extremosEl nivel de significación puede ser representado por una porción del área bajo la curva normal de 2 maneras:

a. Prueba de 2 colas o de 2 extremos: Cuando el nivel de significación está representado por ambos extremos de la curva normal.

b. Prueba de una cola o un extremo: Cuando el nivel de significación es representado por solamente un extremo de la curva normal, las pruebas son llamadas prueba de una cola o de un extremo.

Page 47: ESTADISTICA - MSST

Métodos para prueba de hipótesisLas pruebas de hipótesis son comúnmente hechas de acuerdo con las distribuciones ‘z’, t de Student y chi-cuadrado (x2).

Procedimiento para una prueba de hipótesis1. Se establece la hipótesis nula de la siguiente forma: no hay diferencia

entre los 2 valores dados, o la diferencia es cero. En otras palabras, se hace el supuesto que la diferencia entre los 2 valores dados es considerada como no significativa o no diferencia.

2. Expresar la diferencia en unidades del error estándar del estadístico como sigue:2.1Cuando n ≥ 30, se utiliza la prueba ‘z’

2.2 Para n < 30, se utiliza la prueba ‘t’ de Student

Si no conocemos P y Q, se trabaja con el pi de la muestra

Page 48: ESTADISTICA - MSST

3. Tomar decisión: La regla de decisión está basada en el nivel de significación ya sea para prueba de un extremo o para prueba de 2 extremos como sigue:3.1 Si el valor de z o de ‘t’ calculado, cae en la región de aceptación, se acepta la Ho.3.2 Si el valor de ‘z’ o de ‘t’ calculado, cae en la región de rechazo, se rechaza la Ho.

Page 49: ESTADISTICA - MSST

DIFERENCIA ENTRE LAS MEDIAS DE DOS POBLACIONES

1. Caso de muestras grandes:

2. Caso de muestras pequeñas:

Page 50: ESTADISTICA - MSST

3. Caso diferencias entre las medias de dos poblaciones:

Muestras apareadas

Page 51: ESTADISTICA - MSST

INFERENCIA ACERCA DE LA DIFERENCIA ENTRE LAS PROPORCIONES DE DOS

POBLACIONES

Para n ≥ 30

Page 52: ESTADISTICA - MSST

PRUEBA CHI-CUADRADO X2

La prueba chi-cuadrado es frecuentemente usada para probar hipótesis concernientes a la diferencia entre un conjunto de frecuencias observadas de una muestra y un conjunto correspondiente de frecuencias teóricas o esperadas.

O = Frecuencia observadaE = Frecuencia esperada

PRUEBAS PARA TABLAS DE CONTINGENCIA: Una tabla de contingencia es una tabla cruzada o de doble entrada que muestra las frecuencias observadas de una muestra. El número de grados de libertad en una tabla de contingencia es igual a:

r = Nº de filask = Nº de columnas

Page 53: ESTADISTICA - MSST

Las tablas de contingencia son frecuentemente usadas en pruebas de independencia. Este tipo de pruebas nos dirá si son o no independientes las dos bases de clasificación, usadas respectivamente en hileras y columnas de una tabla de contingencia.

La tabla se emplea de la manera usual, siempre que cada frecuencia esperada no sea demasiado pequeña, preferiblemente cinco o mas.

A la suma de las frecuencias en cada fila o en cada columna se le llama frecuencia marginal.

Page 54: ESTADISTICA - MSST

ANÁLISIS DE VARIANZA

Las pruebas de hipótesis z y ‘t’ de student se utilizan para efectuar test de significación referentes a las medias de dos muestras independientes. Si hay más de 2 muestras, dichos test no son aplicables. Para estos casos, el método adecuado es el análisis de varianza, que permite efectuar test de significación para más de 2 muestras independientes.

El análisis de varianza implica el cálculo de la distribución F, que se define como el cociente o la relación existente entre la varianza entre las medias de las muestras y la varianza dentro de las medias.

N = Total de variantes de todas las muestrasK = Es el número de muestras a las que se aplica el test

Page 55: ESTADISTICA - MSST

Ejemplo: Para evaluar los conocimientos de sus empleados acerca de la administración de la calidad total, la compañía ABC, tomó una muestra aleatoria de 6 empleados en cada planta y se les sometió a un examen sobre la calidad. Las calificaciones se presentan a continuación.¿Probar la hipótesis que la calificación promedio para las 3 plantas son iguales?

α= 5%

EmpleadoPlanta 1B/quilla

Planta 2Cali

Planta 3Medellín

1 85 71 59

2 75 75 64

3 82 73 62

4 76 74 69

5 71 69 75

6 85 82 67