Sesion 1 Estadistica Aplicada

29

Transcript of Sesion 1 Estadistica Aplicada

Page 1: Sesion 1 Estadistica Aplicada
Page 2: Sesion 1 Estadistica Aplicada

Cuando vamos a utilizar la estadística es necesario hacer referencia al conjunto de elementos de los que vamos a obtener los datos. Este conjunto es lo que denominaremos población, pero teniendo en cuenta que pueden ser objetos, tiempo, etc. y no sólo a personas, como utilizamos en el lenguaje habitual. Otra forma de denominarlo es universo.

Población Estadística : Conjunto finito o infinito de elementos, sobre los que vamos a realizar observaciones. Por ejemplo: los habitantes de un lugar, las piezas obtenidas de una máquina en un determinado tiempo, etc.

Page 3: Sesion 1 Estadistica Aplicada

A efectos prácticos, se estudia un subconjunto o muestra a partir de la cual extrapolamos los resultados al resto de la población. En general, cuanto mayor es la muestra mejores son los resultados que podemos obtener. Por ejemplo: si queremos analizar la resistencia de las piezas producidas por una máquina en un determinado periodo de tiempo es evidente que no podemos probar todas las piezas porque las vamos a dañar debemos seleccionar sólo una parte de ellas.

Por otro lado no podemos elegir la muestra que queramos sin más, para poder extrapolar los resultados es necesario que cumpla unos requisitos que la conviertan en estadísticamente significativa.

Page 4: Sesion 1 Estadistica Aplicada

Las características a tomar en cuenta son: •Representativa: se refiere a que todos y cada uno de los elementos de la población tengan la misma oportunidad de ser tomados en cuenta para formar dicha muestra. •Adecuada y válida: se refiere a que la muestra debe ser obtenida de tal manera que permita establecer un mínimo de error posible respecto de la población. Por ejemplo, si analizamos las piezas producidas por dos máquinas de forma simultánea e igual número, debemos obtener una muestra en la que ambas estén representadas en la misma proporción.

Page 5: Sesion 1 Estadistica Aplicada

Calculo de Tamaño de Muestra para Población Finita: Consideraremos una población Finita aquella cuyo total no excede los 5000 elementos. Parámetros E: Error muestral permitido. Z: Valor del estadístico en base al nivel de confianza N: Valor de la Población P: Probabilidad de éxito. Q: Probabilidad de falla (Q= 1-P) Z² * P* Q*N E² (N-1) + Z² * P* Q

Page 6: Sesion 1 Estadistica Aplicada

Calculo de Tamaño de Muestra para Población Infinita: Consideraremos una población Finita aquella cuyo total excede los 5000 elementos. Parámetros E: Error muestral permitido. Z: Valor del estadístico en base al nivel de confianza N: Valor de la Población P: Probabilidad de éxito. Q: Probabilidad de falla (Q= 1-P) Z² * P* Q E²

Page 7: Sesion 1 Estadistica Aplicada

Ejemplo: Se pretende realizar un estudio dentro de la Empresa ABC sobre la satisfacción de los empleados a los horarios de almuerzo, por tanto se desea cursar una encuesta significativa con un coeficiente de confianza del 95%, se espera que la probabilidad de aceptación sea del 50% y se utilizara un estadístico Z de 1.96, con todo esto se le pide calcular la muestra mas representativa del total de los 900 empleados que corresponde a la planilla de la empresa. Datos: • Es Finita o Infinita la población? • E=? • Z= 1.96 • N= 900 • P= 50% • Q= ?

Z² * P* Q*N E² (N-1) + Z² * P* Q

Page 8: Sesion 1 Estadistica Aplicada

Ejemplo: Una empresa de publicidad desea medir la “recordación” de cierto spot publicitario que esta siendo transmitido dentro del municipio de San Salvador por tanto deciden hacer una encuesta utilizando un nivel de significancia del 99% que corresponde a un estadístico de Z igual a 2, acpetara un error del 2% y una probabilidad de éxito de 0.5 Datos: • Es Finita o Infinita la población? • E= 2% • Z= 2 • P= 0.5 • Q= ?

Z² * P* Q E²

Page 9: Sesion 1 Estadistica Aplicada

Muestra: Subconjunto finito de una población. El número de elementos que forman la muestra se denomina tamaño muestral.

Variable: Cada una de las características que pueden observarse de un elemento de la muestra

Siguiendo con nuestro ejemplo de las piezas se puede medir grosor, peso, resistencia, etc. Además de los datos a medir es necesario especificar, cuando sea preciso, la unidad de medida (por ejemplo, el grosor en centímetros o en milímetros).

Page 10: Sesion 1 Estadistica Aplicada

Las Variables las podemos dividir en dos tipos: Variables Cualitativas. Variables Cuantitativas.

Variables Cualitativas: Son las variables que expresan distintas cualidades, características o modalidad. Cada modalidad que se presenta se denomina atributo o categoría, y la medición consiste en una clasificación de dichos atributos. Las variables cualitativas pueden ser dicotómicas cuando sólo pueden tomar dos valores posibles, como sí y no, hombre y mujer o ser politómicas cuando pueden adquirir tres o más valores. Dentro de ellas podemos distinguir

Page 11: Sesion 1 Estadistica Aplicada

Variable cualitativa ordinal o variable cuasicuantitativa: La variable puede tomar distintos valores ordenados siguiendo una escala establecida, aunque no es necesario que el intervalo entre mediciones sea uniforme, por ejemplo: leve, moderado, fuerte. Variable cualitativa nominal: En esta variable los valores no pueden ser sometidos a un criterio de orden, como por ejemplo los colores.

Page 12: Sesion 1 Estadistica Aplicada

Variables cuantitativas Son las variables que toman como argumento, cantidades numéricas, son variables matemáticas. Las variables cuantitativas además pueden ser: • Variable discreta : Es la variable que presenta solo en un conjunto numerable. Ejemplo: El número de hijos (1, 2, 3, 4, 5). • Variable continua: Es la variable que puede adquirir cualquier valor dentro de un intervalo especificado de valores. Por ejemplo la masa (2,3 kg, 2,4 kg, 2,5 kg,...) o la altura (1,64 m, 1,65 m, 1,66 m,...).

Page 13: Sesion 1 Estadistica Aplicada

Se le llama distribución de frecuencias a la agrupación de datos en categorías mutuamente excluyentes que indican el número de observaciones en cada categoría, Esto proporciona un valor añadido a la agrupación de datos. La distribución de frecuencias presenta las observaciones clasificadas de modo que se pueda ver el número existente en cada clase. Estas agrupaciones de datos suelen estar agrupadas en forma de tablas.

Page 14: Sesion 1 Estadistica Aplicada

Tipos de Distribuciones de Frecuencia. Frecuencia Absoluta: La frecuencia absoluta es el número de veces que aparece un determinado valor en un estudio estadístico. Se representa por “fi”. La suma de las frecuencias absolutas es igual al número total de datos, que se representa por N.

Frecuencia Relativa: La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el número total de datos , se representa por “ni “, este valor siempre suma 1

Page 15: Sesion 1 Estadistica Aplicada

Tipos de Distribuciones de Frecuencia. Frecuencia Acumulada: La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado. Se representa por “Fi”

Frecuencia relativa Acumulada: La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y el número total de datos. Se puede expresar en tantos por ciento.

Page 16: Sesion 1 Estadistica Aplicada

Ejemplo: durante el mes de Julio se registraron las siguientes temperaturas en una ciudad del país: 32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.

Temperatura f Fi ni Ni

27 1 1 0.032 0.032

28 2 3 0.065 0.096

29 6 9 0.194 0.290

30 7 16 0.226 0.516

31 8 24 0.258 0.774

32 3 27 0.097 0.871

33 3 30 0.097 0.968

34 1 31 0.032 1

TOTAL 31 1

Page 17: Sesion 1 Estadistica Aplicada

La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables toman un número grande de valores o la variable es continua. Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente.

Dentro de este formato de distribución existen nuevas definiciones como:

Limite de Clase: Cada clase está delimitada por el límite inferior de la clase y el límite superior de la clase. Amplitud de Clase: La amplitud de la clase es la diferencia entre el límite superior e inferior de la clase. Marca de Clase: La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el cálculo de algunos parámetros

Page 18: Sesion 1 Estadistica Aplicada

Ejemplo: Se pide que construya una tabla de frecuencias sobre las edades de un grupo de personas de una comunidad. Los datos son: 3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13. Solución: 1. Calculo Rango, R= Xmax – Xmin 2. Número de intervalos, ni= 1 + 3.32 Log (n ) 3. Cálculo ancho del intervalo, I = R/ni 4. Se calcula un nuevo rango para ajustar los intervalos Rnuevo= i * ni

Page 19: Sesion 1 Estadistica Aplicada

Solución: 1. Calculo Rango, R= 48 – 3 = 45 2. Número de intervalos, ni= 1 + 3.32 Log (40 ) = 6,32 = 6 3. Cálculo ancho del intervalo, I = R/ni i = 45/6 = 7.5 = 8 4. Rnuevo= i * ni , Rnuevo= 6 * 8 = 48

Intervalo Ci fi Fi ni Ni

2-9 5.5 2 2 0.05 0.05

10-17 13.5 6 8 0.15 0.2

18-25 21.5 4 12 0.1 0.3

26-33 29.5 9 21 0.225 0.525

34-41 37.5 14 35 0.35 0.875

42-49 45.5 5 40 0.125 1

Total 40 1

Page 20: Sesion 1 Estadistica Aplicada

Grafico de Barras: Este gráfico es útil para representar datos categóricos nominales u ordinales. A cada categoría o clase de la variable se le asocia una barra cuya altura representa la frecuencia o la frecuencia relativa de esa clase. Las barras difieren sólo en altura, no en ancho.

Page 21: Sesion 1 Estadistica Aplicada

Histograma: El histograma es el más conocido de los gráficos para resumir un conjunto de datos numéricos, Para construir un histograma es necesario previamente construir una tabla de frecuencias.

Page 22: Sesion 1 Estadistica Aplicada

Polígono de Frecuencia: El polígono de frecuencias es similar al histograma en muchos aspectos, pero pretende dar una imagen aproximada de la “curva” definida por la distribución de la variable. Para construirlo se usan los mismos ejes que en el histograma. Se indica en la escala horizontal el punto medio de cada intervalo y en la escala vertical la escala densidad para ese intervalo, esto define pares (x, y) en el gráfico que se unen con tramos de líneas rectas.

Page 23: Sesion 1 Estadistica Aplicada

Pastel: En este gráfico, ampliamente utilizado, se representa la frecuencia relativa de cada categoría como una porción de un círculo, en la que el ángulo se corresponde con la frecuencia relativa correspondiente.

Page 24: Sesion 1 Estadistica Aplicada

Pictograma: En este gráfico, se utilizan figuras o diseños para representar los datos según sea el caso, en esencia es un grafico de barras pero que sustituye las barras por figuras.

Page 25: Sesion 1 Estadistica Aplicada

Hay muchas y variadas razones para realizar un muestrea y de una u otras formas todas están relacionadas con el tiempo, el presupuesto, la confiabilidad y calidad de la información. Dentro de estas razones listaremos algunas:

El costo de recopilar y procesar la información es menor cuanto menor unidades elementales se tomen. A veces analizar la población es físicamente imposible de realizar cuando el numero de unidades elementales es muy grande o cuando son inaccesibles. El muestreo puede proporcionar datos mas precisos que un censo. El costo de un muestreo es sumamente menor que un censo.

Page 26: Sesion 1 Estadistica Aplicada

Los diseños de muestreo se dividen en dos grandes grupos: Muestreo Aleatorio Muestreo no Aleatorio

Muestreo Aleatorio: se denomina también muestreo probabilístico, ya que se pueden emplear las leyes de la probabilidad. El termino aleatorio se refiere por el método empleado para seleccionar la muestra. • El Muestreo Aleatorio se subdivide en:

•Muestreo Aleatorio Simple. •Muestreo Sistemático •Muestreo Aleatorio Estratificado. • Muestreo por Conglomerado

Page 27: Sesion 1 Estadistica Aplicada

Muestreo Aleatorio Simple: Es un procedimiento de selección de una muestra por el cual todos y cada uno de los elementos de la población tienen igual probabilidad de ser incluidos en la muestra, entonces, si toda unidad disponible para observación tiene la misma probabilidad de ser escogida. Se dice que: “toda muestra aleatoria de igual tamaño, tomada de una población dada, ha de tener la misma probabilidad de ser tomada”. Existen dos formas de Muestreo Aleatorio Simple:

Con Reemplazo: que es aquel donde un elemento puede ser seleccionado más de una vez. Sin reemplazo: aquel en el que los elementos seleccionados no pueden volver a ser tomados en cuenta.

Page 28: Sesion 1 Estadistica Aplicada

Para seleccionar una muestra aleatoria es muy comun utilizar las tablas de números aleatorios

Page 29: Sesion 1 Estadistica Aplicada

Otro método es utilizando formulas de calculo de muestras

Donde: n : Valor de la muestra. σ: desviación típica. d: Error Z 1-α/2: Estadístico Ejemplo: se desea estimar el peso promedio de unos sacos de café que son llenados en una máquina, se conoce que el peso es una variable aleatoria, la desviación es 0.5 kg. Determine el tamaño de la muestra aleatoria si el nivel de significancia es 0.95 y el error es 0.1