estadistica inferencial

42

Click here to load reader

Transcript of estadistica inferencial

Page 1: estadistica inferencial
Page 2: estadistica inferencial

HOJA 1 DE 9

RESUMEN DE DATOS NUMÉRICOSMedidas de Tendencia Central:

Las medidas de tendencia central proporcionan información acerca de los valores céntricos de una variable a estudiar.  Los valores medios nos darán una idea esencial a cerca del comportamiento de la variable, por ejemplo el promedio de los datos.

Media Geométrica.

Mediana.

Moda.

Media Aritmética.

Las medidas de tendencia central como su nombre lo dice son cálculos o evaluaciones que nos proporcionan idea del comportamiento del fenómeno en la parte céntrica de éste. En otras palabras las medidas de tendencia central se ocupan de medir el centro, el foco o el medio de un fenómeno.Algunas medidas son las siguientes:

Page 3: estadistica inferencial

HOJA 2 DE 9

Es la medida más obvia que se puede elegir, es el valor obtenido de sumar las observaciones y dividir esta suma por el número que hay en el grupo. Ejemplo:

Calificaciones de 5 alumnos en una prueba: Alumno No. Calificación 1 60 entonces se suman las Calificaciones: 2 54 60+54+31+70+62=277 3 31 Luego el total se divide por la cantidad de alumnos: 4 70 277/5=55.4 5 62 LA MEDIA ARITMÉTICA EN ESTE PROBLEMA SERIA 55.4

La Media Aritmética:

Medidas de Tendencia Central

Page 4: estadistica inferencial

HOJA 3 DE 9

La media geométrica de una cantidad finita de números (digamos n números) es la raíz n-ésima del producto de todos los números .

La media geométrica de 2 y 18 es

La Media Geométrica:

Medidas de Tendencia Central

La media de 1, 3 y 9 seria

Sólo es relevante la media geométrica si todos los números son positivos. Si uno de ellos es 0, entonces el resultado es 0. Si hay un número negativo (o una cantidad impar de ellos) entonces la media geométrica es, o bien negativa o bien inexistente en los números reales.

π X1 . X2 ….Xn=n

i=1

nX=

nxi

622 2 . 18 = 36 =

333 1 . 3. 9 = 27 =

Page 5: estadistica inferencial

HOJA 4 DE 9

Dentro de la rama de medidas de tendencia central en estadística descriptiva, y considerando los datos de una muestra ordenada en orden creciente (de menor a mayor), definiremos como mediana al valor de la variable que deja el mismo número de datos antes y después que él. De acuerdo con esta definición el conjunto de datos menores o iguales que la mediana representarán el 50% de los datos, y los que sean mayores que la mediana representarán el otro 50% del total de datos de la muestra.

La Mediana:

Matemáticamente hablando la mediana sería: Me = (Xn +1)/2 , si n es impar > Me será la observación central de los valores, una vez que estos han sido ordenados en orden creciente o decreciente.

Me = (Xn/2 + Xn/2+1)/2, si n es par > Me será el promedio aritmético de las dos observaciones centrales.

Page 6: estadistica inferencial

HOJA 5 DE 9

La Mediana:

En nuestro ejemplo, 21 (frecuencia absoluta acumulada para Xi = 5) > 19.5 con lo que Me = 5 puntos (es aconsejable no olvidar las unidades; en este caso como estamos hablando de calificaciones, serán puntos).La mitad de la clase ha obtenido un 5 o menos, y la otra mitad un 5 o más.

Ejemplo ( N impar )

Las calificaciones en la asignatura de Matemáticas de

39 alumnos de una clase viene dada por la siguiente

tabla (debajo):

Calificaciones 1 2 3 4 5 6 7 8 9

Número de alumnos 2 2 4 5 8 9 3 4 2

Calculemos la Mediana:

xi fi Fi

1 2 2

2 2 4

3 4 8

4 5 13

5 8 21 > 19.5

6 9 30

7 3 33

8 4 37

9 2 39

Primero hallamos las frecuencias absolutas acumuladas Fi (ver tabla del margen derecho). Así, aplicando la formula asociada a la mediana para n impar, obtenemos X(39+1)/2 = X20 y basándonos en la fórmula que hace referencia a las frecuencias absolutas > Ni-1< n/2 < Ni = N19 < 19.5 < N20

Page 7: estadistica inferencial

HOJA 6 DE 9

La Mediana:

Con lo cual la mediana será la media aritmética de los valores de la variable que ocupen el decimonoveno y el vigésimo lugar. En nuestro ejemplo, el lugar decimonoveno lo ocupa el 5 y el vigésimo el 6, (desde el vigésimo hasta el vigésimo octavo), con lo que Me = (5+6)/2 = 5,5 puntos.La mitad de la clase ha obtenido un 5,5 o menos y la otra mitad un 5,5 o más

Primero hallamos las frecuencias absolutas acumuladas Fi (ver tabla margen derecho). Si volvemos a utilizar la fórmula asociada a la mediana para n par, obtenemos X(38/2) = X19 y basándonos en la fórmula que hace referencia a las frecuencias absolutas > Ni-1< n/2 < Ni = N18 < 19 < N19

Ejemplo ( N par )

Las calificaciones en la asignatura de Matemáticas de 38 alumnos de

una clase viene dada por la siguiente tabla (debajo):

Calificaciones 1 2 3 4 5 6 7 8 9

Número de alumnos 2 2 4 5 6 9 4 4 2

Calculemos la Mediana:

xi fi Fi

1 2 2

2 2 4

3 4 8

4 5 13

5 6 19 = 19

6 9 28

7 4 32

8 4 36

9 2 38

Page 8: estadistica inferencial

HOJA 7 DE 9

Medidas de Tendencia Central

La Moda:

Cuando en una distribución de datos se encuentran tres o más modas, entonces es multimodal.

Donde la moda entonces es 6.

En estadística la moda es el valor que cuenta con una mayor frecuencia en una distribución de datos.

Hablaremos de una distribución bimodal de los datos, cuando encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta máxima.

Las calificaciones en la asignatura de Matemáticas de 38 alumnos de una

clase viene dada por la siguiente tabla (debajo):

Vemos que el valor más repetido de calificaciones de alumnos es la nota 6,

con un total de 9 alumnos.

Ahora vamos a ver un ejemplo:

Page 9: estadistica inferencial

Se llama medidas de dispersion Se llama medidas de dispersion aquellas que permiten retratar la aquellas que permiten retratar la distancia de los valores de la variable a distancia de los valores de la variable a un cierto valor central, o que permite un cierto valor central, o que permite identificar la concentracion de los identificar la concentracion de los datos en un cierto sector del recorrido datos en un cierto sector del recorrido de la variable. Se trata de variables de la variable. Se trata de variables cuantitativas.cuantitativas.

Page 10: estadistica inferencial

La dispersión mide que tan alejadas La dispersión mide que tan alejadas estan un conjunto de valores respecto estan un conjunto de valores respecto a su media aritmética, así, cuanto a su media aritmética, así, cuanto menos disperso sea el conjunto, mas menos disperso sea el conjunto, mas cerca del valor medio se encontraran cerca del valor medio se encontraran sus valores.sus valores.

Page 11: estadistica inferencial

Medidas de dispersiónMedidas de dispersión La medida mas simple de dispersión es La medida mas simple de dispersión es

el rango o amplitud, es la diferencia el rango o amplitud, es la diferencia entre el valor mas grande y el mas entre el valor mas grande y el mas pequeño de un conjunto de valores.pequeño de un conjunto de valores.

Esta medida presenta problemas mas Esta medida presenta problemas mas grande y el mas pequeño de un grande y el mas pequeño de un conjunto de valores.conjunto de valores.

Page 12: estadistica inferencial

Esta medida al aumentar el numero de valores Esta medida al aumentar el numero de valores aumenta o se queda igual pero , nunca aumenta o se queda igual pero , nunca disminuye.disminuye.

Por esto se idearon mejores modos de medir la Por esto se idearon mejores modos de medir la dispersion.dispersion.

- Desviacion mediaDesviacion media- VarianzaVarianza- Desviacion tipica o estandar.Desviacion tipica o estandar.- CovarianzaCovarianza- Coeficiente de variacion.Coeficiente de variacion.

Page 13: estadistica inferencial

El conocimiento de la forma de la El conocimiento de la forma de la distribucion y del respectivo promedio distribucion y del respectivo promedio de una colección de valores de una de una colección de valores de una variable sirve para una idea clara de variable sirve para una idea clara de conformacion pero no de conformacion pero no de homogeneidad de cada uno de los homogeneidad de cada uno de los valores con respecto a la medida de valores con respecto a la medida de tendencia central aplicada.tendencia central aplicada.

Page 14: estadistica inferencial

En el caso de las variables con valores En el caso de las variables con valores que pueden definirse en terminos de que pueden definirse en terminos de alguna escala de medida de igual alguna escala de medida de igual intervalo, puede usarse un tipo de intervalo, puede usarse un tipo de indicador que permite apreciar el indicador que permite apreciar el grado de dispersion o variabilidad grado de dispersion o variabilidad existente en el grupo de variantes.existente en el grupo de variantes.

Page 15: estadistica inferencial

Medidas de dispersion, por cuanto que Medidas de dispersion, por cuanto que estan referidas a la variabilidad que estan referidas a la variabilidad que exiben los valores de la observaciones exiben los valores de la observaciones ya que si no hay variabilidad o ya que si no hay variabilidad o dispersion en los datos interes dispersion en los datos interes entonces no habria necesidad de la entonces no habria necesidad de la gran mayoria de las medidas de gran mayoria de las medidas de estadistica descriptiva.estadistica descriptiva.

Page 16: estadistica inferencial

Las medidas de dispersion cuantifican Las medidas de dispersion cuantifican la separacion, la dispersion, la la separacion, la dispersion, la variabilidad de los valores de la variabilidad de los valores de la distribucion respecto al valor central.distribucion respecto al valor central.

Page 17: estadistica inferencial

Al igual que sucede con cualquier Al igual que sucede con cualquier conjunto de datos, la media, la conjunto de datos, la media, la mediana y la moda solo nos revelan mediana y la moda solo nos revelan una parte de la informacion que una parte de la informacion que necesitamos acerca de las necesitamos acerca de las caracteristicas de los datos .caracteristicas de los datos .

Debemos medir tambien su dispersion, Debemos medir tambien su dispersion, extension o variabilidad.extension o variabilidad.

Page 18: estadistica inferencial

La dispersion .La dispersion . Proporciona informacion adicional que Proporciona informacion adicional que

permite juzgar la confiabilidad de la permite juzgar la confiabilidad de la medida de tendencia centralmedida de tendencia central

Quiza se desee comparar las Quiza se desee comparar las dispersiones de diferentes muestras. si dispersiones de diferentes muestras. si no se desea tener una amplia no se desea tener una amplia dispersion de valores con respecto al dispersion de valores con respecto al centro de distribucion o presente centro de distribucion o presente riesgos inaceptables.riesgos inaceptables.

Page 19: estadistica inferencial

Es la medida de variabilidad mas facil de calcular, para datos Es la medida de variabilidad mas facil de calcular, para datos finitos o sin agrupar el rango se define como la diferencia entre el finitos o sin agrupar el rango se define como la diferencia entre el valor mas alto(Xvalor mas alto(Xnn ó X ó Xmax.max.) y el mas bajo (X) y el mas bajo (X11 ó X ó Xminmin) en un conjunto ) en un conjunto de datos.de datos.

Rango para datos no agrupados;Rango para datos no agrupados; R = XR = Xmáx.máx.--XXmínmín = X= Xnn-X-X11

Ejemplo:Ejemplo: Se tienen las edades de cinco estudiantes universitarios de Ier Se tienen las edades de cinco estudiantes universitarios de Ier

año, a saber: 18,23, 27,34 y 25., para calcular la media año, a saber: 18,23, 27,34 y 25., para calcular la media aritmética (promedio de las edades, se tiene que:aritmética (promedio de las edades, se tiene que:

R = XR = Xnn-X-X11 ) = 34-18 = 16 años ) = 34-18 = 16 años Con datos agrupados no se saben los valores máximos y Con datos agrupados no se saben los valores máximos y

mínimos. Si no hay intervalos de clases abiertos podemos mínimos. Si no hay intervalos de clases abiertos podemos aproximar el rango mediante el uso de los aproximar el rango mediante el uso de los límites de clases. Se de clases. Se aproxima el rango tomando el limite superior de la última clase aproxima el rango tomando el limite superior de la última clase menos el limite inferior de la primera clase.menos el limite inferior de la primera clase.

Page 20: estadistica inferencial

Rango para datos agrupados;Rango para datos agrupados; R= (lim. Sup. de la clase n – lim. Inf. De la clase 1)R= (lim. Sup. de la clase n – lim. Inf. De la clase 1) Ejemplo:Ejemplo: Si se toman los datos del ejemplo resuelto al construir la tabla de Si se toman los datos del ejemplo resuelto al construir la tabla de

distribución de frecuencia de las cuentas por cobrar de distribución de frecuencia de las cuentas por cobrar de Cabrera’s y Cabrera’s y AsociadosAsociados que fueron los siguientes que fueron los siguientes::

Clases P.M.

Xi

fi fr fa↓ fa↑ fra↓ fra↑

7.420 – 21.835

14.628 10 0.33 10 30 0.33 1.00

21.835 – 36.250

29.043 4 0.13 14 20 0.46 0.67

36.250 – 50.665

43.458 5 0.17 19 16 0.63 0.54

50.665 – 65.080

57.873 3 0.10 22 11 0.73 0.37

65.080 – 79.495

72.288 3 0.10 25 8 0.83 0.27

79.495 – 93.910

86.703 5 0.17 30 5 1.00 0.17

Total XXX 30 1.00 XXX XXX XXX XXX

Page 21: estadistica inferencial

› El recorrido es la medida de dispersión más El recorrido es la medida de dispersión más sencilla de calcular e interpretar puesto que sencilla de calcular e interpretar puesto que simplemente es la distancia entre los valores simplemente es la distancia entre los valores extremos (máximo y mínimo) en una extremos (máximo y mínimo) en una distribución distribución

› Puesto que el recorrido se basa en los valores Puesto que el recorrido se basa en los valores extremos éste tiende ser errático. No es extremos éste tiende ser errático. No es extraño que en una distribución de datos extraño que en una distribución de datos económicos o comerciales incluya a unos económicos o comerciales incluya a unos pocos valores en extremo pequeños o pocos valores en extremo pequeños o grandes. grandes.

Page 22: estadistica inferencial

Cuando tal cosa sucede, entonces el Cuando tal cosa sucede, entonces el recorrido solamente mide la dispersión recorrido solamente mide la dispersión con respecto a esos valores anormales, con respecto a esos valores anormales, ignorando a los demás valores de la ignorando a los demás valores de la variablevariable

Page 23: estadistica inferencial

El intervalo de confianza describe la variabilidad entre la medida obtenida en un estudio y la medida real de la población(el valor real). corresponde a un rango de valores, cuya distribución es normal y en el cual se encuentra, con alta probabilidad, el valor real de una determinada variable.

Esta “alta probabilidad” se ha establecido por consenso en 95%. Así como un intervalo de confianza del 95% nos indica que dentro del rango dado se encuentra el valor real de un parámetro con 95% de certeza.

Page 24: estadistica inferencial

Existen tres factores que determinan el tamaño del intervalo de confianza para un determinado nivel de confianza, estos son: TAMAÑO DE LA MUESTRA: Cuanto mas grande sea la muestra mayor precisión igual de población autentica grande.

PORCENTAJE DE LA MUESTRA : Ej. En una población de 100 personas se le realiza una pregunta cuya respuesta es si o no y el 99% dice si y el 1% dice no la probabilidad del error son remotas. Si el 51% contesta si y el 49 contesta no la probabilidad de error es mas grande.

TAMAÑO DE LA POBLACIÓN: Es relevante cuando se trabaja con un grupo de personas relativamente pequeñas.

Page 25: estadistica inferencial
Page 26: estadistica inferencial

La varianza es una medida de dispersión relativa a algún punto de referencia. Ese punto de referencia es la media aritmética de la distribución. Más específicamente, la varianza es una medida de que tan cerca, o que tan lejos están los diferentes valores de su propia media aritmética.

Page 27: estadistica inferencial

Cuando más lejos están las Xi de su propia media aritmética, mayor es la varianza; cuando más cerca estén las Xi a su media menos es la varianza. Y se define y expresa matemáticamente de la siguiente manera:

Page 28: estadistica inferencial

La varianza para datos no agrupados

Dado un conjunto de observaciones, tales como X1, X2, … , Xn, la varianza denotada usualmente por la letra minúscula griega δ (sigma) elevada al cuadrado (δ2)y en otros casos S2 según otros analistas, se define como: el cuadrado medio de las desviaciones con respecto a su media aritmética“

Matemáticamente, se expresa como:

Page 29: estadistica inferencial

Ejemplo: Se tienen las edades de cinco

estudiantes universitarios de Ier año, a saber: 18,23, 25, 27, y 34. Al calcular la media aritmética (promedio de las edades, se obtuvo 25.4 años, encontrar la varianza de las edades de estos estudiantes:

Para calcular se utiliza una tabla estadística de trabajo de la siguiente manera:

Page 30: estadistica inferencial
Page 31: estadistica inferencial

La varianza para datos agrupados Si en una tabla de distribución de

frecuencias. Los puntos medios de las clases son X1, X2, … , Xn; y las frecuencias de las clases f1, f2, … , fn; la varianza se calcula así:

Σ(Xi-)2f1δ2 = ----------------

Σfi

Page 32: estadistica inferencial

Sin embargo la formula anterior tiene algún inconveniente para su uso en la practica, sobre todo cuando se trabaja con números decimales o cuando la media aritmética es un número entero. Asimismo cuando se trabaja con máquinas calculadoras, La tarea de computar la varianza se simplifica utilizando la formula de computación que se da a continuación:

ΣXi2fi - [(ΣXifi)2/N] δ2 = ---------------------------- N donde N=Σfi

Page 33: estadistica inferencial

Es una medida de la cantidad típica en la que los valores del conjunto de datos difieren de la media.

Es la medida de dispersión más utilizada, se le llama también desviación típica. La desviación estándar siempre se calcula con respecto a la media y es un mínimo cuando se estima con respecto a este valor.

Page 34: estadistica inferencial

Se calcula de forma sencilla, si se

conoce la varianza, por cuanto que es la raíz cuadrada positiva de esta. A la desviación se le representa por la letra minúscula griega "sigma" ( δ ) ó por la letra S mayúscula, según otros analistas.

Cálculo de la Desviación Estándar δ = √δ2 ó S = √S2

Page 35: estadistica inferencial

Ejemplo:

Del calculo de la varianza de las edades de cinco estudiantes universitarios de primer año se obtuvo δ2=27.44, como la desviación estándar es la raíz cuadrada positiva, entonces δ = √27.44 = 5.29 años.

Page 36: estadistica inferencial

Igual procedimiento se aplica para encontrar le desviación estándar de las cuentas por cobrar de la Tienda Cabrera’s y Asociados, recordemos que la varianza obtenida fue de 721.645, luego entonces la desviación estándar es igual a δ =√721.645 = 26.86 balboas.

Page 37: estadistica inferencial

› Propiedades de la Desviación Estándar

A su vez la desviación estándar, también tiene una serie de propiedades que se deducen fácilmente de las de la varianza (ya que la desviación típica es la raíz cuadrada positiva de la varianza):

› La desviación estándar es siempre un valor no negativo S será siempre ³ 0 por definición. Cuando S = 0 è X = xi (para todo i).

Page 38: estadistica inferencial

› Es la medida de dispersión óptima por ser la más pequeña.

› La desviación estándar toma en cuenta las desviaciones de todos los valores de la variable

› Si a todos los valores de la variable se le suma una misma constante la desviación estándar no varía.

› Si a todos los valores de la variable se multiplican por una misma constante, la desviación estándar queda multiplicada por el valor absoluto de dicha constante.

Page 39: estadistica inferencial
Page 40: estadistica inferencial

Cuando se quiere comparar el grado de dispersión de dos distribuciones que no vienen dadas en las mismas unidades o que las medias no son iguales se utiliza el llamado "Coeficiente de Variación de Pearson", del que e demuestra que nos da un número independiente de las unidades de medidas empleadas, por lo que entre dos distribuciones dadas diremos que posee menor dispersión aquella cuyo coeficiente de variación sea menor., y que se define como la relación por cociente entre la desviación estándar y la media aritmética; o en otras palabras es la desviación estándar expresada como porcentaje de la media aritmética.

Page 41: estadistica inferencial

Donde: C.V. representa el número de veces que la desviación típica contiene a la media aritmética y por lo tanto cuanto mayor es CV mayor es la dispersión y menor la representatividad de la media.

Page 42: estadistica inferencial

Propiedades del Coeficiente de Variación :

› Entonces, si a todos los valores de la variable se le suma una misma constante el coeficiente de variación queda alterado .