estadistica inferencial

download estadistica inferencial

If you can't read please download the document

  • date post

    30-Jul-2015
  • Category

    Education

  • view

    2.571
  • download

    7

Embed Size (px)

Transcript of estadistica inferencial

2. HOJA 1 DE 9 RESUMEN DE DATOS NUMRICOS Medidas de Tendencia Central: Las medidas de tendencia central proporcionan informacin acerca de los valores cntricos de una variable a estudiar. Los valores medios nos darn una idea esencial a cerca del comportamiento de la variable, por ejemplo el promedio de los datos.

  • Media Geomtrica.
  • Mediana.
  • Moda.
  • Media Aritmtica.

Las medidas de tendencia central como su nombre lo dice son clculos o evaluaciones que nos proporcionan idea del comportamiento del fenmeno en la parte cntrica de ste. En otras palabras las medidas de tendencia central se ocupan de medir el centro, el foco o el medio de un fenmeno. Algunas medidas son las siguientes: 3. HOJA 2 DE 9 Es la medida ms obvia que se puede elegir, es el valor obtenido de sumar las observaciones y dividir esta suma por el nmero que hay en el grupo. Ejemplo: Calificaciones de 5 alumnos en una prueba: Alumno No.Calificacin 160entonces se suman las Calificaciones: 25460+54+31+70+62=277 331Luego el total se divide por la cantidad de alumnos: 470277/5=55.4 562LA MEDIA ARITMTICA EN ESTE PROBLEMA SERIA 55.4 La Media Aritmtica: Medidas de Tendencia Central 4. HOJA 3 DE 9 Lamedia geomtricade una cantidad finita de nmeros (digamosnnmeros) es la razn -sima del producto de todos los nmeros.La media geomtrica de 2 y 18 es La Media Geomtrica: Medidas de Tendencia Central La media de 1, 3 y 9 seria Slo es relevante la media geomtrica si todos los nmeros son positivos. Si uno de ellos es 0, entonces el resultado es 0. Si hay un nmero negativo (o una cantidad impar de ellos) entonces la media geomtrica es, o bien negativa o bien inexistente en los nmeros reales. X1 . X2 .Xn = n i=1 n X= n xi 6 2 2 2 . 18 = 36 = 3 3 3 1 . 3. 9 = 27 = 5. HOJA 4 DE 9 Dentro de la rama de medidas de tendencia central en estadstica descriptiva, y considerando los datos de una muestra ordenada en orden creciente (de menor a mayor), definiremos comomedianaal valor de la variable que deja el mismo nmero de datos antes y despus que l. De acuerdo con esta definicin el conjunto de datos menores o iguales que la mediana representarn el 50% de los datos, y los que sean mayores que la mediana representarn el otro 50% del total de datos de la muestra. La Mediana: Matemticamente hablando lamedianasera: Me = (Xn +1)/2 , si n es impar > Me ser la observacin central de los valores, una vez que estos han sido ordenados en orden creciente o decreciente. Me = (Xn/2 + Xn/2+1)/2, si n es par > Me ser el promedio aritmtico de las dos observaciones centrales. 6. HOJA 5 DE 9 La Mediana: En nuestro ejemplo, 21 (frecuencia absoluta acumulada para Xi = 5) > 19.5 con lo que Me = 5 puntos (es aconsejable no olvidar las unidades; en este caso como estamos hablando de calificaciones, sern puntos). La mitad de la clase ha obtenido un 5 o menos, y la otra mitad un 5 o ms. Primero hallamos las frecuencias absolutas acumuladas Fi (ver tabla del margen derecho). As, aplicando la formula asociada a la mediana para n impar, obtenemos X(39+1)/2 = X20 y basndonos en la frmula que hace referencia a las frecuencias absolutas> Ni-1< n/2 < Ni = N19 < 19.5 < N20 7. HOJA 6 DE 9 La Mediana: Con lo cual la mediana ser la media aritmtica de los valores de la variable que ocupen el decimonoveno y el vigsimo lugar. En nuestro ejemplo, el lugar decimonoveno lo ocupa el 5 y el vigsimo el 6, (desde el vigsimo hasta el vigsimo octavo), con lo que Me = (5+6)/2 = 5,5 puntos. La mitad de la clase ha obtenido un 5,5 o menos y la otra mitad un 5,5 o ms Primero hallamos las frecuencias absolutas acumuladas Fi (ver tabla margen derecho). Si volvemos a utilizar la frmula asociada a la mediana para n par, obtenemos X(38/2) = X19 y basndonos en la frmula que hace referencia a las frecuencias absolutas > Ni-1< n/2 < Ni = N18 < 19 < N19 8. HOJA 7 DE 9 Medidas de Tendencia Central La Moda: Cuando en una distribucin de datos se encuentran tres o ms modas, entonces es multimodal. Donde la moda entonces es 6. En estadstica lamodaes el valor que cuenta con una mayor frecuencia en una distribucin de datos . Hablaremos de una distribucin bimodal de los datos, cuando encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta mxima. Ahora vamos a ver un ejemplo: 9.

  • Se llama medidas de dispersion aquellas que permiten retratar la distancia de los valores de la variable a un cierto valor central, o que permite identificar la concentracion de los datos en un cierto sector del recorrido de la variable. Se trata de variables cuantitativas.

10.

  • La dispersin mide que tan alejadas estan un conjunto de valores respecto a su media aritmtica, as, cuanto menos disperso sea el conjunto, mas cerca del valor medio se encontraran sus valores.

11.

  • Medidas de dispersin
  • La medida mas simple de dispersin es el rango o amplitud, es la diferencia entre el valor mas grande y el mas pequeo de un conjunto de valores.
  • Esta medida presenta problemas mas grande y el mas pequeo de un conjunto de valores.

12.

  • Esta medida al aumentar el numero de valores aumenta o se queda igual pero , nunca disminuye.
  • Por esto se idearon mejores modos de medir la dispersion.
  • Desviacion media
  • Varianza
  • Desviacion tipica o estandar.
  • Covarianza
  • Coeficiente de variacion.

13.

  • El conocimiento de la forma de la distribucion y del respectivo promedio de una coleccin de valores de una variable sirve para una idea clara de conformacion pero no de homogeneidad de cada uno de los valores con respecto a la medida de tendencia central aplicada.

14.

  • En el caso de las variables con valores que pueden definirse en terminos de alguna escala de medida de igual intervalo, puede usarse un tipo de indicador que permite apreciar el grado de dispersion o variabilidad existente en el grupo de variantes.

15.

  • Medidas de dispersion, por cuanto que estan referidasa la variabilidad que exiben los valores de la observaciones ya que si no hay variabilidado dispersion en los datosinteres entonces no habria necesidad de la gran mayoria de las medidas de estadistica descriptiva.

16.

  • Las medidas de dispersion cuantifican la separacion, la dispersion, la variabilidad de los valores de la distribucion respecto al valor central.

17.

  • Aligual que sucede con cualquier conjunto de datos, la media, la mediana y la moda solo nos revelan una parte de la informacion que necesitamos acerca de las caracteristicas de los datos .
  • Debemos medir tambien su dispersion, extension o variabilidad.

18.

  • La dispersion .
  • Proporciona informacion adicional que permite juzgar la confiabilidad de la medida de tendencia central
  • Quiza se desee comparar las dispersiones de diferentes muestras. si no se desea tener una amplia dispersion de valores con respecto al centro de distribucion o presente riesgos inaceptables.

19.

  • Es la medida de variabilidad mas facil de calcular, para datos finitos o sin agrupar el rango se define como la diferencia entre el valor mas alto(X n X max. ) y el mas bajo (X 1 X min ) en un conjunto de datos.
  • Rango para datos no agrupados;
  • R = X mx. - X mn = X n -X 1
  • Ejemplo:
  • Se tienen las edades de cinco estudiantes universitarios de Ier ao, a saber: 18,23, 27,34 y 25., para calcular la media aritmtica (promedio de las edades, se tiene que:
  • R = X n -X 1) = 34-18 = 16 aos
  • Con datos agrupados no se saben los valores mximos y mnimos. Si no hay intervalos de clases abiertos podemos aproximar el rango mediante el uso de loslmitesde clases. Se aproxima el rango tomando el limite superior de la ltimaclasemenos el limite inferior de la primera clase.

20.

  • Rango para datos agrupados;
  • R= (lim. Sup. de la clase n lim. Inf. De la clase 1)
  • Ejemplo:
  • Si se toman los datos del ejemplo resuelto al construir la tabla de distribucin de frecuencia de lascuentas por cobrardeCabreras y Asociadosque fueron los siguientes :

Clases P.M. X i f i fr fa fa fra fra 7.420 21.835 14.628 100.33 10 30 0.33 1.00 21.835 36.250 29.043 4 0.13 14 20 0.46 0.67 36.250 50.665 43.458 5 0.17 19 16 0.63 0.54 50.665 65.080 57.873 3 0.10 22 11 0.73 0.37 65.080 79.495 72.288 3 0.10 25 8 0.83 0.27 79.495 93.910 86.703 5 0.17 30 5 1.00 0.17 Total XXX 30 1.00 XXX XXX XXX XXX 21.

    • El recorrido es la medida de dispersin ms sencilla de calcular e interpretar puesto que simplemente es la distancia entre losvaloresextremos (mximo y mnimo) en una distribucin
    • Puesto que el recorrido se basa enlos valoresextremos ste tiendeser errtico. No es extrao que en una distribucin dedatoseconmicos o comerciales incluya a unos pocos valores en extremo pequeos o grandes.

22.

  • Cuando tal cosa sucede, entonces el recorrido solamente mide la dispersin con respecto a esos valores anormales, ignorando a los dems valores de la variable

23. El intervalo de confianza describe la variabilidad entre la medida obtenida en un estudio y la medida real de la poblacin(el valorreal). corresponde a un rango de valores, cuya distribucin esnormal y en el cual se encuentra, con alta probabilidad, el valor real de una determinada var