Estadistica basica

download Estadistica basica

If you can't read please download the document

Transcript of Estadistica basica

  • 1. QQ Historia de la Estadstica Se cree que los orgenes de la estadstica estn ligados al antiguo Egipto y a los censos chinos hace unos 4000 aos, aproximadamente. Desde esa poca, diversos estados realizaron estudios sobre algunas caractersticas de sus poblaciones, sus riquezas, posesiones, etc. En 1662, John Graunt, un mercader Ingls, public un libro sobre los nacimientos y defunciones ocurridos en Londres; el libro tenia conclusiones acerca de ciertos aspectos relacionados con estos acontecimientos. Esta obra es considerada como el punto de partida de la estadstica moderna. Se cree que los orgenes de la estadstica estn ligados al antiguo Egipto y a los censos chinos hace unos 4000 aos, aproximadamente. Desde esa poca, diversos estados realizaron estudios sobre algunas caractersticas de sus poblaciones, sus riquezas, posesiones, etc. En 1662, John Graunt, un mercader Ingls, public un libro sobre los nacimientos y defunciones ocurridos en Londres; el libro tenia conclusiones acerca de ciertos aspectos relacionados con estos acontecimientos. Esta obra es considerada como el punto de partida de la estadstica moderna.

2. La palabra estadstica comenz a usarse en el siglo XVIII, en Alemania, en relacin a estudios donde los grandes nmeros, que representaban datos, eran de importancia para el estado. Sin embargo, la estadstica moderna se desarroll en el siglo XX a partir de los estudios de Karl Pearson. Hoy la estadstica tiene gran importancia, no slo por que presenta informacin, sino que adems permite inferir y y predecir lo que va a ocurrir, y por lo tanto, es una herramienta fundamental a la hora de tomar decisiones de importancia. Historia de la Estadstica 3. Conceptos Bsicos En muchas ocasiones, para llevar a cabo una investigacin se hacen encuestas, las cuales son dirigidas a una muestra representativa de la poblacin. Para comprender mejor este tipo de estudios es importante que conozcas los siguientes trminos bsicos: 4. POBLACION Es un conjunto de personas, eventos o cosas de las cuales se desea hacer un estudio, y tienen una caracterstica en comn. MUESTRA Es un subconjunto cualquiera de la poblacin; es importante escoger la muestra en forma aleatoria (al azar), pues as se logra que sea representativa y se puedan obtener conclusiones ms afines acerca de las caractersticas de la poblacin. 5. Para estudiar alguna caracterstica especifica de la poblacin se pueden definir los siguientes tipos de variables: VARIABLES CUALITATIVAS Relacionadas con caractersticas no numricas de un individuo. por ejemplo: Atributos de una persona Estado civil de una persona Estrato Gustos - hobies 6. VARIABLES CUANTITATIVAS Relacionadas con las caractersticas numricas del individuo. Las variables cuantitativas se dividen en: Discretas (aquellas que no admiten otro valor entre 2 valores distintos y consecutivos) o Continuas (aquellas que pueden tomar una infinidad de valores entre dos de ellos). 7. EN UNA INVESTIGACION SE RECOLECTA LA INFORMACION Al ordenar datos muy numerosos, es usual agruparlos en clases o categoras. Al determinar cuantos pertenecen a cada clase, establecemos la frecuencia. Construimos as una tabla de datos llamada Tabla de frecuencias. EJEMPLO Los siguientes datos corresponden a las notas obtenidas por un curso de 24 alumnos en un trabajo de matemtica: 4.24.2 5.05.0 5.65.6 5.05.0 3.23.2 4.24.2 5.65.6 6.06.0 2.82.8 3.93.9 4.24.2 4.24.2 5050 5050 3.93.9 3.93.9 3.23.2 3.23.2 4.24.2 5.65.6 6.06.0 6.06.0 3.23.2 6.06.0 8. Ordenemos estos datos en la siguiente tabla: NotaNota FrecuenciaFrecuencia Absoluta (f i)Absoluta (f i) FrecuenciaFrecuencia Relativa (h i)Relativa (h i) FrecuenciaFrecuencia relativarelativa porcentual (%)porcentual (%) 2.82.8 11 1/241/24 4.24.2 3.23.2 44 4/244/24 16.716.7 3.93.9 33 3/243/24 12.512.5 4.24.2 55 5/245/24 20.820.8 5.05.0 44 4/244/24 16.716.7 5.65.6 33 3/243/24 12.512.5 6.06.0 44 4/244/24 16.716.7 9. La FRECUENCIA ABSOLUTA de una clase es el numero de datos que forma dicha clase La FRECUENCIA RELATIVA corresponde a la razn entre la frecuencia absoluta y el total de datos, la cual se puede expresar mediante el uso de porcentajes. 10. Tabla de frecuencia de datos agrupados En ocasiones, el agrupar los datos en intervalos, nos puede ayudar para realizar un mejor anlisis de ellos. Consideremos los siguientes datos, expresados en metros, correspondientes a las estaturas de 80 estudiantes de cuarto ao de educacin media. 11. 1,671,67 1,721,72 1,811,81 1,721,72 1,741,74 1,831,83 1,841,84 1,881,88 1,921,92 1,751,75 1,841,84 1,861,86 1,731,73 1,841,84 1,871,87 1,831,83 1,811,81 1,771,77 1,731,73 1,751,75 1,781,78 1,771,77 1,671,67 1,831,83 1,831,83 1,721,72 1,711,71 1,851,85 1,841,84 1,931,93 1,821,82 1,691,69 1,701,70 1,811,81 1,661,66 1,761,76 1,751,75 1,801,80 1,791,79 1,841,84 1,861,86 1,801,80 1,771,77 1,801,80 1,761,76 1,881,88 1,751,75 1,791,79 1,871,87 1,791,79 1,771,77 1,671,67 1,741,74 1,751,75 1,781,78 1,771,77 1,741,74 1,731,73 1,831,83 1,761,76 1,831,83 1,771,77 1,751,75 1,771,77 1,771,77 1,841,84 1,831,83 1,791,79 1,821,82 1,761,76 1,761,76 1,761,76 1,791,79 1,881,88 1,631,63 1,801,80 1,721,72 1,751,75 1,791,79 1,771,77 ESTATURAS DE 80 ESTUDIANTES (Unidad de medida metros) 12. Para construir una tabla de frecuencias para datos agrupados, determinamos el tamao de cada intervalo, dividiendo el valor del rango por la cantidad de intervalos que se desea obtener. Importante recordar: El rango, est dado por la diferencia entre el mximo y el mnimo valor de la variable. El tamao del intervalo se aproxima al impar ms cercano. 13. RANGORANGO Mide la amplitud de los valores de la muestra y se calcula por diferencia entre el valor ms elevado y el valor ms bajo que se presenta en la agrupacin de datos utilizados para realizar el anlisis objeto de estudio. Notamos que la estatura mayor es 1,93Notamos que la estatura mayor es 1,93 m y la estatura menor es 1,63m; Elm y la estatura menor es 1,63m; El rango es de 0,30m = 30cm. Formaremosrango es de 0,30m = 30cm. Formaremos 9 intervalos. Para calcular el tamao de9 intervalos. Para calcular el tamao de cada uno dividimos 30 / 9 = 3,33 4. sicada uno dividimos 30 / 9 = 3,33 4. si no da entero, lo aproximamos.no da entero, lo aproximamos. 14. EL TAMAO DEL INTERVALO SE CALCULA ASI: En nuestro ejercicio: 80= 8,949, ste debe ser el nmero de intervalos. 15. IntervalosIntervalos FrecuenciaFrecuencia AbsolutaAbsoluta 1,63 1,651,63 1,65 1,66 1,691,66 1,69 1,70 1,731,70 1,73 1,74 1,771,74 1,77 1,78 1,811,78 1,81 1,82 1,841,82 1,84 1,85 1,871,85 1,87 1,88 1,901,88 1,90 1,91 1,931,91 1,93 Total : 80Total : 80 Notamos que la estatura mayor es 1,93 m y la estatura menor es 1,63m; El rango es de 0,30m = 30 cm. Formaremos 9 intervalos. Para calcular el tamao de cada uno dividimos 30 : 9 = 3,333. si no da entero, lo aproximamos. 16. EJEMPLO Los siguientes datos corresponden a las notas obtenidas por un curso de 50 alumnos en un trabajo de matemtica: 4.24.2 5.05.0 5.65.6 8.08.0 3.63.6 3.23.2 4.24.2 5.65.6 6.06.0 2.82.8 3.93.9 4.24.2 4.24.2 5050 5050 3.93.9 3.93.9 3.23.2 3.23.2 4.24.2 5.65.6 1.01.0 6.06.0 3.23.2 1.01.0 4.24.2 5.05.0 5.65.6 5.05.0 3.63.6 8.28.2 4.24.2 5.65.6 6.06.0 2.82.8 3.93.9 4.24.2 4.24.2 5050 5050 3.93.9 3.93.9 3.23.2 3.23.2 2.22.2 1.61.6 6.06.0 6.06.0 3.23.2 9.09.0 17. MARCA DE CLASE Lamarca de claseeselpunto mediodecadaintervalo. Lamarca de claseeselvalorquerepresentaa todoelintervaloparaelclculode algunosparmetroscomolamedia aritmtica o ladesviacin tpica. Ejemplo:163-193=30/2=15 18. MEDIDAS DE TENDENCIAMEDIDAS DE TENDENCIA CENTRALCENTRAL Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor representativo, las medidas de dispersin nos dicen hasta que punto estas medidas de tendencia central son representativas como sntesis de la informacin. 19. MEDIDAS DE TENDENCIA CENTRALMEDIDAS DE TENDENCIA CENTRAL MEDIA: Media aritmtica, es la que se obtiene sumando los datos y dividindolos por el nmero de ellos. Se aplica por ejemplo para resumir el nmero de pacientes promedio que se atiende en un turno. Otro ejemplo, es el nmero promedio de controles prenatales que tiene una gestante. Considrense los siguientes datos: 3, 8, 4, 10, 6, 2. Se pide: 1.Calcular sumedia. 2.Si los todos los datos anteriores losmultiplicamospor3, cal ser la nuevamedia. 2.A un conjunto de 5 nmeros cuya media es 7.31 se le aaden los nmeros 4.47 y 10.15. Cul es lamediadel nuevo conjunto de nmeros? 20. MEDIDAS DE TENDENCIA CENTRAL 21. MEDIDAS DE TENDENCIA CENTRALMEDIDAS DE TENDENCIA CENTRAL MEDIANA: Corresponde al percentil 50%. Es decir, la mediana divide a la poblacin exactamente en dos. Por ejemplo el nmero mediana de hijos en el centro de salud X es dos hijos. Otro ejemplo es el nmero mediana de atenciones por paciente en un consultorio. 1Ordenamoslosdatosdemenor a mayor. 2Si la serie tiene unnmero impar de medidaslamedianaes lapuntuacin centralde la misma. 2, 3, 4, 4, 5, 5, 5, 6, 6Me= 5 3Si la serie tiene unnmero parde puntuaciones lamedianaes lamediaentre las dospuntuaciones centrales. 7, 8, 9, 10, 11, 12Me= 9.5 22. MEDIDAS DE TENDENCIA CENTRAL 23. MEDIDAS DE TENDENCIA CENTRAL 24. MEDIDAS DE TENDENCIA CENTRAL 25. MEDIDAS DE TENDENCIA CENTRALMEDIDAS DE TENDENCIA CENTRAL MODA: Valor o (valores) que aparece(n) con mayor frecuencia. Una distribucin unimodal tiene una sola moda y una distribucin bimodal tiene dos. til como medida resumen para las variables nominales. Por ejemplo, el color del uniforme quirrgico en sala de operaciones es el verde; por lo tanto es la moda en colores del uniforme quirrgico. Lamodaes elvalorque tienemayor frecuencia absoluta. Se representa porMo. Se puede hallar lamodaparavariables cualitativasycuantitativas. Hallarlamodade la distribucin: 2, 3, 3, 4, 4, 4, 5, 5Mo= 4 Si en un grupo haydos o varias puntuacionescon lamisma frecuenciay esa frecuencia es la mxima, ladistribucinesbimodalomultimodal, es decir, tienevarias modas. 1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9Mo= 1, 5, 9 Cuando todas laspuntuacionesde un grupo tienen lamisma frecuencia,nohaymoda. 2, 2, 3, 3, 6, 6, 9, 9 26. MEDIDAS DE TENDENCIA CENTRAL 27. EJERCICIOEJERCICIO El nmero de dis necesarios por 10 equipos de trabajadores para terminar 10 instalaciones de iguales caractersticas han sido: 21, 32, 15, 59, 60, 61, 64, 60, 71, y 80 das. Calcular la media, mediana, moda. SOLUCIN: La media:suma de todos los valores de una variable dividida entre el nmero total de datos de los que se dispone: La mediana: es el valor que deja a la mitad de los datos por encima de dicho valor y a la otra mitad por debajo. Si ordenamos los datos de mayor a menor observamos la secuencia: 15, 21, 32, 59, 60, 60,61, 64, 71, 80. Como quiera que en este ejemplo el nmero de observaciones es par (10 individuos), los dos valores que se encuentran en el medio son 60 y 60. Si realizamos el clculo de la media de estos dos valores nos dar a su vez60,que es el valor dela mediana. La moda: el valor de la variable que presenta una mayor frecuencia es60 28. EL TAMAO DEL INTERVALO SE CALCULA ASI: En nuestro ejercicio: 100= 10, ste debe ser el nmero de intervalos. 29. MEDIDAS DE TENDENCIA CENTRALMEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOSPARA DATOS AGRUPADOS LRC: Lmites Reales de Clase. (Inferior- Superior) Xi = Marca de Clase fi = Frecuecia Absoluta fa. = Frecuencia Acumulada f rel% = Frecuencia Relativa % Frel%ac=Frecuencia Relativa porcentual acumulada 22905 30. MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS 31. MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS 32. MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS 33. MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS Numero de observaciones que faltan para alcanzar la mediana 34. MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS 35. MEDIDAS DE TENDENCIA CENTRALMEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOSPARA DATOS AGRUPADOS MODA Lies el lmite inferior de la clase modal. fies la frecuencia absoluta de la clase modal. fi--1es la frecuencia absoluta inmediatamente inferior a la clase modal. fi-+1es la frecuencia absoluta inmediatamente posterior a la clase modal aies la amplitud de la clase. 36. MEDIDAS DE TENDENCIA CENTRAL EN EXCEL 37. MEDIDAS DE TENDENCIA CENTRAL GRAFICADAS EN EXCEL 38. MEDIDAS DE TENDENCIAMEDIDAS DE TENDENCIA CENTRALCENTRAL 1Construya la tabla de frecuencia y calcule la media-mediana y moda. 39. MEDIDAS DE TENDENCIAMEDIDAS DE TENDENCIA CENTRALCENTRAL 1Construya la tabla de frecuencia y calcule la media-mediana y moda 40. MEDIDAS DE DISPERSIONMEDIDAS DE DISPERSION Las medidas de dispersin cuantifican la separacin, la dispersin, la variabilidad de los valores de la distribucin respecto al valor central. Distinguimos entre medidas de dispersin: Absolutas, que no son comparables entre diferentes muestras Relativas que nos permitirn comparar varias muestras. 41. MEDIDAS DE DISPERSIONMEDIDAS DE DISPERSION 42. MEDIDAS DE DISPERSIONMEDIDAS DE DISPERSION DESVIACION MEDIA. La desviacin media es la media aritmtica de los valores absolutos de las desviaciones respecto a la media La desviacin media se representa por 43. MEDIDAS DE DISPERSIONMEDIDAS DE DISPERSION DESVIACION MEDIA PARA DATOS AGRUPADOS: Si los datos vienen agrupados en una tabla de frecuencias, la expresin de la desviacin media es: 44. MEDIDAS DE DISPERSIONMEDIDAS DE DISPERSION Xi fi Xi*fi |X - Xm| |(X - Xm)*fi| 10-15 12,5 3 37,5 9,286 27,858 15-20 17,5 5 87,5 4,286 21,43 20-25 22,5 7 157,5 0,714 4,998 25-30 27,5 4 110 5,714 22,856 30-35 32,5 2 65 10,714 21,428 457,5 98,57 Xm= 457,5/21 =21,7857 Dm= 98,57/21 =4,6938 45. VARIANZAVARIANZA Mide la distancia existente entre los valores de la serie y la media. Sumatoria de las diferencias al cuadrado entre 1 valor y la Media por el nmero de veces que se ha repetido cada valor, la Sumatoria se divide por el tamao de la muestra. MEDIDAS DE DISPERSIONMEDIDAS DE DISPERSION 46. VARIANZA Varianza para datos no agrupados 47. MEDIDAS DE DISPERSIONMEDIDAS DE DISPERSION VARIANZAVARIANZA Propiedades de la varianza 1Lavarianzaser siempre unvalor positivo o cero, en el caso de que las puntuaciones sean iguales. 2Si a todos losvaloresde la variable se lessumaunnmerolavarianza no vara. 3Si todos losvaloresde la variable semultiplicanpor unnmerolavarianzaquedamultiplicada por elcuadradode dichonmero. 4Si tenemos varias distribuciones con la mismamediay conocemos sus respectivasvarianzasse puede calcular lavarianza total 48. MEDIDAS DE DISPERSIONMEDIDAS DE DISPERSION Calculo de la varianza para datos agrupados X^2 = 1877,4889 49. MEDIDAS DE DISPERSIONMEDIDAS DE DISPERSION DESVIACION TIPICA La desviacin tpica es la raz cuadrada de la varianza. Es decir, la raz cuadrada de la media de los cuadrados de las puntuaciones de desviacin. La desviacin tpica se representa por 50. MEDIDAS DE DISPERSIONMEDIDAS DE DISPERSION Propiedades de la desviacin tpica 1 La desviacin tpica ser siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales. 2 Si a todos los valores de la variable se les suma un nmero la desviacin tpica no vara. 3 Si todos los valores de la variable se multiplican por un nmero la desviacin tpica queda multiplicada por dicho nmero. 4 Si tenemos varias distribuciones con la misma media y conocemos sus respectivas desviaciones tpicas se puede calcular la desviacin tpica total. 51. MEDIDAS DE DISPERSIONMEDIDAS DE DISPERSION COEFICIENTE DE VARIACION COEFICIENTE DE VARIACION DE PEARSON El coeficiente de variacin es la relacin entre la desviacin tpica de una muestra y su media. El coeficiente de variacin se suele expresar en porcentajes: El coeficiente de variacin permite comparar las dispersiones de dos distribuciones distintas, siempre que sus medias sean positivas. Se calcula para cada una de las distribuciones y los valores que se obtienen se comparan entre s. La mayor dispersin corresponder al valor del coeficiente de variacin mayor. 52. MEDIDAS DE DISPERSIONMEDIDAS DE DISPERSION 53. Gracias por tu atencin 54. Finn n