50 Estadistica Descriptiva 2015

download 50 Estadistica Descriptiva 2015

of 10

description

50 Estadistica Descriptiva 2015

Transcript of 50 Estadistica Descriptiva 2015

UNA INTROCUCION SPSS 7

PAGE EPI INFO E INFORMATICA APLICADO A LA INVESTIGACION2015

UNIVERSIDAD NACIONAL

JOS FAUSTINO SNCHEZ CARRION

FACULTAD DE INGENIERA INDUSTRIAL, SISTEMAS E INFORMTICAESCUELA ACADEMICO PROFESIONAL DE INGENIERA INDUSTRIALCursoESTADSTICA APLICADA A LA INVESTIGACINTEORIA DE ESTADISTICA DESCRIPTIVAJos Augusto Arias Pittman

[email protected] 02 de junio de 2015ESTADSTICA DESCRIPTIVA

1. MEDIDAS DE TENDENCIA CENTRAL

Media aritmtica, Mediana, Moda y Suma de valores.

Las medidas de centralizacin vienen a responder a la primera pregunta. La medida ms evidente que podemos calcular para describir un conjunto de observaciones numricas es su valor medio. La media no es ms que la suma de todos los valores de una variable dividida entre el nmero total de datos de los que se dispone.

Como ejemplo, consideremos 10 personas de edades 21 aos, 32, 15, 59, 60, 61, 64, 60, 71, y 80. La media de edad de estos sujetos ser de:

Ms formalmente, si denotamos por (X1, X2,...,Xn) los n datos que tenemos recogidos de la variable en cuestin, el valor medio vendr dado por:

Otra medida de tendencia central que se utiliza habitualmente es la mediana. Es la observacin equidistante de los extremos.

La mediana del ejemplo anterior sera el valor que deja a la mitad de los datos por encima de dicho valor y a la otra mitad por debajo. Si ordenamos los datos dados anteriormente- de menor a mayor observamos la secuencia:

15, 21, 32, 59, 60, 60,61, 64, 71, 80.

Como quiera que en este ejemplo el nmero de observaciones sea par (10 personas), los dos valores que se encuentran en el medio son 60 y 60. Si realizamos el clculo de la media de estos dos valores nos dar a su vez 60, que es el valor de la mediana.

Si la media y la mediana son iguales, la distribucin de la variable es simtrica. La media es muy sensible a la variacin de los datos. Sin embargo, la mediana es menos sensible a dichos cambios.

Por ltimo, otra medida de tendencia central, no tan usual como las anteriores, es la moda, siendo ste el valor de la variable que presenta una mayor frecuencia.

En el ejemplo anterior el valor que ms se repite es 60, que es la moda.

2. MEDIDAS DE DISPERSIN

Desviacin estndar, Varianza, Rango, Mnimo, Mximo y Error estndar de la media aritmtica.

Otro aspecto a tener en cuenta al describir datos continuos es la dispersin de los mismos. Existen distintas formas de cuantificar esa variabilidad. De todas ellas, la varianza (S2) de los datos es la ms utilizada. Es la media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmtica de la distribucin.

Esta varianza muestral se obtiene como la suma de las diferencias de cuadrados y por tanto tiene como unidades de medida el cuadrado de las unidades de medida en que se mide la variable estudiada.

En el ejemplo anterior la varianza sera:

Sx2=

La desviacin tpica (S) es la raz cuadrada de la varianza. Expresa la dispersin de la distribucin y se expresa en las mismas unidades de medida de la variable. La desviacin tpica es la medida de dispersin ms utilizada en estadstica.

Aunque esta frmula de la desviacin tpica muestral es correcta, en la prctica, la estadstica nos interesa para realizar inferencias poblacionales, por lo que en el denominador se utiliza, en lugar de n, el valor n-1.

Por tanto, la medida que se utiliza es la cuasidesviacin tpica, dada por:

Aunque en muchos contextos se utiliza el trmino de desviacin tpica para referirse a ambas expresiones.

En los clculos del ejercicio previo, la desviacin tpica muestral, que tiene como denominador n, el valor sera 20.678. A efectos de clculo lo haremos como n-1 y el resultado seria 21,79.

El haber cambiado el denominador de n por n-1 est en relacin al hecho de que esta segunda frmula es una estimacin ms precisa de la desviacin estndar verdadera de la poblacin y posee las propiedades que necesitamos para realizar inferencias a la poblacin.

Cuando se quieren sealar valores extremos en una distribucin de datos, se suele utilizar el Rango o amplitud como medida de dispersin. El Rango es la diferencia entre el valor mayor y el menor de la distribucin.

Por ejemplo, utilizando los datos del ejemplo previo tendremos como Rango 65 (80-15 = 65).

Como medidas de variabilidad ms importantes, conviene destacar algunas caractersticas de la varianza y desviacin tpica:

Son ndices que describen la variabilidad o dispersin y por tanto cuando los datos estn muy alejados de la media, el numerador de sus frmulas ser grande y la varianza y la desviacin tpica lo sern.

Al aumentar el tamao de la muestra, disminuye la varianza y la desviacin tpica. Para reducir a la mitad la desviacin tpica, la muestra se tiene que multiplicar por 4.

Cuando todos los datos de la distribucin son iguales, la varianza y la desviacin tpica son iguales a 0.

Para su clculo se utilizan todos los datos de la distribucin; por tanto, cualquier cambio de valor ser detectado.

Otra medida que se suele utilizar es el coeficiente de variacin (CV). Es una medida de dispersin relativa de los datos y se calcula dividiendo la desviacin tpica muestral por la media y multiplicando el cociente por 100. Su utilidad estriba en que nos permite comparar la dispersin o variabilidad de dos o ms grupos. As, por ejemplo, si tenemos el peso de 5 personas (70, 60, 56, 83 y 79 Kg.) cuya media es de 69,6 Kg. y su desviacin tpica (s) = 10,44 y la talla de los mismos (150, 170, 135, 180 y 195 cm.) cuya media es de 166 cm. y su desviacin tpica de 21,3. La pregunta sera: qu distribucin es ms dispersa, el peso o la talla? Si comparamos las desviaciones tpicas observamos que la desviacin tpica de la talla es mucho mayor; sin embargo, no podemos comparar dos variables que tienen escalas de medidas diferentes, por lo que calculamos los coeficientes de variacin:

CV de la variable peso =

CV de la variable talla =

A la vista de los resultados, observamos que la variable peso tiene mayor dispersin, mientras que la variable talla tiene menos variabilidad.

3. MEDIDAS DE DISTRIBUCIN

Asimetra y CurtosisAdems de la medida de tendencia central y las medidas de dispersin o variabilidad, hay otras dos caractersticas que nos permiten describir una distribucin de frecuencias. La encontramos en los coeficientes de Asimetra y Curtosis. Estas medidas de distribucin nos permiten conocer cmo se distribuyen los datos alrededor de la media; as como el grado de apuntamiento que puede la distribucin de los datos.

4. DISEO DE GRFICOBarras, Sectores o Torta e Histogramas. Este ltimo con la posibilidad de mostrar adems una curva de distribucin normal. Los Valores del Grfico slo para los tipos de grficos de Barras y Sectores. Este especifica si el grfico se construye con las frecuencias (opcin por defecto) o en base a los porcentajes.Mostramos un ejemplo de grfica que puede generar esta opcin.5. DESARROLLO DE UN CASO: OSTEOPOROSIS (*)Abrir el archivo osteoporosis,sav, que ha sido enviado por e_mail a cada uno de ustedes.

La osteoporosis. Definiciones

La osteoporosis es un trastorno en el cual se produce una reduccin de la masa sea sin cambios perceptibles en la relacin entre los elementos mineralizados y los no mineralizados. Estos trminos de referencia son apropiados cuando la osteoporosis no es complicada por la osteomalacia o la osteomalacia subclnica. Cuando el tejido seo est completamente mineralizado, las mediciones del contenido de minerales en el hueso o la densidad mineral sea proporcionan estimaciones de la masa sea. Se han establecido muchas tcnicas para medir los ndices de masa o prdida seas. Como la masa sea es uno de los principales factores determinantes de la capacidad de los huesos de soportar la compresin y la torsin, se producir con ms facilidad una fractura cuando haya una prdida sea considerable. En consecuencia, comnmente se considera la osteoporosis simplemente en trminos de la cantidad de masa sea presente. Sin embargo, se recomienda mantener la definicin usada por una conferencia de consenso efectuada en 1991, ya que incluye el concepto de la heterogeneidad de los factores esquelticos y no esquelticos que intervienen en el origen de las fracturas:

Osteoporosis: Enfermedad caracterizada por la baja masa sea y el deterioro microestructural del tejido seo, que lleva a una mayor fragilidad sea y al consiguiente aumento del riesgo de fractura.

Un criterio ha sido considerar osteoporticos a los pacientes en los cuales las mediciones dan resultados que estn por debajo de la escala de rangos para la poblacin adulta joven sana (17-19), o esos resultados se encuentran en el cuartil, quintil o decil ms bajos de la escala de referencia para las mujeres jvenes sanas.

Tambin se ha definido la osteoporosis como una densidad mineral sea que se encuentra por debajo de la escala de referencia ajustada segn la edad, o que es ms de una desviacin tpica inferior al promedio para una determinada edad. La precisin de estas definiciones permite calcular la prevalencia y la incidencia de la osteoporosis. Las estimaciones de la prevalencia de la baja densidad mineral sea basadas en estos criterios diversos difieren en forma muy notable, lo cual hace que, en ciertos casos, la cantidad de mujeres afectadas se multiplique por 32.

Un segundo criterio ha sido caracterizar a la poblacin osteoportica para derivar un umbral de fractura basado en la escala de las mediciones de la densidad mineral sea en la poblacin con fracturas vertebrales o de cadera. Ese umbral se puede establecer arbitrariamente, por ejemplo, en dos desviaciones tpicas por encima del valor medio para los pacientes con fracturas osteoporticas.

Un tercer criterio consiste en usar los resultados de las mediciones densitomtricas para derivar un riesgo de fractura en toda la vida. Calculado en esta forma, el riesgo depender del sitio de la medicin, la tcnica usada y la edad, el sexo y la esperanza de vida del individuo. Ross et al. han sealado que la duplicacin del riesgo al que est expuesto el promedio de los individuos jvenes sanos podra constituir un umbral para la intervencin y, por consiguiente, ser usada para definir la osteoporosis. Esa definicin incluira al 10% o ms de las mujeres jvenes sanas.

De acuerdo con los parmetros descritos en Material y Mtodos utilizamos como variables de clasificacin: La densidad sea medida por la atenuacin de ultrasonidos (B.U.A., Bound Ultrasonic Atenuation), la proporcin de densidad sea esperada a su edad en forma de porcentaje esperado y la transformacin de estas cuantificaciones numricas en grados cualitativos de clasificacin: Normalidad, Osteopenia, Osteoporosis y Riesgo de Fractura. 1. Calcule la media, desviacin estndar, el rango, mximo, mnimo y asimetra de las variables, edad, peso, talla, ndice de masa corporal. Haga el anlisis individual y luego en forma general. Cul de estas variables tiene mayor variacin. Presente un grfico de histograma y con ajuste a la curva normal. 2. Haga un anlisis a la densidad sea medida por la atenuacin de ultrasonidos (B.U.A., Bound Ultrasonic Atenuation), en cuanto a la media, desviacin estndar, el rango, mximo, mnimo y asimetra. Presente un grfico de histograma y con ajuste a la curva normal. 3. Analice la variable clasificacin de la OMS para el caso de osteoporosis. Presente un grfico de barras. Luego presente un grfico de sectores. Con cual grafico se quedara para el anlisis.4. Evale el grupo de edad con la densidad sea (BUA) determinando la media, la desviacin estndar. Presente los resultados del SPSS en una tabla en Excel para una mejor interpretacin. Ahora presente el grafico en Excel.Para que usted pueda evaluar con mayor propiedad, haga un grfico de Dispersin de puntos.

La ruta es: Grafico/cuadro de dialogo antiguos/Dispersin/puntos.

El cuadro de dialogo que se observa hacer clic en Dispersin simple, y Definir.

Seguidamente aparece otro cuadro de dialogo: En el recuadro del Eje Y ira la variable BUA y en el Eje X la variable edad.

Al aceptar se muestra el grafico siguiente:

Al hacer doble clic en el grfico, podr agregarle la lnea de tendencia en el botn: Aadir lnea de ajuste total. Cuando haga clic en este botn aparece una lnea de tendencia. Que aprecia usted en el grafico.

EJERCICIOS DE ESTADISTICA DESCRIPTIVAABRIR EL ARCHIVO PRACTICA DIRIGIDA 20151. Ordene la Base de datos por la variable Iden.

2. Recodifique la variable Religin. La nueva variable se llama Relig1.

3. Ahora elimina la Variable Religin, y a la nueva variable Relig1 cambie el nombre por Religin.4. Calcule los das de permanencia de los pacientes en un determinado nosocomio. La nueva variable se llama permanen.

5. Calcule la edad actual de los pacientes. La nueva variable se llama edapac.MEDIDA DE TENDENCIA CENTRAL

6. Haga un anlisis estadstico de la variable permanen. Se desea saber el comportamiento de los das de permanencia, ya que el Hospital no tiene el nmero de camas para atender la demanda.

7. Calcule la media, mediana y la moda para los pacientes con respecto a la variable permanen.. Luego halle la desviacin estndar, el mximo y mnimo. As mismo haga un grafico tipo Histograma y con ajuste a la curva normal.

Haga un comentario de los resultados presentados.

8. Recodifique la variable permanen. Los valores que debemos determinar estn distribuidos en cuatro categoras y son los siguientes:

Hasta 7 das

1

De 8 a 15 das

2

De 16 a 20 das3

Mayor de 21 das4

Calcule la media, mediana y la moda para la variable peso. Luego calcule la desviacin estndar, el mximo y mnimo.

MEDIDA DE DISPERSIN

9. Calcule la media, y la desviacin estndar para los pacientes con respecto a la variable permanen..

10. Calcule el cociente de variacin. Como se comporta esta variable.

11. As mismo haga un grfico tipo Histograma y con ajuste a la curva normal.

Haga un comentario de los resultados presentados.

MEDIDA DE DISTRIBUCIN

12. Calcule la asimetra y la curtosis para los pacientes con respecto a la variable permanen... As mismo haga un grfico tipo Histograma y con ajuste a la curva normal. Como se distribuye los datos a travs de la curva.

Haga un comentario de los resultados presentados.

JOSE AUGUSTO ARIAS PITTMAN

Huacho, martes, 02 de junio de 2015

(*) Ejemplo tomado de la Universidad Cardenal Herrera Dr. Antonio Salazar- con fines acadmicos, por el Ing. Jos Augusto Arias Pittman para los estudiantes del V Ciclo de la Escuela Acadmico Profesional de Medicina Humana de la UNJFSC.Jos Augusto Arias PittmanPgina 5