Clase n 3_estadistica

16
ESTADISTICA ESTADISTICA 2013 2013

description

Clase n 3_estadistica

Transcript of Clase n 3_estadistica

Page 1: Clase n 3_estadistica

ESTADISTICA ESTADISTICA 20132013

Page 2: Clase n 3_estadistica

CLASIFICACIÓN DE DATOSCLASIFICACIÓN DE DATOS

Consiste en agrupar las observaciones en un Consiste en agrupar las observaciones en un número determinado de categorías o clases.número determinado de categorías o clases.

El número de categorías o clases depende del El número de categorías o clases depende del tipo de variable.tipo de variable.

Page 3: Clase n 3_estadistica

1.1. Caso de variables cualitativasCaso de variables cualitativas

EjemploEjemplo Un determinado tratamiento es Un determinado tratamiento es aplicado a 30 pacientes y al finalizar éste, los aplicado a 30 pacientes y al finalizar éste, los resultados se clasifican en: Muy bueno (mb), resultados se clasifican en: Muy bueno (mb), bueno (b), regular (r) y malo (m).bueno (b), regular (r) y malo (m).

Los datos fueron: Los datos fueron:

b, m, b, mb, r, mb, mb, r, mb, b, b, r, b, b, mb, b, m, b, mb, r, mb, mb, r, mb, b, b, r, b, b, mb, m, b, b, mb, b, mb, m, r, b, mb, m, b, mb, r, b.m, b, b, mb, b, mb, m, r, b, mb, m, b, mb, r, b.

Se elabora la siguiente tabla de frecuencias:Se elabora la siguiente tabla de frecuencias:

Page 4: Clase n 3_estadistica

Tabla de frecuencias (1)Tabla de frecuencias (1)

Resultado del Resultado del tratamientotratamiento Número Número PorcentajePorcentaje

Muy buenoMuy bueno 99 30,030,0

BuenoBueno 1212 40,040,0

RegularRegular 55 16,716,7

MaloMalo 44 13,313,3

TotalTotal 3030 100,0100,0

Page 5: Clase n 3_estadistica

EPOC*EPOC*

Cocina con leñaCocina con leña

TotalTotalSiempreSiempre A vecesA veces NuncaNunca

Si Si 5050 2020 1010 8080

NoNo 2525 6565 130130 220220

TotalTotal 7575 8585 140140 300300

* Enfermedad pulmonar obstructiva crónica* Enfermedad pulmonar obstructiva crónica

Page 6: Clase n 3_estadistica

2.2. Caso de variables cuantitativasCaso de variables cuantitativas

2.1 Variables cuantitativas discretas2.1 Variables cuantitativas discretas Supongamos la variable discreta “número de Supongamos la variable discreta “número de hijos” observado en 30 mujeres con cáncer de hijos” observado en 30 mujeres con cáncer de mama:mama:

3, 2, 0, 5, 4, 0, 1,0, 1, 2, 2, 1, 0, 3, 0, 0, 0, 1, 2, 1, 3, 2, 0, 5, 4, 0, 1,0, 1, 2, 2, 1, 0, 3, 0, 0, 0, 1, 2, 1, 2, 3, 3, 4, 1, 1, 2, 1, 1, 0.2, 3, 3, 4, 1, 1, 2, 1, 1, 0.

La variable no tiene muchos valores diferentes, La variable no tiene muchos valores diferentes, luego a partir de ellos podemos elaborar la tabla:luego a partir de ellos podemos elaborar la tabla:

Page 7: Clase n 3_estadistica

Tabla de frecuencias (2)Tabla de frecuencias (2)

Número de Número de hijoshijos

nn %%

00 88 26,726,7

11 99 30,030,0

22 66 20,020,0

33 44 13,313,3

44 22 6,76,7

55 11 3,33,3

TotalTotal 3030 100,0100,0

Page 8: Clase n 3_estadistica

2.2 Variables cuantitativas continuas2.2 Variables cuantitativas continuas Tratándose de este tipo de variables se presentan Tratándose de este tipo de variables se presentan

algunas dificultades para establecer los grupos, algunas dificultades para establecer los grupos, sin embargo, se dará un procedimiento que sin embargo, se dará un procedimiento que servirá como guía u orientación para formar los servirá como guía u orientación para formar los intervalos de clase y así agrupar los datos.intervalos de clase y así agrupar los datos.

Los siguientes datos, redondeados al entero, son Los siguientes datos, redondeados al entero, son niveles de glucosa de una muestra de 30 niveles de glucosa de una muestra de 30 pacientes. Efectuar la clasificación de estos datos pacientes. Efectuar la clasificación de estos datos y elaborar la tabla de frecuencias.y elaborar la tabla de frecuencias.

Page 9: Clase n 3_estadistica

Valores Valores de de

glucosaglucosa de 30 de 30

pacientes pacientes

PACIENTE DOSAJE GLUCOSA SEXO1 118 M2 127 M3 131 F4 141 M5 119 M6 124 F7 141 F8 133 M9 114 F10 133 M11 143 M12 106 M13 144 F14 146 M15 146 M16 145 F17 116 M18 146 M19 133 F20 120 M21 139 M22 116 M23 129 F24 136 M25 153 M26 122 F27 130 F28 118 M29 122 M30 110 M

Page 10: Clase n 3_estadistica

1.1. Encontrar la amplitud del conjunto de datos, es Encontrar la amplitud del conjunto de datos, es decir el valor máximo menos el valor mínimo, decir el valor máximo menos el valor mínimo, más por lo menos una unidad de medida:más por lo menos una unidad de medida:A = (Vmax – Vmin) + por lo menos una unidad A = (Vmax – Vmin) + por lo menos una unidad de medida.de medida.Así, considerando los valores de glucosa de la Así, considerando los valores de glucosa de la tabla anterior tenemos:tabla anterior tenemos:A = (153 – 106) + 1 = 48A = (153 – 106) + 1 = 48Nota: Si los valores máximo y mínimo se expresan Nota: Si los valores máximo y mínimo se expresan hasta los décimos se incrementará un décimo (0,1); si hasta los décimos se incrementará un décimo (0,1); si los valores están expresados en centésimos, se los valores están expresados en centésimos, se agregará un centésimo (0,01) y así sucesivamente. agregará un centésimo (0,01) y así sucesivamente.

Page 11: Clase n 3_estadistica

2.2. Determinar el número de intervalos (k), utilizando la Determinar el número de intervalos (k), utilizando la fórmula de Sturges:fórmula de Sturges:k = 1 + 3,322 log nk = 1 + 3,322 log n

En relación al ejemplo se tiene que:En relación al ejemplo se tiene que:k = 1 + 3,322 log 30 = 5,9k = 1 + 3,322 log 30 = 5,9

Por redondeo k = 6Por redondeo k = 6

3.3. Determinar la amplitud del intervalo de clase C, Determinar la amplitud del intervalo de clase C, utilizando la siguiente expresión:utilizando la siguiente expresión:

C = A/kC = A/kPara nuestro ejemplo: C = 48/6 = 8Para nuestro ejemplo: C = 48/6 = 8

Page 12: Clase n 3_estadistica

Ahora definimos los límites de los intervalos de Ahora definimos los límites de los intervalos de clase, procedemos así: El Vmin es el límite inferior clase, procedemos así: El Vmin es el límite inferior de la primera clase y su respectivo límite superior de la primera clase y su respectivo límite superior será Vmin + (C-1); el límite inferior de la segunda será Vmin + (C-1); el límite inferior de la segunda clase es el límite superior de la primera clase más clase es el límite superior de la primera clase más uno y el respectivo límite superior será igual al uno y el respectivo límite superior será igual al límite inferior más (C-1); y así, hasta completar el límite inferior más (C-1); y así, hasta completar el número de intervalos. Así, se tiene:número de intervalos. Así, se tiene:

106 – 113106 – 113

114 – 121114 – 121

122 – 129122 – 129

130 – 137130 – 137

138 – 145138 – 145

146 – 153146 – 153

Page 13: Clase n 3_estadistica

Nota: Si los límites están expresados hasta los Nota: Si los límites están expresados hasta los décimos entonces se tendrá que el límite superior décimos entonces se tendrá que el límite superior de la primera clase es Vmin + (C -0,1); si están de la primera clase es Vmin + (C -0,1); si están expresados hasta centésimos será Vmin + (C - expresados hasta centésimos será Vmin + (C - 0,01) y así sucesivamente.0,01) y así sucesivamente.

La clasificación de los datos de una variable La clasificación de los datos de una variable continua puede hacerse manualmente o en continua puede hacerse manualmente o en forma automatizada.forma automatizada.

Page 14: Clase n 3_estadistica

Tabla de frecuencias (3)Tabla de frecuencias (3)CLASECLASE Dosaje Dosaje

GlucosaGlucosaXXii ffii FFii hhii%% HHii%% Límites realesLímites reales

11 106 - 113106 - 113 109,5109,5 22 22 6,76,7 6,76,7 105,5 - 113,5105,5 - 113,5

22 114 - 121114 - 121 117,5117,5 77 99 23,323,3 30,030,0 113,5 - 121,5113,5 - 121,5

33 122 - 129122 - 129 125,5125,5 55 1414 16,716,7 46,746,7 121,5 - 129,5121,5 - 129,5

44 130 - 137130 - 137 133,5133,5 66 2020 20,020,0 66,766,7 129,5 - 137,5129,5 - 137,5

55 138 - 145138 - 145 141,5141,5 66 2626 20,020,0 86,786,7 137,5 - 145,5137,5 - 145,5

66 146 - 153146 - 153 149,5149,5 44 3030 13,313,3 100,100,00

145,5 - 153,5145,5 - 153,5

TOTALTOTAL 3030 100,0100,0

Page 15: Clase n 3_estadistica

donde:donde:

ffii:: Frecuencia absoluta del i-ésimo intervalo, nos indica el Frecuencia absoluta del i-ésimo intervalo, nos indica el

número de datos comprendido en dicho intervalo del total de número de datos comprendido en dicho intervalo del total de observaciones.observaciones.

FFii: : Frecuencia absoluta acumulada de la clase i, nos indica la Frecuencia absoluta acumulada de la clase i, nos indica la

suma de las frecuencias absolutas de los iguales o anteriores suma de las frecuencias absolutas de los iguales o anteriores a él:a él:

FF11= f= f11

FF2 2 = f= f11+f+f22

hhii%:%: Frecuencia relativa de la clase i, es el cociente entre la Frecuencia relativa de la clase i, es el cociente entre la

frecuencia absoluta y el número total de observaciones frecuencia absoluta y el número total de observaciones multiplicado por 100.multiplicado por 100.

hhii% = f% = fii/n*100%/n*100%

Page 16: Clase n 3_estadistica

HHii%:%: Frecuencia relativa acumulada de la clase i, es la Frecuencia relativa acumulada de la clase i, es la frecuencia absoluta acumulada dividido por el número frecuencia absoluta acumulada dividido por el número total de observaciones.total de observaciones.

HHii% = F% = Fii/n*100%/n*100%

XXii:: Es la marca o punto medio de la clase i, y es igual a la Es la marca o punto medio de la clase i, y es igual a la semisuma de los límites del intervalo correspondiente.semisuma de los límites del intervalo correspondiente.

XXii = = (LI + LS)(LI + LS) 22

Límites reales:Límites reales: Sí los límites nominales de los Sí los límites nominales de los intervalos de clase están expresados en enteros los intervalos de clase están expresados en enteros los límites reales de cada intervalo se determina restando límites reales de cada intervalo se determina restando y sumando media unidad de medida al límite inferior y y sumando media unidad de medida al límite inferior y superior respectivamente de cada intervalo.superior respectivamente de cada intervalo.