Temas 6 y 7 de bioestadística. Semestre b 2012. Medidas de dispersión, variación o variabilidad.
-
Upload
university-of-the-andes-venezuela -
Category
Education
-
view
2.647 -
download
0
Transcript of Temas 6 y 7 de bioestadística. Semestre b 2012. Medidas de dispersión, variación o variabilidad.
Medidas de dispersión, variación o variabilidad.
• Rango.
• Varianza.
• Desviación Típica.
• Coeficiente de variación.
Tema 2
. Estadística D
escriptiva
Medidas de dispersión: Rango
Rango (amplitud o recorrido):
• Está determinado por los dos valores extremos de los datos muestrales, es simplemente la diferencia entre la mayor y menor observación.
• Es una medida de dispersión absoluta, ya que depende solamente de los datos y permite conocer la máxima dispersión.
Tema 2
. Estadística D
escriptiva
Medidas de dispersión: Varianza
• Si la varianza de un conjunto de observaciones es grande se dice que los datos tiene una mayor variabilidad que un conjunto de datos que tenga un varianza menor.
21
2
2
1
2
2
xn
x
s
n
xx
s
n
i
i
n
i
i
Tema 2
. Estadística D
escriptiva
Para datos NOagrupados:
Para datos agrupados en una distribución de frecuencias:
Medidas de dispersión: Varianza
21
2
2
1
2
2
xn
fm
s
n
fxm
s
k
i
ii
k
i
ii
21
2
2
1
2
2
xn
fm
s
n
fxm
s
k
i
ii
k
i
ii
Medidas de dispersión: Desviación Típica
• Es la raíz cuadrada de la varianza.
• Notación: s, .
2ss
Tema 2
. Estadística D
escriptiva
Medidas de dispersión: Coeficiente de Variación
• Es una medida de dispersión relativa que permite comparar el nivel de dispersión de dos muestras de variables estadísticas diferentes.
• No tiene dimensiones.
• Notación: CV
%100x
sCV
Tema 2
. Estadística D
escriptiva
Ventajas y Desventajas del Rango
Ventajas:
• Útil cuando se quiere conocer la extensión de las variaciones extremas (valor máximo de la dispersión).
• Fácil de calcular.
Tema 2
. Estadística D
escriptiva
Ventajas y Desventajas del Rango
Desventajas:
• No es una MD con respecto al centro de la distribución.
• Solo emplea dos valores en su cálculo.
• No se puede calcular en distribuciones de límite de clase abierto.
Tema 2
. Estadística D
escriptiva
Propiedades, Ventajas y Desventajas de la Varianza
Ventajas:
• Es útil cuando se compara la variabilidad de dos o más conjuntos de datos.
• Utiliza toda la información disponible.
Desventajas:
• No proporciona ayuda inmediata cuando se estudia la dispersión de un solo conjunto de datos.
• Difícil de interpretar por tener sus unidades elevadas al cuadrado.
Tema 2
. Estadística D
escriptiva
Propiedades, Ventajas y Desventajas de la Varianza
Propiedades:
1. Siempre es mayor o igual a cero y menor que infinito.
2. La varianza de una constante es cero.
3. Si a una variable X la sometemos a Y=a+bX, la varianza de Y será Var(Y) = b2Var(X)
Tema 2
. Estadística D
escriptiva
Ventajas y Desventajas de la Desviación Típica
Ventajas:
• Esta expresada en las mismas unidades que la variable en estudio.
• Utiliza todas las observaciones en su cálculo.
• Fácil de interpretar.
Desventajas:
• No tiene.
Tema 2
. Estadística D
escriptiva
Ventajas y Desventajas del Coeficiente de Variación
Desventaja:
• No es una MD con respecto al centro de la distribución de los datos. Tem
a 2. Estad
ística Descrip
tiva
Ejercicio: Tomando como referencia la siguiente tabla, calcule la desviación típica de los datos.
Fórmula:
Tabla 3. Distribución de la Concentración de Testosterona en el plasma de 33 varones estudiados
____________________________________________
2
Clases f i mi Fi mi*fi (mi-X)*fi
____________________________________________
2,05 - 4,25 4 3,15 4 12,60 137,35
4,25 - 6,45 2 5,35 6 10,70 26,79
6,45 - 8,65 11 7,55 17 83,05 23,45
8,65 - 10,85 5 9,75 22 48,75 2,74
10,85 - 13,05 6 11,95 28 71,70 51,86
13,05 - 15,25 5 14,15 33 70,75 132,10
____________________________________________
Total 33 297,55 374,30
2ss
Ahora se aplican los pasos que restan para obtener la desviación estándar:
1.- Se calcula la media muestral (X):
X = 9,01
2.- Se obtiene la varianza con la fórmula:
2 2
S = ∑(mi – X) * fi = (374,3 / 32) = 11,70, donde
n – 1
S = 3,42
Se dice entonces que el cambio estacional de la concentración de testosterona del plasma durante el ciclo reproductivo de la muestra estudiada es 9,01 miligramos por mililitro con una desviación estándar de más o menos 3,42 nanogramos por mililitro
- Coeficiente de variación (CV): Es una razón de la desviación estándar a la media. Fórmula:
CV = (S/X)*100
Según la fórmula anterior, los pasos para obtener el coeficiente de variación son:
1.- Obtener la desviación estándar
2.- Aplicar la fórmula dada.
Ejemplo: Con los datos de la siguiente Tabla, obtenga el coeficiente de variación (CV)
Tabla 2. Distribución de la Concentración de Testosterona (ng/ml) en elplasma de 33 sujetos estudiados
_______________________________
Clases fi
_______________________________
2,05 - 4,25 4
4,25 - 6,45 2
6,45 - 8,65 11
8,65 - 10,85 5
10,85 - 13,05 6
13,05 - 15,25 5
_______________________________
Total 33
Solución: Como en el ejemplo anterior ya se realizaron todos los cálculos, lo que queda es sustituir los valores:
CV = (3,42/9,01) * 100 = 38%
Significa que los datos tienen un 38% de variabilidad.
PERCENTILES
Los percentiles dividen en dos partes las observaciones. Por ejemplo, el percentil 20, P20, es el valor que deja por debajo un 20% y por encima un 80% de las observaciones
L1: es el límite inferior del intervalo crítico (intervalo donde estará contenido el percentil).
I: es la amplitud de los intervalos.fa: es la frecuencia acumulada del intervalo anterior al intervalo crítico.n: es el número de casos.fi: es la frecuencia absoluta del intervalo crítico.
La expresión m ∙ n/100 representa el número de puntuaciones que quedarían por debajo del percentil m en la distribución estudiada. El intervalo crítico es precisamente aquel donde la frecuencia acumulada alcanza o supera ese número de puntuaciones.
DECILES
Es la medida que divide los datos en 10 partes iguales. Cada parte contiene un 10% de las
observaciones. La simbología e “Di” y se obtendrá entonces 10 deciles que son: D1, D2, D3…..D10.
Donde:
• Li: es el límite inferior del intervalo crítico (que contiene a Dm)
• I: es la amplitud de los intervalos.
• fi: es la frecuencia absoluta del intervalo crítico.
• n: es el número de casos.
• fa: es la frecuencia acumulada en el intervalo anterior al intervalo
CUARTILES
Los cuartiles dividen en cuatro partes las observaciones. El primer cuartil Q1 es un valor que deje por debajo de él 25% de las y por encima 75% de las observaciones. El Q2 es la mediana (50%) y Q3 deja por debajo 75% y por encima 25% de las observaciones
Ejercicio:Una prueba de rendimiento en Estadística ha sido calificada con una escala de 0 a 50. Si las puntuaciones obtenidas por los 200 alumnos de una facultad son los que aparecen en la tabla (Tabla 1).
1.- ¿Cuál será el percentil 60 de esa distribución? ¿Qué percentil corresponde a un sujeto cuya puntuación es 25?
2.- Tomando como referencia la distribución de la tabla usada en el ejemplo de los percentiles, determinar la puntuación que constituye el cuarto decil.
3.- Tomando de nuevo la distribución del ejemplo anterior vamos a calcular la calificación obtenida por un alumno que se sitúa en el segundo cuartil.
4.- Realizar en hoja de papel milimetrado tipo ojiva e interprete su sgnificado
Tabla 1.
Calificaciones f1 fa• 2 – 5 4 4
• 6 – 9 18 22
• 10 – 13 14 36
• 14 – 17 20 56
• 18 – 21 20 76
• 22 – 25 54 130
• 26 – 29 14 144
• 30 – 33 21 165
• 34 – 87 10 175
• 38 – 41 15 190
• 42 – 45 6 196
• 46 – 49 4 200