2. estadística inferencial medidas de dispersión
-
Upload
gonzalo-navarro -
Category
Health & Medicine
-
view
266 -
download
0
Transcript of 2. estadística inferencial medidas de dispersión
Medidas de tendencia central y de dispersión
Estadística Inferencial
Dr. Gonzalo Navarro
Contenido– Medidas de Tendencia central
• Media, • Mediana, • Moda
– Medidas de dispersión• Rango, • Varianza y • Desviación típica o Estándar
ContenidoII. Estadística inferencialEstimación del tamaño de la muestra
– Necesidad de la muestra– Riesgos de las muestras– Criterios de la estimación– Modelos de estimación– Ejercicios de estimación.
Asociacion estadística– Indicadores de asociación– La Tabla de 2x2– Validez estadística– Formulación y comprobación de hipótesis
Estadistica descriptiva
• El análisis del comportamiento de las variables numéricas
• Medidas de Tendencia central
• Medidas de Dispersión
Las series de datos
• Una serie de datos es la expresión de los diferentes valores resultantes de las mediciones de una variable
• Series naturales
• Series biológicas
La curva normal• La gráfica de esta función tiene
forma de campana y se conoce con el nombre de campana de Gauss.
• Observa que la forma de la campana y la situación respecto a los ejes dependen de los parámetros m (μ) y s (σ)
• .• Este modelo representa el
comportamiento de los mediciones en la mayoría de las variables biológicas continuas.
• Importancia
Comportamiento de las características biológicas
II. Medidas de tendencia central
• a) Medidas de posición Series simples• Las principales medidas de Tendencia
central son:
• Media• Mediana• Moda
Media • Media aritmética • Supongamos que tenemos la siguiente serie:
4,6,6,7,9,11,13• La Media se calcula sumando todos los términos y
dividiendo la suma (56) entre el número de términos (7)• Media= 56 / 7 = 8.
Formula
Xj: Cada valor posible de X n: Número de términos de la serie
Nota: Un inconveniente de esta medida es que Puede verse afectada por valores extremos
Mediana (Me)
• Es un número que supera la mitad de los valores de la serie y es superada por la otra mitad
• Serie impar: 4,6,7,8,9,11,13• Me = 8
• Nota: No está influida por valores extremos
Mediana (Me)
• Serie par: 4,6,6,7,9,11,13, 15• Me = (7+9) / 2 = 8
• Nota: No está influida por valores extremos
Moda• 2.- Moda: es el valor
(o valores) de la serie de datos que mas se repiten.
Nota: Una serie puede tener mas de una moda o no tener ninguna,
• En la Serie• 4,6,6,7,8,9,13
• Mo= 6.
Distribución Sesgada a la Derecha
0
5
10
15
20
25
30
1 2 3 4 5 6 7 8 9 10 11 12 13
ModaMedian
aMedia
0
5
10
15
20
25
30
1 2 3 4 5 6 7 8 9 10 11 12 13
ModaMedian
aMedia
Distribución Sesgada a la Izquierda
0
10
20
30
40
50
60
70
80
90
1 2 3 4 5 6 7 8 9 10 11 12 13
ModaMedian
aMedia
Distribución Simétrica
Cálculo de Media, Mediana y Moda
a partir de una Tabla de Frecuencia Xj fj fjXj
X1
X2
.
.Xn
f1
f 2
.
. fn
f1X1
f 2 X2
.
.fnXn
∑ fj ∑ fjXj
Xj fj
X1
X2
.
.Xn
f1
f 2
.
. fn
∑ fj
Cálculo de Media
a partir de una Tabla de Frecuencia Xj fj fjXj0123456789
10
2453
11211611453
04
109
441059677324530
85 452
Xj fj
0123456789
10
2453
11211611453
La Media = 452 / 85 = 5,31
Cálculo de Mediana
a partir de una Tabla de Frecuencia acumulada Xj fj % %
acumu lado
0123456789
10
2453
11211611453
2.34.65.93.5
12.924.718.812.94.65.93.5
2.36.9
12.816.329.253.972.785.690.296.199.6
85 100
Xj fj
012345678910
2453
11211611453
85La Mediana = 5
Ejercicio individual 2 APLICANDO LOS CONOCIMIENTOS ADQUIRIDOS EN CLASE DETERMINE LOS VALORES DE: MEDIA, MEDIANA Y MODA
ALUMNO # SERIE
1. Barrantes 12,4, 23, 32, 33, 54, 32.19,20,32,44,12
2. Blandón 44,23,32,15,78,65,65,45,35,43,44
3. Escorcia 95,99,87,67,67,87,88,45,56,54,63,66
4. García 21,22,11,13,14,43,21,22,32,11,23,
5. Gonzalez. 44,43,34,35,54,46,56,44,34,34,54,55,
6. Granado 76,77,77,87,67,67,55,56,76,75,87,88,
7. Guerrero 23,32,23,24,21,14,23,24,25,32,33,
8. Herrera 77,67,68,87,86,67,66,56,65,66,68,76,
9. Huembes 12,13,14,15,21,22,23,24,25,31,32
10. Lainez 43,35,35,55,46,56,41,34,34,54,55, 53
11. Palacios 44,43,34,35,54,46,56,44,34,34,54,55,
12. Paz 90,99,87,67,67,88,45,56,54,63,76
13. Pérez 20,22,11,13,16,43,21,21,32,11,23,
14. Pineda 41,32,35,64,54,34,34,23,34,34,21,21
Ejercicio individual 2 APLICANDO LOS CONOCIMIENTOS ADQUIRIDOS EN CLASE
DETERMINE LOS VALORES DE: MEDIA, MEDIANA Y MODA
.
ALUMNO # SERIE
15. Sanchez 4, 23, 32, 33, 54, 32.19,20,32,44,12, 12
16. Torrez 44, 44, 23, 32,15,78, 65, 65, 45, 35,
17. Vega 66, 95,99,87,67,67,87,88,45,56,54,63
18. Weil 23, 21,22,11,13,14,43,21,22,32,11,
Calculo de la media
• Serie simple
Cálculo de la Media• (1,20*1) + (1,21*4) + (1,22 * 4) + (1,23 * 2) + .... + (1,29 * 3) + (1,30 * 3)
• Xm = ----------------------------------------------------------------• 30
• Luego: Xm =1,25
• Por lo tanto, la estatura media de este grupo de alumnos es de 1,25 cm.
Cálculo de la Mediana• La mediana de esta
muestra es 1,26 cm, ya que por debajo está el 50% de los valores de la serie.
• Esto se puede ver al analizar la columna de frecuencias relativas acumuladas
Variable Frecuencias absolutas Frecuencias relativas(Valor) Simple Acumulada Simple Acumulada
x x x x x1,20 1 1 3,3% 3,3%1,21 4 5 13,3% 16,6%1,22 4 9 13,3% 30,0%1,23 2 11 6,6% 36,6%1,24 1 12 3,3% 40,0%1,25 2 14 6,6% 46,6%1,26 3 17 10,0% 56,6%1,27 3 20 10,0% 66,6%1,28 4 24 13,3% 80,0%1,29 3 27 10,0% 90,0%1,30 3 30 10,0% 100,0%
Cálculo de la Moda• 4.- Moda:• Hay 3 valores que se
repiten en 4 ocasiones:
• el 1,21, • el 1,22 • y el 1,28,• por lo tanto esta serie
cuenta con 3 modas. (Serie trimodal).
Variable Frecuencias absolutas Frecuencias relativas(Valor) Simple Acumulada Simple Acumulada
x x x x x1,20 1 1 3,3% 3,3%1,21 4 5 13,3% 16,6%1,22 4 9 13,3% 30,0%1,23 2 11 6,6% 36,6%1,24 1 12 3,3% 40,0%1,25 2 14 6,6% 46,6%1,26 3 17 10,0% 56,6%1,27 3 20 10,0% 66,6%1,28 4 24 13,3% 80,0%1,29 3 27 10,0% 90,0%1,30 3 30 10,0% 100,0%
Medidas de dispersion
MEDIDAS DE DISPERSIONCómo se alejan los valores de la Media?
• RANGO
• VARIANZA
• DESVIACION ESTANDAR
.
III. Medidas de dispersión• Estudia la distribución
de los valores de la serie, analizando si estos se encuentran más o menos dispersos.
• Existen diversas medidas de dispersión, entre las más utilizadas podemos destacar las siguientes:
• Rango• Varianza• Desviacion típica
Forma de la curva normal y Desviacion estandar
CURVA A CURVA B CURVA C
Medidas de dispersión• En el ejemplo de la
tabla calcule el Rango:
• R= 130cm – 120cm• R= 10cm
Variable Frecuencias absolutas Frecuencias relativas(Valor) Simple Acumulada Simple Acumulada
x x x x x1,20 1 1 3,3% 3,3%1,21 4 5 13,3% 16,6%1,22 4 9 13,3% 30,0%1,23 2 11 6,6% 36,6%1,24 1 12 3,3% 40,0%1,25 2 14 6,6% 46,6%1,26 3 17 10,0% 56,6%1,27 3 20 10,0% 66,6%1,28 4 24 13,3% 80,0%1,29 3 27 10,0% 90,0%1,30 3 30 10,0% 100,0%
Medidas de dispersión• 2.- Varianza:
Mide la distancia existente entre los valores de la serie y la media.
• Expresa la medida en que los valores tienden alejarse de la Media.
• Se calcula como la sumatoria de las diferencias al cuadrado entre cada valor y la media, multiplicadas por el número de veces que se ha repetido cada valor.
• La sumatoria obtenido se divide por el tamaño de la muestra.
Varianza S²• La varianza siempre será mayor que cero.
• Mientras más se aproxima a cero, más concentrados están los valores de la serie alrededor de la media.
• Por el contrario, mientras mayor sea la varianza, más dispersos están.
Varianza (S²)
Xj = Cada valor de la variable en la serie de datos n = Número de individuos en la serieS²x = Varianza de la variable X
Medidas de dispersión• 3.- Desviación típica:
• Se calcula como raíz cuadrada de la varianza.
• S=√S² __
A B C
X y Spequeñas
X y Smayores
X y SMas grandes
Distribución normal y Desviación estandar
"La distribución normal desempeña una función central en las estadísticas clásicas tradicionales y la desviación estándar es la manera usual de representar la dispersión de una distribución normal.
Cálculo de Medidas de dispersión
Variable Frecuencias absolutas Frecuencias relativas
(Valor) Simple Acumulada Simple Acumulada
X x X x x
1,20 1 1 3,3% 3,3%
1,21 4 5 13,3% 16,6%
1,22 4 9 13,3% 30,0%
1,23 2 11 6,6% 36,6%
1,24 1 12 3,3% 40,0%
1,25 2 14 6,6% 46,6%
1,26 3 17 10,0% 56,6%
1,27 3 20 10,0% 66,6%
1,28 4 24 13,3% 80,0%
1,29 3 27 10,0% 90,0%
1,30 3 30 10,0% 100,0%
Cálculo de Medidas de dispersión
• 1.- Rango: • Diferencia entre el
mayor valor de la muestra (1,30) y el menor valor (1,20).
• Luego el rango de esta muestra es
• 1,30 -1,20 =0,10 m.
Variable Frecuencias absolutas Frecuencias relativas
(Valor) Simple Acumulada Simple Acumulada
X x X x x
1,20 1 1 3,3% 3,3%
1,21 4 5 13,3% 16,6%
1,22 4 9 13,3% 30,0%
1,23 2 11 6,6% 36,6%
1,24 1 12 3,3% 40,0%
1,25 2 14 6,6% 46,6%
1,26 3 17 10,0% 56,6%
1,27 3 20 10,0% 66,6%
1,28 4 24 13,3% 80,0%
1,29 3 27 10,0% 90,0%
1,30 3 30 10,0% 100,0%
Varianza
• 2.- Varianza:
• Mide la distancia existente entre los valores de la serie y la media.
• Se calcula como sumatoria de las diferencias al cuadrado entre cada valor y la media,.
• La sumatoria obtenida se divide por el tamaño de la muestra.
3.- Desviación típica o estándar
• Se calcula como raíz cuadrada de la varianza.
• Varianza.
• Desviación estándar
•Expresa la dispersión de la •distribución de los datos .
Ejemplo: vamos a utilizar la serie de datos de la edad, en años cumplidos, de los alumnos de una clase y a calcular sus medidas de
dispersión.
• Dada la serie• 30,19,21,20,20,25,27,25,28,30,19,25
• Procedemos a ordenar los datos• 19,19,20,20,21,23,25,25,27,28,30,30
• Ahora calculemos el Rango• 30-19 = 11
Cálculo de la Varianza
1. Revisar la serie2. Calcular el valor de la Media3. Obtener la diferencia del valor de la Media con
cada uno de los datos de la serie.4. Calcular el cuadrado de cada diferencia5. Sumar todos los cuadrados de las diferencias.6. Dividir la suma anterior entre el número de
datos de la serie.!Ya tiene usted el valor de la Varianza!
Calculo de la VarianzaVALOR
X
PROMEDIO
X
DIFERENCIA
X - X
DIFERENCIA AL CUADRADO
(X - X )
VARIANZA
Σ (X-x)
19
24
24-19=5 25
19 24-19=5 25
20 24-20=4 16
20 24-20=4 16
21 24-21=3 9
23 24-23=1 1
25 24-25=--1 1
25 24-25=-1 1
27 24-27=-3 9
28 24-28=-4 16
30 24-30=-6 36
31 24-31=-7 49
11 204 204/12=17
__2 2
/ n _
Desviacion tipica o estándar• Y sí ya tiene la Varianza
• ! Ya tiene la Desviacion estándar !
• La DE = a la Raiz cuadrada de la Varianza
Respuestas• 1.- Rango: Diferencia entre el mayor valor de la muestra (31) y el menor valor (19). Luego el
rango de esta muestra es.• 31-19 = 21• 2.- Varianza: recordemos que la media de esta muestra es 24. Luego, aplicamos la fórmula:
• Por lo tanto, la varianza es: 204/12=17
• 3.- Desviación estandar: es la raíz cuadrada de la varianza.
• √17 =4.1