Medidas de tendencia_2013
-
Upload
leslie-eliana-gasco-arteaga -
Category
Documents
-
view
383 -
download
0
Transcript of Medidas de tendencia_2013
UNIVERSIDAD NACIONAL PEDRO RUIZ GALLO
Dra. BLANCA FALLA ALDANA Dra. BLANCA FALLA ALDANA
Ciencia, su sustento es teoría de las probabilidades
Para procesar información y tomar decisiones
Herramienta para investigación
Conjunto de métodos y procedimientos para captar, elaborar e interpretar datos sujetos a variaciones.
Predice fenómenos aleatorios que pueden expresarse cuantitativamente.
Utiliza para ser inferencias validas para una población mas amplia de características similares.
La finalidad del análisis es establecer las conclusiones a una población donde la muestra sea representativa.
ESTADISTICA
SCHWARTS (1981)
Métodos de razonamiento, interpreta datos de la ciencias de la vida.
Su carácter es la variabilidad.
LAST (1988)
Resumen y analiza datos sujetos a variaciones aleatorias.
ESTADÍSTICA
Comprende la organización, presentación de datos de manera científica.
Incluye diversos métodos de organizar y representar gráficamente los datos.
Revisa y clasifica datos.
Calcula medidas de tendencia central y de dispersión.
Representa gráficamente los datos
Comprende la organización, presentación y síntesis de datos de manera científica
ESTADÍSTICA DESCRIPTIVA
• Describe lo que esta pasando y realiza inferencias.
• Toma decisiones probabilísticas.
• Toda generalización tiene un margen de error.
• Comprende las bases lógicas mediante las cuales se establecen conclusiones.
ESTADÍSTICA INFERENCIAL
Proporciona métodos para estimar las características de un grupo (población) basándose en los datos de un conjunto pequeño (muestra).
PoblaciónMuestra
ESTADÍSTICA INFERENCIAL
Población
El resultado de un análisis estadístico no es un objetivo en sí mismo, sino una herramienta para:
Comprobar o rechazar una hipótesis de trabajo, Representar de una forma eficiente y resumida un colectivo de observaciones, para validar un modelo de un proceso fisiológico.
ESTADÍSTICA EN MEDICINA
En el grupo de datos cuantitativos tenemos:
Aquellos cuyo resultado puede variar de forma continua, como puede ser el peso, la presión arterial, el nivel de colesterol, etc.
Los que sólo pueden tomar valores enteros como por ejemplo el número de hijos, el número de ingresados en el Servicio de Ortopedia, un día concreto, etc.
DATOS CUANTITATIVOS
Pueden ser:
Nominales, que constituyen una simple etiqueta como puede ser el sexo, el grupo sanguíneo, etc.
Ordinales, en las que se da una relación de orden entre las respuestas, por ej. resultado de una patología/tratamiento (fallece, empeora, sin cambios, mejora, curación).
DATOS CUALITATIVOS
Indicar un valor central y uno de variabilidad o dispersión.
Cuando es razonable suponer que los datos pueden seguir una distribución normal, se estimará la media y la desviación estándar.
Ejemplo: La media de la PAS fue de 139.2 ± 14.9 mmHg.
PRESENTACIÓN DE DATOS CUALITATIVOS
Son valores promedios que representan a toda la muestra de valores
Indican el punto medio de la distribución.
Nos indican en torno a que valor (centro) se distribuyen los datos.
En una distribución de frecuencias las medidas de tendencia central son: Media, mediana y moda.
MEDIDAS DE TENDENCIA CENTRAL
Es un valor representativo o promedio.
x se calcula a partir de la distribución de frecuencias.
Suma l os valores de todas las observaciones y se divide por el numero total.
Ventaja. Su fácil manejo matemático y estadístico.
Se usa en datos intervalicos y proporcionales.
Limitación sensibilidad a los valores extremos
X1, x2, x3, ………xn
x = x1, x2, x3, … xn
n
x = Ʃ xi
n
MEDIA
PROPIEDADES DE LA MEDIA ARITMÉTICA
Propiedades de la media aritmética La suma de las desviaciones de todas las puntuaciones de una
distribución respecto a la media de la misma igual a cero.
Las suma de las desviaciones de los números 8, 3, 5, 12, 10 de su media aritmética 7.6 es igual a 0:
8 − 7.6 + 3 − 7.6 + 5 − 7.6 + 12 − 7.6 + 10 − 7.6 = = 0. 4 − 4.6 − 2.6 + 4. 4 + 2. 4 = 0
1.- DATOS NO AGRUPADOS: Los pesos de 6 amigos son 84,91,72,68,87 y 78 kilos. Hallar el peso medio.
X = 84 +91 +72 +68 +87 + 78 = 480 = 80
6 6
_
CALCULO DE LA MEDIA : EJEMPLOS
2.- DATOS AGRUPADOS: Si lo s datos vienen agrupados en una tabla de frecuencia
X = Σxi . fi N _xi
fi xi · fi
[10, 20) 15 1 15
[20, 30) 25 8 200
[30,40) 35 10 350
[40, 50) 45 9 405
[50, 60 55 8 440
[60,70) 65 4 260
[70, 80) 75 2 150
42 1 820
En un brote de hepatitis A, 6 personas iniciaron síntomas 24 a 31 días después de la exposición. Calcule el promedio del período de incubación en éste brote; los períodos de incubación para las i personas afectadas (X) fueron: 29,31,24,29,30 y 25.
1.- Para calcular el numerador sume las observaciones individuales
x = 29+31+24+29+30+25= 168
2.- Para calcular el denominador cuente el número de las observaciones : n=6
3.- Para calcular la media divida el numerador sumatoria de las observaciones) entre el denominador (numero de las observaciones).
media x = 29 31 24 29 30 25 = 168 = 28 días
6 6
Entonces: el promedio del período de incubación del brote es 28 días.
En una lista de 5 variables para 11 personas. Vamos a demostrar como se
calcula la media de cada variable (A-E) en el listado.
Persona # Variable A Variable B Variable C Variable D Variable E 1 0 0 0 0 0 2 0 4 1 1 6 3 1 4 2 1 7 4 1 4 3 2 7 5 1 5 4 2 7 6 5 5 5 2 8 7 9 5 6 3 8 8 9 6 7 3 8 9 9 6 8 3 9 10 10 6 9 4 9 11 10 10 10 10 10
1. Para calcular el numerador, sume todas las observaciones individuales:
A. ∑i x = 0+0+1+1+1+5+9+9+9+10+10 = 55
B. ∑i x = 0+4+4+4+5+5+5+6+6+6+10 = 55
C. ∑i x = 0+1+2+3+4+5+6+7+8+9+10 = 55
D. ∑i x = 0+1+1+2+2+2+3+3+3+4+10 = 31
E. ∑i x = 0+6+7+7+7+8+8+8+9+9+10 = 79
2.- Para calcular el denominador cuente el número de observaciones (n=11) para cada variable.
3.- Para calcular la media, divida el numerador (suma de las observaciones) entre el denominador (número de las observaciones).
» Media de la variable A= 55/11= 5
» Media de la variable B= 55/11= 5
» Media de la variable C= 55/11= 5
» Media de la variable D= 31/11= 2.82
» Media de la variable E= 79/11= 7.18
Se define a la observación equidistante de los extremos.
Es un valor que va a dividir una representación ordenada en dos partes iguales.
La mitad de las observaciones tienen valor inferior o igual a la mediana y la otra mitad igual o mayor a la mediana.
Los cálculos se ordenan según su valor en la escala de medición.
Si N es impar la mediana será el valor correspondiente a la observación situada en el centro
1,2, 3,4, 5,7, 9
Si N es par la mediana será la media de las variaciones centrales
3, 7, 5, 4, 2, 8, 11, 1 Ventaja : Se usa en variables ordinales
1, 2, 3, 4, 5, 7, 8, 11 Desventaja: Limitaciones de su manejo matemático.
Me= 4+5 = 4.5
2
MEDIANA
DATOS AGRUPADOS: La mediana es el valor de la variable que tiene la propiedad de que los valores
menores que él son tan frecuentes como los mayores que él.
X = Li + N/2 – fd fc
donde: Li = Límite inferior del intervalo crítico N = Nº total de datos fd = Frecuencia acumulada por debajo del intervalo crítico fc = Frecuencia del intervalo crítico i = Amplitud del intervalo
MEDIDAS DE TENDENCIA CENTRAL. MEDIANA
i Rango mediano = (n+1) 2
INTERVALOS fi Fac.
151,5 – 172,5 5 5
172,5 – 193,5 7 12
193,5 – 214,5 9 21
214,5 – 235,5 6 27
235,5 – 256,5 3 30
30
X = Li + N/2 – fd . i = 193,5 + 30 /2 - 12 . 21 = 200,5
fc 9
Rango mediano = (n+1) 2
Es menos sensible que la media a la variación de las puntuaciones.
Se puede calcular aunque existan algún intervalo abierto, siempre que no
sea ese el intervalo crítico
Es más representativa cuando la distribución tiene puntuaciones muy
extremas.
Ejemplo: A 24,25,29,30,31 Media 28.0 mediana 29 B 24,25,29,30,131 Media 44.7 mediana 29
CARACTERÍSTICAS DE LA MEDIANA
MODA
Es el valor de mayor frecuencia en el conjunto de observaciones. Se representa por MO
Ventaja: se usa para datos nominales.
Limitación: Puede no existir ninguna moda o existir mas de uno.
- Hallar la moda de la distribución:
2, 3, 3,4,4,4,5,5,
MO = 4
Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la máxima, la distribución es bimodal o multimodal, es decir, tiene varias modas.
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 Mo= 1, 5, 9
Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda.2, 2, 3, 3, 6, 6, 9, 9.
Si dos puntuaciones adyacentes tienen la frecuencia máxima, la moda es el promedio de las dos puntuaciones adyacentes.0, 1, 3, 3, 5, 5, 7, 8 Mo = 4
CURVA NORMAL ESTADÍSTICA
Curva de Gauss o en campana.
Se caracteriza porque dado el promedio y la Ds es posible reconstruirlo y precisar el área que existe bajo cualquier segmento.
Se extiende entre – 0 a +0 su comportamiento bajo la curva es igual a la unidad.
En ella coincide la media, mediana y moda.
Es la distribución teórica de probabilidad mas importante y se usa en la mayoría de variables continuas biológicas.
Entre el valor central y una Ds se encuentra el 68.3 del área
Dos Ds equivale al 95%; 2.5 Ds equivale al 98.8 y 3 Ds equivale al 99.7%
IMPORTANCIA
Describe fenómenos biológicos ya que tiene una distribución de este tipo para un valor promedio que establece la tendencia central del fenómeno en medición.
Estima probabilidad de ocurrencia de diversos eventos.
La mayoría de los Test estadísticos dan por supuesto que provienen de una distribución normal.
PROPIEDADESPROPIEDADESPROPIEDADESPROPIEDADES
Es simétrica, una de las partes es fiel reflejo de la otra.
La validez de la media aritmética son iguales en una distribución
normal.
El intervalo de valores o recorrido son las medidas de variabilidad.
Es la distancia entre los valores máximos y mininos.
La media, mediana y moda tienen el mismo valor.
Las colas de la curva están cada vez mas próximos al eje x.
Es unimodal .
INTERPRETACIONINTERPRETACION
Se aplica al raciocinio de las pruebas de significación estadística
La determinación de la significación estadística es un fenómeno probabilístico: Mide la probabilidad de que un evento sea debido al azar.
El resultado de la significación esta estrechamente ligado al numero de observaciones realizadas.
Una diferencias estadísticamente significativa solo indica que existe una baja probabilidad de que el azar explique la diferencia.
El limite de significación para que el hallazgo se considere significativo tiene que ser igual o menor a 0.05 %.
La dos probalidades de error:
- Error tipo 1 o @ existe diferencia significativa cuando de hecho no existe diferencia real.
- Error tipo 2 o ɞ no existe la diferencia cuando en verdad existe
Distribución normal: curva simétrica
0
5
10
15
20
25
30
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
ASIMETRÍA A LA IZQUIERDA
0
5
10
15
20
25
30
1 2 3 4 5 6 7 8 9 10 11 12 13
ASIMETRÍA A LA DERECHA
0
5
10
15
20
25
30
1 2 3 4 5 6 7 8 9 10 11 12 13
Permiten conocer otros puntos característicos de la distribución que no son los valores centrales.
Cuartiles, deciles y percentiles.
MEDIDAS DE ORDENMEDIDAS DE ORDENMEDIDAS DE ORDENMEDIDAS DE ORDEN
PERCENTILES
Los percentiles dividen en dos partes las observaciones. Por ejemplo, el percentil 20, P20, es el valor que deja por debajo un 20% y por encima un 80% de las observaciones.
PERCENTILES (P): Es el valor de la variable por debajo del cual se encuentra un porcentaje determinado de observaciones.
PERCENTILES
Mínimo MáximoPercentil 20
P20
20% 80%
CUARTILES (Q): Son los valores de la variable que dejan por debajo el:
25% de los datos ............... Primer cuartil Q1 (25%)
50% de los datos................ Segundo cuartil Q2 (50%)
75% de los datos................ Tercer cuartil Q3 (75%)
ÍNDICES DE POSICIÓNÍNDICES DE POSICIÓNÍNDICES DE POSICIÓNÍNDICES DE POSICIÓN
CUARTILES
MínimoMáximoCuartil 1
Q1
Cuartil 3
Q3
MedianaCuartil 2
Q2
25% 25% 25%25%
25% 75%
25%75%
Estudia lo concentrada o dispersa que está la distribución de los datos con respecto a la media aritmética.
Rango o recorrido, desviación media, varianza y desviación típica o estándar, y coeficiente de variación.
MEDIDAS DE DISPERSIÓNMEDIDAS DE DISPERSIÓNMEDIDAS DE DISPERSIÓNMEDIDAS DE DISPERSIÓN
_
RANGO, RECORRIDO O AMPLITUD:
Es la diferencia entre los valores más grande y más pequeño de la distribución.Ejemplo:
En éste ejemplo se demuestra cómo se encuentran los valores
mínimo y máximo y el rango de los siguientes datos:
29,31,24,29,30,25.
1.- Organice los datos de menor a mayor: 24,25,29,29,30,31.
2.- Identifique los valores mínimo y máximo: mínimo=24 y máximo=31
3.- Calcule el rango: rango = máximo - mínimo =31-24=7; entonces el rango
es igual a 7.
MEDIDAS DE DISPERSIÓN
Es la diferencia entre el tercer cuartil y el primero (Q3 – Q1).
1. Organice las observaciones en orden ascendente.
Dados estos datos: 13, 7, 9, 15, 11, 5, 8, 4,
hay que organizarlos así: 4, 5, 7, 8, 9, 11, 13, 15.
2. Encuentre la posición del primer y el tercer cuartil. Dado que hay 8 observaciones, n = 8.
posición del primer cuartil (Q1) = (n + 1) / 4
= (8 + 1) / 4 = 2.25
posición del tercer cuartil (Q3) = 3(n + 1) / 4 = 3 x Q1
3(8 + 1) / 4 = 6.75 Así, se encuentra Q1 (1/4) de las observaciones entre 2 y 3 y Q3 es (3/4) entre las observaciones entre 6 y 7.
RANGO INTERCUARTILICO
3. Identifique el valor del primer y el tercer cuartil.
Valor de Q1: La posición de Q1 es 2 1/4; así, el valor de Q1 es el
valor de la observación 2 más 1/4 de la diferencia entre los valores
de las observaciones 2 y 3.
Valor de la observación 3 (ver paso 1) : 7
Valor de la observación 2: 5
Q1 = 5 + 1/4( 7-5 ) = 5 + 1/4(2) = 5 + 0,5 = 5.5
Valor de Q3:
La posición de Q1 es 6 3/4; así, el valor de Q3 es el valor de la
observación 6 más 3/4 de la diferencia entre los valores de las
observaciones 6 y 7.
Valor de la observación 7 (ver paso 1) : 13
Valor de la observación 6: 11
Q3 = 11 + 3/4( 13-11 ) = 11 + 3/4 (2) = 11 + 1.5 = 12.5
4. Calcule el rango intercuartílico como Q3 menos Q1.
Q3 = 12,5 (ver paso 3) Q1 = 5,5
Rango intercuartílico = 12,5 - 5,5 = 7
En general, se usan los cuartiles y el rango intercuartílico para describir la variabilidad cuando se está usando la mediana como la medida de tendencia central.
Cuando se está usando la media aritmética, hay que usar la desviación típica.
VARIANZA: Es la media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmética.
_S² = Σ (xi - X )² o bien S² = 1 Σxi ² - (Σxi )² N N NTambién: S² = Σxi ² - X ²
N
_
Para datos agrupados:
S² = Σfi (xi - X )² o bien S² = 1 Σfi . xi ² - (Σfi . xi )² N N N
También: S² = Σfixi ² - X ² N
_
_
Si se resta la media aritmética de cada observación, la suma de las diferencias es cero.
Este concepto de restar la media de cada observación es la base para dos medidas de dispersión: la varianza y la desviación típica o estándar.
Para estas medidas, hay que elevar al cuadrado las diferencias para eliminar los números negativos.
Después, se suma el cuadrado de las diferencias y se divide por n-1 para
encontrar la "media" de las diferencias al cuadrado.
Esta "media" es la VARIANZA
VARIANZA Y DESVIACIÓN TIPICA
Para convertir la varianza a las unidades originales, hay que
obtener la raíz cuadrada. Se denomina DESVIACIÓN TIPICA
Ó ESTANDAR .
DESVIACIÓN TÍPICA
DESVIACIÓN TÍPICA: Es la raíz cuadrada de la varianza
Valor menos la media Diferencia Diferencias al cuadrado
24 - 28 - 4 16
25 - 28 - 3 9
29 - 28 +1.0 1
29 - 28 +1.0 1
30 - 28 +2.0 4
31 - 28 +3.0 9
168 - 168 = 0 -7+7=0 40
Varianza = ∑ diferencias cuadráticas = 40 = 8 n - 1 5
Desvío estándar= √8 = 2.83
La varianza y la desviación estándar son medidas de la desviación o dispersión de las observaciones alrededor de la media de la distribución.
La varianza es la media de las diferencias cuadradas de las observaciones alrededor de la media. Se representa como "S2 " en las fórmulas.
La desviación estándar es la raíz cuadrada de la varianza; se representa con "s"
El CV es igual al cociente entre la desviación típica y la media.
Si encontramos que el coeficiente de variación es próximo o mayor que 0.5 y no puede haber datos negativos, la distribución no es normal.
Una distribución tiene X = 140 y s = 28 y otra X = 150 y s = 24. ¿Cuál de las dos presenta mayor dispersión?
La primera distribución presenta mayor dispersión.
COEFICIENTE DE VARIACIÓN DE PEARSON:
Es la «desviación típica medida en unidades de media» y se mide en %; o lo que es lo mismo, indica el tanto por ciento de la media que representa la desviación típica. Así:
CV = S / X . 100