7/24/2019 2- Medidas de Tendencia Central y Dispersion
1/44
MEDIDAS DE TENDENCIA CENTRAL
Se utilizan cuando la variable es numrica
La mayora de los conjuntos de datos de este tipo devariables tienden a agruparse en un punto central.
Son tiles para describir de manera ms sinttica losdatos obtenidos y para poder comparar de forma ms
precisa y eficiente las observaciones realizadas de dos
o ms conjuntos de datos.
Para cualquier conjunto de datos,
es posible calcular una medida de
tendencia central que represente
el conjunto de estos datos
Media
Mediana
Modo
7/24/2019 2- Medidas de Tendencia Central y Dispersion
2/44
7/24/2019 2- Medidas de Tendencia Central y Dispersion
3/44
Media : suma de todas las observaciones
dividido el nmero de observacionesEjemplo: nmero de visitas al ao
por paciente
13 7 9 15 11 2 4 4 4 7 9 6 6 5 (N=14)
Media = 102 / 14 = 7.28
7/24/2019 2- Medidas de Tendencia Central y Dispersion
4/44
Cuando los datos son agrupados
7/24/2019 2- Medidas de Tendencia Central y Dispersion
5/44
Para estimarla:
a) Ordenar los datos de menor a mayor
2 4 4 4 5 6 6 7 7 9 9 11 13 15
b) Observar posicin n + 1 / 2, es decir
14 + 1 / 2 = 7.5
La mediana estar entre las observaciones 7 y 8 ( porque da 7.5)
Aqu seria entre los nmeros 6 y 7, (6+7)/2 = 6.5 visitas al ao
7/24/2019 2- Medidas de Tendencia Central y Dispersion
6/44
Y qu diferencia hay entre media y
mediana, la mediana es menos sensible a
valores extremos
Grupo A (visitas/ao)
13 7 9 15 11 2 4 4 4 7 9 6 6 5
Media = 7.28, Mediana = 6.5
Grupo B (visitas/ao) 30 7 9 15 11 2 4 4 4 7 9 6 6 5
Media = 8.5, Mediana = 6.5
7/24/2019 2- Medidas de Tendencia Central y Dispersion
7/44
MEDIDAS DE TENDENCIA CENTRAL
24 24 24 25 7526 26
Edades de un grupo de egresados de la carrera de Sicologa
Media
Mediana
Modo
Medida Valor Comentarios
32
Es el valor que ms se presenta con mayor
frecuencia en el conjunto de datos
Si existen valores extremos, la media no es la
medida ms representativa del conjunto de datos.Es la medida ms representativa en
distribuciones simtricas
25
24
Es la medida ms representativa cuando existen
valores extremos De mayor utilidad para
distribuciones asimtricas
7/24/2019 2- Medidas de Tendencia Central y Dispersion
8/44
MEDIDAS DE ORDEN
PercentilesCuartiles
Son valores que dividen al
conjunto de datos, dejando
por debajo de ellos
determinados porcentajes
Son tres valores (Q1, Q2 y Q3),
que dividen al conjunto de
datos en cuatro partes iguales
Q1 = P25 El 25 % de los datos quedan por debajo
de este valorMediana = Q2 = P50 El 50 % de los datos quedan por debajo
de este valor
Q3 = P 75 El 75 % de los datos quedan por debajo
de este valor
7/24/2019 2- Medidas de Tendencia Central y Dispersion
9/44
Los cuartilos dividen en cuatro
partes a la distribucin P25 = 1er cuartil, P50 = 2do cuartil o mediana,
P 75= 3er cuartil , P100 =4to cuartil
Q1 = (n+1)/4
Q2 = (n+1)/2
Q3 = Q1*3
7/24/2019 2- Medidas de Tendencia Central y Dispersion
10/44
Varianza y desvo estndar
Representan la dispersin de los datos
alrededor de la media aritmtica.
Resulta de restar cada observacin a la
media y se obtiene el cuadrado de ladistancia promedio entre cada valor y la
media de la distribucin
7/24/2019 2- Medidas de Tendencia Central y Dispersion
11/44
Varianza poblacional y varianza
muestral Se utilizan las medias
De la muestra o de la
Poblacin
Principal problema: lainterpretacin del cuadrado deuna medida
Importante para el anlisis de ladiferencias entre y dentro dedistribuciones: Anlisis deVarianza
7/24/2019 2- Medidas de Tendencia Central y Dispersion
12/44
Pero qu significa una medida de
dispersin el cuadrado? Para volver las unidades originales de
medicin calculamos la raiz cuadrada de la
varianza y obtenemos el Desvo Estndar
Por ejemplo: 7.8 visitas +/- 3.7 Ds
7/24/2019 2- Medidas de Tendencia Central y Dispersion
13/44
Desviacion estandar de una
distribucin muestral y poblacional
Muestral
poblacional
7/24/2019 2- Medidas de Tendencia Central y Dispersion
14/44
Qu significa que el percentilo 45 es = 24?
7/24/2019 2- Medidas de Tendencia Central y Dispersion
15/44
Coeficiente de variacin
7/24/2019 2- Medidas de Tendencia Central y Dispersion
16/44
7/24/2019 2- Medidas de Tendencia Central y Dispersion
17/44
MEDIDAS DE DISPERSION
Rango
Rango
IC
DesvoEstndar
Medida Clculo ComentariosDiferencia entre el
valor mayor y el
menor
Mide la dispersin de datos
alrededor de la media.
Por lo menos el 75% de losdatos quedan siempre entre la
media menos
2 DE y la media ms 2 DE.
Se basa en slo dos valores que
pueden ser muy extremos.
Diferencia entre
Q3-Q1
Ver frmula
Representa la distancia entre los
valores entre los cuales se halla
el 50% central de los datos
Se utilizan para determinar como se distribuyen los datos
alrededor de las medidas de tendencia central
7/24/2019 2- Medidas de Tendencia Central y Dispersion
18/44
RESUMEN DE LOS DATOS DE
ACUERDO AL TIPO DE VARIABLE
Numrica Ordinal Nominal
Medidas
de frecuencia
Medidas de
tendencia
central
Medidas de
dispersin
Proporciones
Porcentajes
Razones
Tasas
Proporciones
Porcentajes
Razones
TasasMedia
Mediana
Modo
Mediana
ModoModo
Percentiles
CuartilesRango
Rango IC
DE/Varianza
Medidas de
orden
7/24/2019 2- Medidas de Tendencia Central y Dispersion
19/44
Amplitud o rango
Diferencia entre el menor y mayor valor de
una distribucin:
7 8 9 10 11 12 ., rango = 7-12 = 5
7/24/2019 2- Medidas de Tendencia Central y Dispersion
20/44
Como calcular con epi info ?
7/24/2019 2- Medidas de Tendencia Central y Dispersion
21/44
Observar:
7/24/2019 2- Medidas de Tendencia Central y Dispersion
22/44
Distribucin normal
7/24/2019 2- Medidas de Tendencia Central y Dispersion
23/44
Caractersticas de la curva normal
7/24/2019 2- Medidas de Tendencia Central y Dispersion
24/44
La distribucin normal, tambin
llamada distribucin de Gauss o
distribucin gaussiana, es la
distribucin de probabilidad que con msfrecuencia aparece en estadstica y teora
de probabilidades. Esto se debe a dos
razones fundamentalmente:
http://es.wikipedia.org/wiki/Distribuci%C3%B3n_de_probabilidadhttp://es.wikipedia.org/wiki/Estad%C3%ADsticahttp://es.wikipedia.org/wiki/Teor%C3%ADa_de_probabilidadeshttp://es.wikipedia.org/wiki/Teor%C3%ADa_de_probabilidadeshttp://es.wikipedia.org/wiki/Teor%C3%ADa_de_probabilidadeshttp://es.wikipedia.org/wiki/Teor%C3%ADa_de_probabilidadeshttp://es.wikipedia.org/wiki/Estad%C3%ADsticahttp://es.wikipedia.org/wiki/Distribuci%C3%B3n_de_probabilidad7/24/2019 2- Medidas de Tendencia Central y Dispersion
25/44
7/24/2019 2- Medidas de Tendencia Central y Dispersion
26/44
7/24/2019 2- Medidas de Tendencia Central y Dispersion
27/44
7/24/2019 2- Medidas de Tendencia Central y Dispersion
28/44
Su funcin de densidad es simtrica y con forma de
campana, lo que favorece su aplicacin como modelo a
gran nmero de variables estadsticas.
Es, adems, lmite de otras distribuciones y aparecerelacionada con multitud de resultados ligados a la teora
de las probabilidades gracias a sus propiedades
matemticas.
http://es.wikipedia.org/wiki/Funci%C3%B3n_de_densidadhttp://es.wikipedia.org/wiki/Matem%C3%A1ticashttp://es.wikipedia.org/wiki/Matem%C3%A1ticashttp://es.wikipedia.org/wiki/Funci%C3%B3n_de_densidad7/24/2019 2- Medidas de Tendencia Central y Dispersion
29/44
7/24/2019 2- Medidas de Tendencia Central y Dispersion
30/44
Asimetra
Adems de la posicin y la dispersin de un
conjunto de datos, es comn usar medidas deforma en la descripcin. Una de estas medidas
es una estadstica que busca expresar la
simetra ( o falta de ella ) que manifiestan los
datos.
7/24/2019 2- Medidas de Tendencia Central y Dispersion
31/44
Kurtosis
Leptocurtica
Mesocurtica
Platicurtica
7/24/2019 2- Medidas de Tendencia Central y Dispersion
32/44
Hay test adems de la vista
grfica para determinar asimetra Veremos con SPSS y con Stata como
determinarlo
Epi info no permite
7/24/2019 2- Medidas de Tendencia Central y Dispersion
33/44
Parmetros y estadsticos
Supongamos que estamos interesados en
determinar la prevalencia de Diabetes en la
ciudad de Mar del Plata
Es factible?
Conoceremos la prevalencia en toda la
poblacin?
7/24/2019 2- Medidas de Tendencia Central y Dispersion
34/44
Parmetro
Cantidad calculada sobre una poblacin
Reunimos toda la informacion
Estadstico
Cantidad calculada sobre una muestra de lapoblacin
Muestra representativa?
7/24/2019 2- Medidas de Tendencia Central y Dispersion
35/44
La muestra, el error
7/24/2019 2- Medidas de Tendencia Central y Dispersion
36/44
7/24/2019 2- Medidas de Tendencia Central y Dispersion
37/44
Investigaciones epidemiolgicas
7/24/2019 2- Medidas de Tendencia Central y Dispersion
38/44
7/24/2019 2- Medidas de Tendencia Central y Dispersion
39/44
(1-p)
Para medias
Para
proporciones
7/24/2019 2- Medidas de Tendencia Central y Dispersion
40/44
Intervalo de confianza
Con qu certeza estoy afirmando lo que
estoy afirmando?
Es decir, una vez obtenido un valor a partirde una muestra.con qu confianza puedo
afirmar que el verdadero parmetro
(poblacin) est incluido en la estimamuestral?
7/24/2019 2- Medidas de Tendencia Central y Dispersion
41/44
Para medias
prevalencias (1-p)
7/24/2019 2- Medidas de Tendencia Central y Dispersion
42/44
El error estndar nos dice como varan los
promedios de las diversas muestras tomadas de la
misma poblacin respecto del promedio de lospromedios (mide el desvo de los promedios
respecto del gran promedio o gran media)
El desvo estndar nos dice como vara cada
observacin individual respecto del promedio deuna muestra (mide el desvio de las observaciones
individuales respecto del promedio)
7/24/2019 2- Medidas de Tendencia Central y Dispersion
43/44
Intervalo de confianza y curva normalEn esta distribucin normal de medias se puede calcular el
intervalo de conf ianza donde se encontrar la mediapoblacional si slo se conoce una media muestral, con
una confianza determinada. Habitualmente se manejan
valores de confianza del 95% y 99%. A este valor se le
llamar 1 (debido a que es el error que se cometer).
P ll it l l l t X / 2 j
7/24/2019 2- Medidas de Tendencia Central y Dispersion
44/44
Para ello se necesita calcular el punto X / 2 o mejor
dicho su versin estandarizada Z / 2junto con su
"opuesto en la distribucin" X / 2. Estos puntos
delimitan la probabilidad para el intervalo, como semuestra en la siguiente imagen:
Recordando la tabla de
reas bajo la curva
normal
Aproximaciones para el valor Z / 2 para los niveles de
confianza estndar son 1,96 para 1 = 95% y 2,576
para 1 = 99%.
Top Related