Dispersión o Variación
• La dispersión o variación de los datos intenta dar una idea de cuan esparcidos se encuentran estos. Hay varias medidas de tal dispersión, siendo las mas comunes: – El Rango.
– La Desviación Media.
– El rango semi-intercuartil.
– El rango percentil 10-90.
– La desviación típica.
El Rango
• El rango de un conjunto de números es la diferencia entre el mayor y el menor de todos ellos.
• Ejemplo: el rango del conjunto 12, 3, 5, 8, 5, 2, 10, 3, 5 es
Desviación Media • La desviación media o desviación promedio, de
un conjunto de N números X1, X2, … , XN es abreviada por MD y se define como
• Donde las barras | | denotan el valor absoluto
del interior (El valor absoluto de un numero, es el numero sin signo; así |-4|=4, |3|=3, |6|=6, |-0.84|=0.84). Es decir, la desviación media es el promedio de las desviaciones absolutas.
XXN
XX
MD
N
j
j
1
1.1 -1.2 1.2
1.2 -1.1 1.1
2.4 0.1 0.1
5.5 3.2 3.2
2.4 0.1 0.1
1.2 -1.1 1.1
Promedios 2.3 1.1333
2 -1.5714 1.5714
4 0.4286 0.4286
6 2.4286 2.4286
2 -1.5714 1.5714
5 1.4286 1.4286
2 -1.5714 1.5714
4 0.4286 0.4286
Promedios 3.5714 1.3469
Ejemplos • Calcule el rango y la desviación media de los siguientes
datos • 2, 4, 6, 2, 5, 2, 4
Rango= MD=
• 1.1, 1.2, 2.4, 5.5, 2.4, 1.2 – Rango= – MD=
Xj Xj-X ̅ |Xj-X ̅|
2
4
6
2
5
2
4
Promedios
Xj Xj-X ̅ |Xj-X ̅|
1.1
1.2
2.4
5.5
2.4
1.2
Promedios
1.3469
5.5-1.1=4.4 1.1333
6-2=4
Desviación Típica y Varianza • La desviación típica (o desviación standard )de un
conjunto de N números X1, X2, … , XN se denota por “s” y se define como
• Es decir, la desviación típica es la media
cuadrática de las desviaciones. • La varianza de un conjunto de datos se define
como el cuadrado de la desviación típica y viene dada en consecuencia por s2.
21
2
XXN
XX
s
N
j
j
2 -1.5714 2.4693
4 0.4286 0.1837
6 2.4286 5.8981
2 -1.5714 2.4693
5 1.4286 2.0409
2 -1.5714 2.4693
4 0.4286 0.1837
Promedios 3.5714 2.2449
Xj Xj-X ̅ (Xj-X ̅)2
2
4
6
2
5
2
4
Promedios
Xj Xj-X ̅ (Xj-X ̅)2
1.1 -1.2 1.44
1.2 -1.1 1.21
2.4 0.1 0.01
5.5 3.2 10.24
2.4 0.1 0.01
1.2 -1.1 1.21
Promedios 2,3 2.3533
Ejemplos • Calcule la varianza y desviación típica de los siguientes
datos • 2, 4, 6, 2, 5, 2, 4
s2= s=
• 1.1, 1.2, 2.4, 5.5, 2.4, 1.2 s2= s=
Xj Xj-X ̅ (Xj-X ̅)2
1.1
1.2
2.4
5.5
2.4
1.2
Promedios
1.4983
2.3533 1.5340
2.2449
Métodos Cortos para calcular la Desviación Típica
• La formula anterior de la desviación típica puede reescribirse como
• Esta formula es muy útil cuando los valores de X no son muy grandes.
• Si los valores de X son grandes, es preferible calcularlo a partir de la definición, o con la formula siguiente.
22
2
11
2
XXN
X
N
X
s
N
j
j
N
j
j
Métodos Cortos para calcular la Desviación Típica
• Si dj=Xj-A son las desviaciones de Xj respecto de alguna constante arbitraria A, la expresión anterior
• Esta formula es muy útil, si los valores de X son muy grandes, encontramos un valor de A que haga cero la mayoría de las desviaciones, o para no trabajar con tantos números decimales.
22
2
11
2
ddN
d
N
d
s
N
j
j
N
j
j
Xj Xj-A (Xj-A)2
2 -2 4
4 0 0
6 2 4
2 -2 4
5 1 1
2 -2 4
4 0 0
4 -0.4286 2.4286
Xj Xj2
2 4
4 16
6 36
2 4
5 25
2 4
4 16
Promedios 3.5714 15
Ejemplos • Calcule la desviación típica de los siguientes datos • 2, 4, 6, 2, 5, 2, 4
s2= s=
Xj Xj2
2
4
6
2
5
2
4
Promedios
Xj Xj-A (Xj-A)2
2
4
6
2
5
2
4
A=
22
222
dds
dds
22
222
XXs
XXs
AXd jj
s2=2.4286-(-0.4286)2=2.2449 15-3.57142=2.2451 1.4984
Propiedades de la desviación típica
• En la mayoría de los problemas sociales se cumple que – 68.27% de los casos están entre X̅-s y X̅+s (o sea,
una desviación típica a cada lado de la media).
– 95.45% de los casos están entre X̅-2s y X̅+2s (o sea, dos desviaciones típicas a cada lado de la media).
– 99.73% de los casos están entre X̅-3s y X̅+3s (o sea, tres desviaciones típicas a cada lado de la media).
Propiedades de la desviación típica
• Supongamos que dos conjuntos de N1 y N2 números tienen varianzas dadas por s12 y s22 respectivamente, y tienen la misma media aritmética. Entonces la varianza combinada de ambos conjuntos vendrá dada por
• Nótese que esto es una media aritmética ponderada de las varianzas. El resultado admite generalización a mas conjuntos
21
2
22
2
112
NN
sNsNs