5/28/2018 Medidas de Variacion
1/37
ESTADISTICA DESCRIPTIVA
SESION 3-4
5/28/2018 Medidas de Variacion
2/37
Sesin 3 y 4
5/28/2018 Medidas de Variacion
3/37
TAREAS
2.31
2.71
2.89
5/28/2018 Medidas de Variacion
4/37
Estudio
enumerativo
Estadstica
descriptiva
Recoleccin
de datos
Presentacin
de datos
Caracterizacion
de datos
Papel de paquetes
de computacion
Estadisticas
Parmetros
Muestra
Estudio
analtico
PoblacinMejora
del proceso
Pensamiento
estadstico
5/28/2018 Medidas de Variacion
5/37
Distribucinde porcentaje
acumulado
Distribucinde frecuencia
relativa
Distribucinde porcentaje
Distribucin de
frecuencia relativa
acumulada
Histograma Polgono
Grfica
digipunto
Diagrama de
tallo y hojas
Clesificacin
ordenada
Presentacin de
datos nmericos
No SiTiempo
ordenado
Ojiva
Distribucin de
frecuencia
5/28/2018 Medidas de Variacion
6/37
Polgono
No agrupados AgrupadosForma de
datos
Datos sin
procesar
Claificacin
ordenada
Diagrama de
tallos y hojas
Distribucin
de frecuenciaOjiva
Propiedades de datos
nmericos
Tendencia
centralVariacin
Coeficiente de
variacin
Varianza
Desvio
estndar
Forma
Grafica de
Caja y bigotesRango
Rango
intercuartil
Media
Mediana
Moda
Rango medio
Eje medio
5/28/2018 Medidas de Variacion
7/37
Total 100%
Fila 100%
Columna
100 %
Grfica de
pastel
Grfica de
barrasGrfica de puntos
Diagrama
De Pareto
Tabla deresumen
Supertabla
Presentacinde
Datos categoticos
>2
1 2
Tabulaciones cruzadas(Tabla de contigencias)
Nmero
de
variables
5/28/2018 Medidas de Variacion
8/37
Resumen Medidas
Tendencia Central
Media
MedianaModa
Cuartil
Media geomtrica
Resumen Medidas
Variacin
Variacin
Desviacin estndar
Coeficiente
de Variacin
Rango
5/28/2018 Medidas de Variacion
9/37
Medidas de Tendencia Central
Tendencia Central
Media Mediana Moda
Media Geometrica1
1
n
i
i
N
i
i
X
X n
X
N
1/
1 2
n
G nX X X X
5/28/2018 Medidas de Variacion
10/37
Media (Media Aritmtica)
Media (Media Aritmtica) de un conjuntode datos
Media simple
Media de la poblacin
1 1 2
n
i
i n
XX X X
Xn n
1 1 2
N
i
i N
XX X X
N N
Tamao muestra
Tamao Poblacin
5/28/2018 Medidas de Variacion
11/37
Media (Aritmetica)
La ms Comn Medida de Tendencia
Central
Afectada por Valores Extremos (Outliers)
(continua)
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14
Media = 5 Media = 6
5/28/2018 Medidas de Variacion
12/37
Aproximacin a la Media Aritmetica
Usada cuando la disposicin de los datos no est
disponible
n = tamao de la muestrac = nmero de clases
mj= media de clase
fj= frecuencia de clase
Media (Aritmetica(continua)
1
c
j j
j
m f
Xn
5/28/2018 Medidas de Variacion
13/37
Mediana
Medida robusta de Tendencia Central
No es Afectada por valores Extremos
En un arreglo ordenado, la Mediana is la Media delos Numeros Si n o N is impar, la mediana is el nmero del medio
Si n o N is par, la mediana is el promedio de los 2nmeros del medio
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14
Mediana = 5 Mediana = 5
5/28/2018 Medidas de Variacion
14/37
Moda
Una medida de Tendencia Central Valor que ocurre con ms frecuencia
No es afectado por valores extremos
Puede no haber una Moda Puede haber varias Modas
Se usa para valores Numericos y Categoricos
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Moda = 9
0 1 2 3 4 5 6
No Moda
5/28/2018 Medidas de Variacion
15/37
Media Geometrica
Util para medir Variaciones en el tiempo
Media Geometrica del retorno sobre la inversin
Mide la situacin de una inversin en el tiempo
1/
1 2
n
G nX X X X
1/1 21 1 1 1n
G nR R R R
5/28/2018 Medidas de Variacion
16/37
Ejemplo
Una inversin de $100,000 descendi a $50,000 al fin del ao 1 yse recuper a $100,000 al fin del ao 2:
1 20.5 (or 50%) 1 (or 100% )R R
( 0.5) (1)0.25 (or 25%)
R
Media del retorno
Media geomtrica del retorno
1/ 2
1/ 2 1/ 2
1 0.5 1 1 1
0.5 2 1 1 1 0 (or 0%)
GR
5/28/2018 Medidas de Variacion
17/37
Cuartiles
Ordenar los datos en 4 Cuartiles
Posicion del i-th Quartile
y son Medidas No centrales de ubicacin
= Mediana, una Medida de Tendencia Central
25% 25% 25% 25%
1Q 2Q 3Q
Datos ordenados: 11 12 13 16 16 17 18 21 22
1 1
1 9 1 12 13Position of 2.5 12.5
4 2Q Q
1Q 3Q
2
Q
1
4i
i nQ
5/28/2018 Medidas de Variacion
18/37
Medidas de Variacion
Variacion
Varianza Desviacion estndar Coeficiente deVariacion
Varianza
Poblacin
Varianza
Muestra
Desviacion
estndar
poblacinDesviacion
estndar
muestra
Rango
Rango intercuartil
5/28/2018 Medidas de Variacion
19/37
Rango
Meadida de Variacion
Diferencia entre el valor ms grande y el
ms pequeo de las Observaciones:
Ignora Cmo est distribuida la data
Largest SmallestRange X X
7 8 9 10 11 12
Range = 12 - 7 = 5
7 8 9 10 11 12
Range = 12 - 7 = 5
5/28/2018 Medidas de Variacion
20/37
Medida de Variacion
Diferencia entre el primero y tercer Cuartil
No es afectado por valores extremos
3 1Interquartile Range 17.5 12.5 5Q Q
Rango Intercuartil
Data in Ordered Array: 11 12 13 16 16 17 17 18 21
5/28/2018 Medidas de Variacion
21/37
2
2 1
N
i
i
X
N
Importante Medida de Variacion
Muestra Variacion respecto a la media
Varianza Muestra:
Varianza Poblacin:
2
2 1
1
n
i
i
X X
Sn
Varianza
5/28/2018 Medidas de Variacion
22/37
Desviacion estandar Ms Importante Medida de Variacin
Muestra Variation respecto a la Media
Tiene la misma unidad que los datos
originalesSample Standard Deviation:
Population Standard Deviation:
2
1
1
n
i
i
X X
Sn
2
1
N
i
i
X
N
5/28/2018 Medidas de Variacion
23/37
Approximating the Standard Deviation
Used when the raw data are not available and the
only source of data is a frequency distribution
Standard Deviation(continued)
2
1
1
sample sizenumber of classes in the frequency distribution
midpoint of the th class
frequencies of the th class
c
j j
j
j
j
m X f
Sn
nc
m j
f j
5/28/2018 Medidas de Variacion
24/37
Comparing Standard Deviations
Mean = 15.5
s = 3.33811 12 13 14 15 16 17 18 19 20 21
11 12 13 14 15 16 17 18 19 20 21
Data B
Data A
Mean = 15.5
s = .9258
11 12 13 14 15 16 17 18 19 20 21
Mean = 15.5
s = 4.57
Data C
5/28/2018 Medidas de Variacion
25/37
Coefficient of Variation
Measure of Relative Variation
Always in Percentage (%)
Shows Variation Relative to the Mean Used to Compare Two or More Sets of Data
Measured in Different Units
Sensitive to Outliers
100%S
CVX
5/28/2018 Medidas de Variacion
26/37
Comparing Coefficient
of Variation Stock A: Average price last year = $50
Standard deviation = $2
Stock B: Average price last year = $100 Standard deviation = $5
Coefficient of Variation:
Stock A:
Stock B:
$2100% 100% 4%
$50
SCV
X
$5100% 100% 5%
$100
SCV
X
5/28/2018 Medidas de Variacion
27/37
Shape of a Distribution
Describe How Data are Distributed
Measures of Shape
Symmetric or skewed
Mean =Median =ModeMean
5/28/2018 Medidas de Variacion
28/37
Exploratory Data Analysis
Box-and-WhiskerGraphical display of data using 5-number
summary
Median( )
4 6 8 10 12
XlargestXsmallest
1Q 3Q2Q
5/28/2018 Medidas de Variacion
29/37
Distribution Shape &
Box-and-Whisker
Right-SkewedLeft-Skewed Symmetric
1Q 1Q 1Q2Q 2Q 2Q3Q 3Q3Q
5/28/2018 Medidas de Variacion
30/37
The Empirical Rule
For Most Data Sets, Roughly 68% of the
Observations Fall Within 1 Standard Deviation
Around the Mean Roughly 95% of the Observations Fall Within 2
Standard Deviations Around the Mean
Roughly 99.7% of the Observations Fall Within 3
Standard Deviations Around the Mean
5/28/2018 Medidas de Variacion
31/37
The Bienayme-Chebyshev Rule
The Percentage of Observations Contained Within
Distances of kStandard Deviations Around the Mean
Must Be at Least
Applies regardless of the shape of the data set At least 75% of the observations must be contained within
distances of 2 standard deviations around the mean
At least 88.89% of the observations must be contained within
distances of 3 standard deviations around the mean At least 93.75% of the observations must be contained within
distances of 4 standard deviations around the mean
21 1/ 100%k
5/28/2018 Medidas de Variacion
32/37
Coefficient of Correlation
Measures the Strength of the LinearRelationship between 2 QuantitativeVariables
1
2 2
1 1
n
i i
i
n n
i i
i i
X X Y Y
r
X X Y Y
5/28/2018 Medidas de Variacion
33/37
Features of Correlation
Coefficient Unit Free Ranges between1 and 1
The Closer to1, the Stronger the Negative LinearRelationship
The Closer to 1, the Stronger the Positive Linear
Relationship
The Closer to 0, the Weaker Any Linear
Relationship
5/28/2018 Medidas de Variacion
34/37
Scatter Plots of Data with
Various Correlation CoefficientsY
X
Y
X
Y
X
Y
X
Y
X
r= -1 r= -.6 r= 0
r= .6 r= 1
5/28/2018 Medidas de Variacion
35/37
Pitfalls in Numerical Descriptive
Measures and Ethical Issues
Data Analysis is Objective
Should report the summary measures that best meet the
assumptions about the data set
Data Interpretation is Subjective
Should be done in a fair, neutral and clear manner
Ethical Issues
Should document both good and bad results
Presentation should be fair, objective and neutral
Should not use inappropriate summary measures to distort
the facts
5/28/2018 Medidas de Variacion
36/37
Resumen 3 y 4
Describe Medidas de Tendencia Central
Media, Mediana, Moda, Media geomtrica
Uso de Cuartiles
Describe Medidas de Variacin
Rango, Rango Intercuartil, Varianza y Desviacin
estandar, Coeficiente de variacin Representaciones grficas de la distribucin
Simetra, Sesgos, Uso grficos de caja y bigote
Funcin de momento,expresa la cantidad de
movimiento
Expresaposicin
5/28/2018 Medidas de Variacion
37/37
Resumen
Descripcin de reglas empricas y
desigualdad de Chebyshev
Discusin del Coeficiente de Correlacin
Trampas dirigidas en estadstica descriptiva
y aspectos ticos
(continuacin)
Top Related