Estadistica y Probabilidades

73
Ing. William León Velásquez [email protected]

description

Medidas de Dispersion

Transcript of Estadistica y Probabilidades

Page 1: Estadistica y Probabilidades

Ing. William León Velá[email protected]

Page 2: Estadistica y Probabilidades

Las estadísticas básicas nos permiten tener una visión del comportamiento de una serie de sucesos o eventos a los que denominamos "variables", así tenemos varias herramientas estadísticas como lo son la Media, la Mediana y la Moda.

Pero estas Medidas no sonsuficientes, necesitamosconocer la variabilidad delos datos

ING. WILLIAM LEON V. 2DEFINICIÓN

Page 3: Estadistica y Probabilidades

Las Medidas de Dispersión,son indicadores devariabilidad y cuyaimportancia reside en lanecesidad de tomardecisiones, basadas enestadísticas básicas.

ING. WILLIAM LEON V. 3DEFINICIÓN

Page 4: Estadistica y Probabilidades

Ejemplo: Se tiene una producción de

franelas y se sabe que semanalmente se producen un promedio de 500 franelas, se puede decir que todos los días se producen 100 franelas, pero nada nos garantiza eso porque podrían producirse en sólo dos días 250 franelas y el promedio semanal nos daría idéntico,

ING. WILLIAM LEON V. 4DEFINICIÓN

Page 5: Estadistica y Probabilidades

Si adicionalmente se tiene una Desviación Estándar de 5 franelas, tendremos entonces una mejor comprensión del proceso, pues este último número nos indica que semanalmente se producen entre 495 y 505 franelas, es decir, que diariamente sí se deben producir aproximadamente 100 franelas.

ING. WILLIAM LEON V. 5DEFINICIÓN

Page 6: Estadistica y Probabilidades

La Dispersión se refiere a la variabilidad entre los valores, es decir, qué tan grandes son las diferencias entre los valores. La idea de dispersión se relaciona con la mayor o menor concentración de los datos en torno a un valor central, generalmente la media aritmética.

ING. WILLIAM LEON V. 6DEFINICIÓN

Page 7: Estadistica y Probabilidades

Observe las dos figuras. La primera presenta una distribución con datos más concentrados alrededor de su promedio 400 que la otra figura con respecto a su promedio 1000, es decir la primera figura es una distribución con menos dispersión.

ING. WILLIAM LEON V. 7DEFINICIÓN

Ejemplos:

Page 8: Estadistica y Probabilidades

• Las figuras siguientes muestran atres distribuciones con promedio 70,sin embargo las tres difieren encuanto a su variabilidad alrededor dela media.

ING. WILLIAM LEON V. 8DEFINICIÓN

poca variabilidad alguna variabilidad gran variabilidad

Ejemplos:

Page 9: Estadistica y Probabilidades

Se tienen dos grupos de estudiantes que sometidos a una prueba arrojaron los siguientes puntajes:

ING. WILLIAM LEON V. 9EJEMPLO

GRUPO A GRUPO BPuntaje Nº

estudiantesPuntaje Nº

estudiantes9 2 11 5

10 4 12 1011 6 13 513 4 Total 2015 2

17 2

Total 20

Page 10: Estadistica y Probabilidades

Al calcular el promedio aritmético para ambos grupos se obtiene:

ING. WILLIAM LEON V. 10EJEMPLO

12== BA xx

Page 11: Estadistica y Probabilidades

Este resultado puede conducir a conclusiones equivocadas cuando se está comparando distribuciones, pues se podría pensar que ambas secciones son idénticas en su rendimiento, siendo esto falso ya que observando los datos se aprecia que la sección B es más homogénea. En este caso el promedio no tiene suficiente grado de representatividad por lo tanto poco podrá decirnos acerca de los datos en estudio.

ING. WILLIAM LEON V. 11EJEMPLO

Page 12: Estadistica y Probabilidades

ING. WILLIAM LEON V. 12EJEMPLO

iX

Es necesario entonces calcular otras medidas estadísticas para mostrar cómo varían los datos alrededor del promedio y esto se logra mediante las medidas de dispersión.

Page 13: Estadistica y Probabilidades

1.- Para evaluar la confiabilidad del promedio que se está utilizando:Una dispersión pequeña indica que los datosse encuentran acumulados cercanamente,alrededor de la medida de tendencia centralestablecida. Por tanto, la medida detendencia central se considera confiable obastante representativa de los datos.Por el contrario, una dispersión grandeindica que la medida escogida pararepresentar los datos no es muy confiable,es decir, no es muy representativa delos datos.

ING. WILLIAM LEON V. 13

Es necesario estudiar las medidas de dispersión:

Page 14: Estadistica y Probabilidades

2.- Para apreciar cuán dispersas están dos o más distribuciones:Para poder comparar dos distribuciones defrecuencias entre sí, no sólo necesitamosla medida de tendencia central, sinotambién la dispersión entre lasobservaciones para no elaborarconclusiones erróneas.A mayor medida de dispersión → elgrupo es más heterogéneo.A menor medida de dispersión → elgrupo es más homogéneo o uniforme.

ING. WILLIAM LEON V. 14

Es necesario estudiar las medidas de dispersión:

Page 15: Estadistica y Probabilidades

Cuantifican el grado deconcentración o de dispersión de losvalores de la variable en torno de unpromedio de la distribución.

ING. WILLIAM LEON V. 15

MEDIDAS DE DISPERSIÓN ABSOLUTA

Page 16: Estadistica y Probabilidades

Principales medidas de dispersión absoluta:Rango o Recorrido : RVarianza : S2

Desviación Estándar : S

ING. WILLIAM LEON V. 16

MEDIDAS DE DISPERSIÓN ABSOLUTA

Page 17: Estadistica y Probabilidades

Es la diferencia entre los valores máximo y mínimo de los datos.

Esta medida es muy fácil de calcular sin embargo no es muy recomendable porque sólo toma en cuenta los valores extremos, sin considerar los demás valores.

ING. WILLIAM LEON V. 17

MEDIDAS DE DISPERSIÓN ABSOLUTA

mínXmáxXR −=

Page 18: Estadistica y Probabilidades

Interpretación de Rango:El Rango lo podremos interpretar como la amplitud existente entre una serie de datos, es decir, mide cuán lejos está el valor más pequeño y el valor más grande de la muestra o población.

ING. WILLIAM LEON V. 18

MEDIDAS DE DISPERSIÓN ABSOLUTA

Page 19: Estadistica y Probabilidades

Ejemplo de Rango:Si tenemos una producción de franelas y sabemos que diariamente se producen un promedio de 500 franelas, y si un día se produce un mínimo de 415 franelas y otro día se produce un máximo de 573 franelas entonces si vemos el RANGO de producción estará entre 158 franelas, es decir, Podemos tener una producción de 158 franelas a partir del valor mínimo.

ING. WILLIAM LEON V. 19

MEDIDAS DE DISPERSIÓN ABSOLUTA

Page 20: Estadistica y Probabilidades

ING. WILLIAM LEON V. 20

MEDIDAS DE DISPERSIÓN ABSOLUTA

iX

Page 21: Estadistica y Probabilidades

Es un valor numérico que cuantifica el grado de dispersión de los valores de una variable respecto a su media aritmética.

Es el promedio de los cuadrados de las desviaciones de la variable respecto a su media aritmética.

ING. WILLIAM LEON V. 21

MEDIDAS DE DISPERSIÓN ABSOLUTA

Page 22: Estadistica y Probabilidades

ING. WILLIAM LEON V. 22

MEDIDAS DE DISPERSIÓN ABSOLUTA

[ ] ( )

−= 2xiXMXV

Page 23: Estadistica y Probabilidades

Notación: Varianza muestral.

Varianza poblacional.

ING. WILLIAM LEON V. 23

MEDIDAS DE DISPERSIÓN ABSOLUTA

:2S

:2σ

Page 24: Estadistica y Probabilidades

Nota: La varianza nunca es negativa. Cuando la variable toma un único

valor; es decir cuando es constante entonces la varianza es cero.

Mientras más se aproxima a cero, más concentrados están los valores de la serie alrededor de la media. Por el contrario, mientras mayor sea la varianza, más dispersos están.

ING. WILLIAM LEON V. 24

MEDIDAS DE DISPERSIÓN ABSOLUTA

iX

Page 25: Estadistica y Probabilidades

ING. WILLIAM LEON V. 25

MEDIDAS DE DISPERSIÓN ABSOLUTA

∑−∑

−=

2

niX

n2iX

1n1

)x(V

Page 26: Estadistica y Probabilidades

Ejemplo: Calcular e interpretar la varianza de los pesos de

un grupo de personas.

Los datos son los siguientes:56 65 68 70 72 76 78 80

ING. WILLIAM LEON V. 26

MEDIDAS DE DISPERSIÓN ABSOLUTA

Page 27: Estadistica y Probabilidades

⇒ n = 8

ING. WILLIAM LEON V. 27

MEDIDAS DE DISPERSIÓN ABSOLUTA

iX

5658

1iiX =∑

=32940

8

1i2iX =∑

=

2oskil6184,602

8565

832940712

XS ≅=−=

Page 28: Estadistica y Probabilidades

En promedio los pesosdel grupo de personas,se alejan con respecto alpromedio aritmético enaproximadamente 61kilos al cuadrado.

ING. WILLIAM LEON V. 28

MEDIDAS DE DISPERSIÓN ABSOLUTA

Page 29: Estadistica y Probabilidades

a) Si n < 30 :

ING. WILLIAM LEON V. 29

MEDIDAS DE DISPERSIÓN ABSOLUTA

∑=−∑

=−=

2

n

k

1iiXif

nk

1i2iXif1n

12XS

Page 30: Estadistica y Probabilidades

Ejemplo:

1.- Calcular e interpretar la varianza para la siguiente tabla de frecuencias.

ING. WILLIAM LEON V. 30

MEDIDAS DE DISPERSIÓN ABSOLUTA

if

EdadIi

n = 20

4 - 6 46 - 10 5

10 - 16 7 ⇒ n < 30

16 - 20 320 - 30 1

Total n = 20

Nº de personas

if

Page 31: Estadistica y Probabilidades

V ( X ) = 29,21 ≈ 29 años2

En promedio la edad de estas personas se aleja con respecto a su promedio aritmético en aproximadamente 29 años al cuadrado.

ING. WILLIAM LEON V. 31

MEDIDAS DE DISPERSIÓN ABSOLUTA

−=

∑=−∑

=−=

2

20230203200

191

2

n

k

1iiXif

nk

1i2iXif1n

1)X(V

Page 32: Estadistica y Probabilidades

b) Si n ≥ 30 :

ING. WILLIAM LEON V. 32

MEDIDAS DE DISPERSIÓN ABSOLUTA

22i

2 k

1i iXihk

1iXihS

∑=

−∑=

=

22i

2n

k

1i iXif

n

k

1iXif

S

∑=−

∑==

Usando frecuencias relativas:Usando frecuencias absolutas:

Page 33: Estadistica y Probabilidades

Ejemplo:

Calcular e interpretar la varianza de la siguiente tabla.

ING. WILLIAM LEON V. 33

MEDIDAS DE DISPERSIÓN ABSOLUTA

PesoIi

Nº de ingenieros

fi n = 40

⇒ n > 30

50 - 60 6

60 - 70 8

70 - 80 10

80 - 90 9

90 -100 7

Total n = 40

Page 34: Estadistica y Probabilidades

⇒ En promedio el peso de los ingenieros se aleja conrespecto al peso promedio en aproximadamente172 kilos al cuadrado.

ING. WILLIAM LEON V. 34

MEDIDAS DE DISPERSIÓN ABSOLUTA

94,1712

403030

40400236

n

k

1i iXif

n

k

1iXif

S

22i

2 =

−=

∑=−

∑==

Page 35: Estadistica y Probabilidades

Si una muestra de tamaño n se particiona en kmuestras de tamaño cada una con sucorrespondiente promedio aritmético , y

su varianza

ING. WILLIAM LEON V. 35

MEDIDAS DE DISPERSIÓN ABSOLUTA

inix

2iS

1 2 k

2kS2

2S21S

kx2x1xkn2n1n

Page 36: Estadistica y Probabilidades

entonces la varianza para los k gruposjuntos se calcula mediante:

ING. WILLIAM LEON V. 36

MEDIDAS DE DISPERSIÓN ABSOLUTA

2

n

xn

n

)Sx(n

S

k

1iii

k

1i

2i

2ii

2T

+

=∑∑== ∑

=

=k

1iinndonde

Page 37: Estadistica y Probabilidades

Ejemplo: Se tienen tres grupos, de seis, nueve y siete estudiantes

respectivamente. Si las notas correspondientes a cada uno de ellos son:

Grupo 1 :12 16 08 11 10 12 Grupo 2 :17 14 07 13 11 18

13 15 14 Grupo 3 :10 13 11 08 12 09

12

ING. WILLIAM LEON V. 37

MEDIDAS DE DISPERSIÓN ABSOLUTA

Page 38: Estadistica y Probabilidades

= 2,98

En promedio las notas de los estudiantes de los tres grupos se alejan con respecto al promedio total en aproximadamente 3 puntos.

ING. WILLIAM LEON V. 38

MEDIDAS DE DISPERSIÓN ABSOLUTA

( ) 89,809,1222

)24,371,10(7)53,1056,13(9)1,75,11(621

222

2 =−+++++

=∑=

k

iT

S

TS

Page 39: Estadistica y Probabilidades

Es la raíz cuadrada positiva de la varianza y posee las mismas unidades que la media aritmética, las cuales ya no están elevadas al cuadrado como en la varianza.

ING. WILLIAM LEON V. 39

MEDIDAS DE DISPERSIÓN ABSOLUTA

)X(VS =

Page 40: Estadistica y Probabilidades

La desviación estándar o desviación típica aparece para simplificar la interpretación de la varianza.Cuando calculamos la varianza, nos basamos en datos elevados al cuadrado, por lo que, el resultado obtenido debe interpretarse en unidades al cuadrado; por esta razón aparece la desviación estándar como la raíz cuadrada de la variancia.

ING. WILLIAM LEON V. 40

MEDIDAS DE DISPERSIÓN ABSOLUTA

Page 41: Estadistica y Probabilidades

Interpretación de la Desviación Estandar:

Es una medida de distancia promedio de los valores observados a su media. La distancia de cada valor a la media se mide tomando el valor absoluto de la diferencia entre ese valor y la media, es decir, es la distancia de cada dato respecto a su promedio.

ING. WILLIAM LEON V. 41

MEDIDAS DE DISPERSIÓN ABSOLUTA

Page 42: Estadistica y Probabilidades

Ejemplo : Si se tiene una producción de

franelas y sabemos que diariamente se producen un promedio de 500 franelas, adicionalmente tenemos también que la desviación es de 25 franelas, tendremos entonces una mejor comprensión del proceso pues este último número nos indica que diariamente se producen entre 475 y 525 franelas

ING. WILLIAM LEON V. 42

MEDIDAS DE DISPERSIÓN ABSOLUTA

Page 43: Estadistica y Probabilidades

Distribuciones con igual promedio aritmético y diferente desviación estándar

ING. WILLIAM LEON V. 43

MEDIDAS DE DISPERSIÓN ABSOLUTA

Page 44: Estadistica y Probabilidades

Ejemplos: 1.- Si la desviación típica

del salario de los ingenieros de sistemas es $1,000 y la media aritmética es $3,000, entonces los salarios de los ingenieros fluctúan entre $2,000 y $4,000 dólares.

ING. WILLIAM LEON V. 44

MEDIDAS DE DISPERSIÓN ABSOLUTA

Page 45: Estadistica y Probabilidades

2.- Calcular ladesviación estándar de lasnotas obtenidas por ungrupo de alumnos del cuartociclo de la Facultad deIngeniería Industrial de laUNMSM en la primeraevaluación de estadística.

12 07 14 11 1618 09 14 10

ING. WILLIAM LEON V. 45

MEDIDAS DE DISPERSIÓN ABSOLUTA

Page 46: Estadistica y Probabilidades

⇒ n = 9

ING. WILLIAM LEON V. 46

MEDIDAS DE DISPERSIÓN ABSOLUTA

1119

1iiX =∑

=4671

9

1i2iX =∑

=

( ) puntos5,325,12XS25,122

9111

9467181

XV ==⇒=−=

Por lo tanto:

Page 47: Estadistica y Probabilidades

Nota: La varianza y la desviación estándar

se utilizan para comparar grupos cuya variable está expresada en las mismas unidades.

Así, el grupo más homogéneo, más uniforme o en el que la media aritmética es más representativa será aquel en el cual la varianza o la desviación estándar es menor.

ING. WILLIAM LEON V. 47

MEDIDAS DE DISPERSIÓN ABSOLUTA

Page 48: Estadistica y Probabilidades

Ejemplo:En varias semanas consecutivas, los oficiales de policía, Martínez y Castro levantaron las siguientes infracciones por exceso de velocidad:Martínez : 31 38 42 32 39 26 Castro : 35 43 38 37 33 28 27

ING. WILLIAM LEON V. 48

MEDIDAS DE DISPERSIÓN ABSOLUTA

¿Cuál de los oficiales es más homogéneo con respecto al número de infracciones?

Page 49: Estadistica y Probabilidades

Solución:

ING. WILLIAM LEON V. 49

MEDIDAS DE DISPERSIÓN ABSOLUTA

35,872

620863907

51S2

M =

−= 31,95

2

724174898

61S2

C =

−=

2MS2

CS <

El oficial Castro es más homogéneo porque su varianza es menor.

Page 50: Estadistica y Probabilidades

Nota:Una de las aplicaciones de ladesviación estándar es analizarla dispersión a partir de unadistribución teórica, llamadacurva normal; la cual tiene formasimétrica.

ING. WILLIAM LEON V. 50

MEDIDAS DE DISPERSIÓN ABSOLUTA

Page 51: Estadistica y Probabilidades

En este caso se tiene que:

El 68,5% de los datos están dentro del intervalo:

El 95,5% de los datos están dentro del intervalo:

El 99,7% de los datos pertenecen al intervalo:

ING. WILLIAM LEON V. 51

MEDIDAS DE DISPERSIÓN ABSOLUTA

)x,x( σ+σ−

)2x,2x( σ+σ−

)3x,3x( σ+σ−

Page 52: Estadistica y Probabilidades

ING. WILLIAM LEON V. 52

MEDIDAS DE DISPERSIÓN ABSOLUTA

Page 53: Estadistica y Probabilidades

La variancia y la desviacióntípica también tienen suslimitaciones. Similar a la mediaaritmética es vulnerable a lainfluencia de casos extremos.Además, cuando las mediasaritméticas no son iguales ocuando las unidades demedición son distintas, lacomparación de desviacionestípicas puede no sersignificativa.

ING. WILLIAM LEON V. 53

MEDIDAS DE DISPERSIÓN RELATIVA

Page 54: Estadistica y Probabilidades

La medida de dispersión relativa más utilizada es el coeficiente de variación.

ING. WILLIAM LEON V. 54

MEDIDAS DE DISPERSIÓN RELATIVA

Page 55: Estadistica y Probabilidades

Es la desviación estándar dividida sobre la media aritmética multiplicada por 100. El mismo nos permite comparar desviaciones típicas de variables con unidades de medición distintas.

El coeficiente de variación se expresa en unidades independientes de la naturaleza de la variable.

ING. WILLIAM LEON V. 55

MEDIDAS DE DISPERSIÓN RELATIVA

100xSCV ×=

Page 56: Estadistica y Probabilidades

Interpretación del Coeficiente de Variación:

El Coeficiente de Variación, mide la variabilidad relativa a la Media. Expresa la proporción de variabilidad de una característica por cada unidad de la Media.

ING. WILLIAM LEON V. 56

MEDIDAS DE DISPERSIÓN RELATIVA

Page 57: Estadistica y Probabilidades

Ejemplo : Sabemos que la fábrica de textiles produce

500 franelas diarias con una desviación típica de más o menos (±) 25 franelas, entonces, el Coeficiente de Variación será 25/500 = 0,05, es decir, tenemos una variación de 5% en la producción diaria de franelas.

ING. WILLIAM LEON V. 57

MEDIDAS DE DISPERSIÓN RELATIVA

Page 58: Estadistica y Probabilidades

ING. WILLIAM LEON V. 58

MEDIDAS DE DISPERSIÓN RELATIVA

Page 59: Estadistica y Probabilidades

En la práctica, se acostumbra considerar que un coeficiente de variación superior a 50% indica alto grado de dispersión y por lo tanto poca representatividad de la media aritmética.

ING. WILLIAM LEON V. 59

MEDIDAS DE DISPERSIÓN RELATIVA

Page 60: Estadistica y Probabilidades

Ejemplo: Se desea comparar los sueldos de

los trabajadores de dos empresas A y B. Para tal efecto se tienen los datos de la tabla siguiente :

¿Se puede afirmar que los sueldos de los trabajadores de la empresa A son más uniformes? ¿Por qué?

ING. WILLIAM LEON V. 60

MEDIDAS DE DISPERSIÓN RELATIVA

Page 61: Estadistica y Probabilidades

ING. WILLIAM LEON V. 61

MEDIDAS DE DISPERSIÓN RELATIVA

Empresa A Empresa B

Sueldos ( $ ) Nº trabajadores

Sueldos ( S/.) Nº trabajadores

380 10 600-650 7

410 9 650-700 9

450 12 700-750 14

480 8 750-800 6

500 7 800-850 4

Page 62: Estadistica y Probabilidades

Por lo tanto, los sueldos de los trabajadores de la empresa A no son más uniformes; sino los sueldos de la empresa B porque presenta menor coeficiente de variación.

ING. WILLIAM LEON V. 62

MEDIDAS DE DISPERSIÓN RELATIVA

78,439x A = 75,713x B =

55,42SA = 67,59SB

=

%68,910078,439

55,42CVA =×=%36,8100

75,71367,59CVA =×=

Page 63: Estadistica y Probabilidades

Ing. William León Velásquez

Page 64: Estadistica y Probabilidades

ING. WILLIAM LEON V. 64

MEDIDAS DE FORMA

Page 65: Estadistica y Probabilidades

Una distribución es asimétrica cuando sus datos tienden a agruparse hacia uno de los extremos de la distribución.

Cuando una curva es asimétrica, tiene un sesgo.

ING. WILLIAM LEON V. 65

MEDIDAS DE FORMA

Page 66: Estadistica y Probabilidades

El sesgo puede ser de dos tipos: Si los datos tienden a agruparse en las

primeras clases, se dice que el distribución tiene un sesgo positivo o que es asimétrica positiva.

Si los datos tienden a agruparse en las últimas clases de la distribución, se dice que esta tiene sesgo negativo o que es asimétrica negativa.

ING. WILLIAM LEON V. 66

MEDIDAS DE FORMA

Page 67: Estadistica y Probabilidades

Es una medida que se utiliza para evaluar elsesgo de una distribución:

ING. WILLIAM LEON V. 67

MEDIDAS DE FORMA

S)Mex(3CA −

=

Page 68: Estadistica y Probabilidades

Según es grado de asimetría unadistribución puede ser:

ING. WILLIAM LEON V. 68

MEDIDAS DE FORMA

SimétricaCA = 0

Asimétrica positivaCA > 0

Asimétrica negativaCA < 0

Page 69: Estadistica y Probabilidades

Mide el grado de elevación o deagudeza de una distribucióncomparada con la curva normal.

ING. WILLIAM LEON V. 69

MEDIDAS DE FORMA

Page 70: Estadistica y Probabilidades

Según su grado de curtosis, unadistribución puede ser:

ING. WILLIAM LEON V. 70

MEDIDAS DE FORMA

K = 0 K > 0,263 K < 0,263

Page 71: Estadistica y Probabilidades

Indica la deformación vertical de unadistribución de frecuencias.

ING. WILLIAM LEON V. 71

MEDIDAS DE FORMA

Si K = 0,263 ⇒ mesocúrtica.

Si K > 0,263 ⇒ leptocúrtica.

Si K < 0,263 ⇒ platicúrtica.

)PP(2PP

K1090

2575−−

=

Page 72: Estadistica y Probabilidades

ING. WILLIAM LEON V. 72

MEDIDAS DE FORMA

Page 73: Estadistica y Probabilidades

[email protected]

ING. WILLIAM LEON V. 73