Sesión 01
-
Upload
jorge-ramirez -
Category
Education
-
view
3.623 -
download
0
Transcript of Sesión 01
Sesión 01Estadística Descriptiva
Dr. Jorge Ramírez Medina
Distribuciones de frecuencia
Histograma
0
10
20
30
40
50
60
70
< 249
250-3
99
400-5
49
550-6
99
700-8
49
850-9
99
1000
-114
9
1150
-129
9
1300
-144
9
1450
-159
9
Clase
Frec
uenc
ia
Dr. Jorge Ramírez Medina
Definición de Estadística
Es la ciencia pura y aplicada que trata de la recolección, organización,
presentación y análisis de conjuntos de datos con el fin de obtener conclusiones o inferencias y
establecer su grado de incertidumbreFuente: Estadística para Administración y Economía. Anderson, Sweeney y Williams
Dr. Jorge Ramírez Medina
Tiene que ver con la toma de decisiones
Fuente: Field Andy. Discovering Statistics using IBM SPSS Statistics 2013.
Dr. Jorge Ramírez Medina
Escalas de medición
Cualitativos
Cuantitativos
Numéricos Numéricos
No numéricos
Datos
Nominal
Ordinal
Nominal
Ordinal
Intervalo
Razón
Dr. Jorge Ramírez Medina
Tablas de frecuencia
Cualitativos
No numéricos
Datos
Nominal Ordinal
FrecuenciaFrecuencia
relativaPorcentaje
de frecuenciamalo 3 0.15 15%regular 4 0.2 20%bueno 2 0.1 10%muy bueno 6 0.3 30%excelente 5 0.25 25%Total 20 1 100%
Dr. Jorge Ramírez Medina
Modelos estadísticos simples• Medidas de tendencia Central
• Media, Moda, Mediana• Medidas de dispersión
• Varianza, Desviación estándar
Dr. Jorge Ramírez Medina
Moda
Rela
tive
Freq
uenc
y
.05
.10
.15
.20
.25
.30
.35
0
corresponde al punto más alto de la gráfica
Dr. Jorge Ramírez Medina
Mediana
Rela
tive
Freq
uenc
y
.05
.10
.15
.20
.25
.30
.35
0
Divide la gráfica en dos áreas iguales
50% de los datos
50% de los datos
Dr. Jorge Ramírez Medina
Ejemplo Salarios
425 430 430 435 435 435 435 435 440 440440 440 440 445 445 445 445 445 450 450450 450 450 450 450 460 460 460 465 465465 470 470 472 475 475 475 480 480 480480 485 490 490 490 500 500 500 500 510510 515 525 525 525 535 549 550 570 570575 575 580 590 600 600 600 600 615 615
Dr. Jorge Ramírez Medina
Cálculo en el ejemplo
54.74100 % 100 % 11.15%490.80sx
2 2996.47 54.74s s La desviación
estándard es cerca del
11% de la media
• Varianza
• Desviación estándar
• Coeficiente de Variación
22 ( ) 2,996.161
ix xs
n
Dr. Jorge Ramírez Medina
Estadística Descriptiva
Son los métodos tabulares , gráficos y numéricos utilizados para sumarizar datos.
Dr. Jorge Ramírez Medina
5 números que definen una población o fenómeno
425 430 430 435 435 435 435 435 440 440440 440 440 445 445 445 445 445 450 450450 450 450 450 450 460 460 460 465 465465 470 470 472 475 475 475 480 480 480480 485 490 490 490 500 500 500 500 510510 515 525 525 525 535 549 550 570 570575 575 580 590 600 600 600 600 615 615
Valor más bajo = 425 1er Cuartil = 445Mediana = 475
3er Cuartil = 525 Mayor valor = 615
Dr. Jorge Ramírez Medina
Diagrama de Caja
325 400 425 450 475 500 525 550 575 600 645
Q1 = 445 Q3 = 525Q2 = 475
Los bigotes (líneas punteadas) se dibujan del final de la caja a los valores más grandes y pequeños dentro de los límites
Valor más bajo= 425Mayor valor= 615
Dr. Jorge Ramírez Medina
Diagrama de Caja
Sentida Falsa Miserable
Neutra
Dr. Jorge Ramírez Medina
Diagrama de Caja
Dr. Jorge Ramírez Medina
Estadística InferencialEl propósito de esta rama es obtener predicciones de una población con base en información obtenida de una muestra.
Dr. Jorge Ramírez Medina
X representa lo desconocido
Dr. Jorge Ramírez Medina
Variable aleatoria Una variable aleatoria es una descripción numérica
del resultado de un experimento.
Una variable aleatoria discreta puede asumir unnúmero finito de valores o una secuencia infinita de
Valores.
Una variable aleatoria continua puede asumir cualquier valor numérico en una intervalo o un
conjunto de intervalos.
Dr. Jorge Ramírez Medina
Tome x = número de TVs vendidas en la tiendaen un día. x puede tomar 5 valores (0, 1, 2, 3, 4)
Ejemplo: Tiendas de Todo
Variable aleatoria discreta con un númerofinito de valores.
Dr. Jorge Ramírez Medina
Ejemplo: Tiendas de Todo
Variable aleatoria discreta con un númeroinfinito de valores.
Podemos contar los clientes pero no hay un límite finito de los que puedan llegar.
Tome x = número de clientes que llegan a la tiendaen un día. x puede tomar 5 valores 0, 1, 2, 3, 4…..
Dr. Jorge Ramírez Medina
Variable AleatoriaPregunta Random Variable x TypeTamaño deLa familia
x = Número of dependientes reportados para el censo
Discreta
Distancia de la casa a la escuela
x = Distancia en kms. de la casa a la escuela
Continua
Tener mascotaperros y/ogatos
x = 1 si no tiene mascota; = 2 si tiene perro(s) únicamente; = 3 si tiene gato(s) únicamente; = 4 si tiene perro(s) y gatos(s)
Discreta
Dr. Jorge Ramírez Medina
Distribuciones de probabilidad discretas
La distribución de probabilidad de una variable aleatoria describe como las probabilidades están
distribuidas sobre los valores de la variable.
Podemos representar la distribución discreta de probabilidad con una tabla, una gráfica o una ecuación.
Dr. Jorge Ramírez Medina
Distribuciones de probabilidad discretas
La distribución de probabilidad está definida por una función de probabilidad, f(x), la cuál provee la probabilidad para
cada valor de la variable aleatoria.
Las condiciones requeridas para una función de Probabilidad discreta son;
f(x) > 0
f(x) = 1
Dr. Jorge Ramírez Medina
Utilizando los datos de ventas de TV’s desarrolle una representación tabular de la distribución de probabilidad de las ventas de TVs
Unidades Número Vendidas de días
0 80 1 50 2 40 3 10 4 20
200
x f(x) 0 .40 1 .25 2 .20 3 .05 4 .10 1.00
80/200
Distribuciones de probabilidad discretas
.10.20
.30
.40.50
0 1 2 3 4Valores de la Variable Aleatoria x (ventas de
TV)
Prob
abilid
ad
Dr. Jorge Ramírez Medina
Valor Esperado y Varianza El valor esperado, o media, de una variable aleatoria
es una media de su localización.
La varianza resume la variabilidad en los valores de la variable aleatoria.
La desviación estándar, , está definida como la raíz cuadrada positiva de la varianza.
Var(x) = 2 = (x - )2f(x)
E(x) = = xf(x)
Dr. Jorge Ramírez Medina
Varianza y Desviación estándar
01234
-1.2-0.2 0.8 1.8 2.8
1.440.040.643.247.84
.40
.25
.20
.05
.10
.576
.010
.128
.162
.784
x - (x - )2 f(x) (x - )2f(x)
Varianza de las ventas diarias = 2 = 1.660
x
TVsal
cuadrado
Desviación estándar de las ventas diarias = 1.2884 TVs
Valor esperado y varianza
Dr. Jorge Ramírez Medina
Nos interesa el contorno de la distribución
Dr. Jorge Ramírez Medina
Nuestro interés es el número de éxitos que ocurren en los n intentos.
Tomamos x como el número de éxitos que ocurren en los n intentos.
Distribución Binomial
Dr. Jorge Ramírez Medina
Distribución Binomial
donde: f(x) = La probabilidad de x éxitos en n intentos n = el número de intentos p = la probabilidad de éxito de cualquier intento
Función de probabilidad binomial
)()1()!(!
!)( xnx ppxnx
nxf
Probabilidad de una secuencia particular de resultados
con x éxitos en n intentos
Número de resultados experimentales que dan
x éxitos en intentos
Dr. Jorge Ramírez Medina
Distribución Binomial Ejemplo
Una empresa está preocupada por la alta rotación de sus empleados. Para un empleado seleccionado al azar, se estima una probabilidad de 0.1 de que la persona no esté el próximo semestre trabajando. Si se seleccionan 3 empleados al azar ¿cuál es la probabilidad de que uno de ellos no esté trabajando el próximo semestre en la empresa?
Dr. Jorge Ramírez Medina
Distribución Binomial
Diagrama de árbol
1st Worker 2nd Worker 3rd Worker x Prob.
Leaves (.1)
Stays (.9)
3
2
0
22
Leaves (.1)
Leaves (.1)S (.9)
Stays (.9)
Stays (.9)
S (.9)
S (.9)
S (.9)
L (.1)
L (.1)
L (.1)
L (.1) .0010
.0090
.0090
.7290
.0090
11
.0810
.0810
.0810
1
Dr. Jorge Ramírez Medina
Distribución Binomial Utilizando la función de probabilidad Binomial
tome: p = .10, n = 3, x = 1
)()1()!(!
!)( xnx ppxnx
nxf
243.0)81)(.1(.3)1.01(1.0)!13(!1
!3)1( )13(1
f
Dr. Jorge Ramírez Medina
Distribución Binomial utilizando Tablas de Probabilidad Binomial
n x .05 .10 .15 .20 .25 .30 .35 .40 .45 .503 0 .8574 .7290 .6141 .2430 .4219 .3430 .2746 .2160 .1664 .1250
1 .1354 .2430 .3251 .3840 .4219 .4410 .4436 .4320 .4084 .37502 .0071 .0270 .0574 .0960 .1406 .1890 .2389 .2880 .3341 .37503 .0001 .0010 .0034 .0080 .0156 .0270 .0429 .0640 .0911 .1250
p
X P(X)0 0.7291 0.2432 0.0273 0.001
Utilizando excelBinomial
Dr. Jorge Ramírez Medina
Distribución Binomial
El valor esperado;
La varianza;
= 3(.1)(.9) = .27
La desviación estándar, =
Var(x) = 2 = np(1-p)
E(x) = = np
)1( pnp
= 3(.1) = .3 empleados de 3
Dr. Jorge Ramírez MedinaDr Jorge Ramírez MedinaEGADE Business School
Distribución Poisson y exponencial
!)(
xexfx
Para x ≥0, μ≥0
x
exf
1)(
ox
exxP 1)( 0
Dr. Jorge Ramírez Medina
Reflexión en clase
• Cuidado con lo que asume.• Sea claro acerca quiere descubrir.• No tome la causalidad por sentado.• Con estadística no se puede probar cosas con el 100%
de certeza• Un resultado que es numéricamente significativo puede
ser inútil.Tomado de The Use and Misuse of statistics HBP.
Dr. Jorge Ramírez Medina
Fin de sesión
Gracias por
su atención