clase de estadistica inferencial (1).pptx

55
ESTADISTICA INFERENCIAL

Transcript of clase de estadistica inferencial (1).pptx

Page 1: clase de estadistica inferencial (1).pptx

ESTADISTICA INFERENCIAL

Page 2: clase de estadistica inferencial (1).pptx

Probabilidad en el lanzamiento de una moneda americana

• ½ opción cara

• ½ opción cruz

1.- Nociones de Probabilidad

Probabilidad en el lanzamiento de una moneda mexicana

• ½ opción águila

• ½ opción sol

Supongamos que un suceso “E” tiene “h” posibilidades de ocurrir entre un total de “n” posibilidades, cada una de las cuales tiene la misma oportunidad de ocurrir que las demás. Entonces, la probabilidad de que ocurra E (o sea un éxito) se denota por:

P ( E ) = h /n

Page 3: clase de estadistica inferencial (1).pptx

# probabilidad2 1/363 2/364 3/365 4/366 5/367 6/368 5/369 4/36

10 3/3611 2/3612 1/36

# probabilidad

1 1/6

2 1/6

3 1/6

4 1/6

5 1/6

6 1/6

Probabilidad en un lanzamiento de un dado

Probabilidad en el lanzamiento de un par de

dados

1.- Nociones de Probabilidad

Page 4: clase de estadistica inferencial (1).pptx

Una baraja de 52 cartas consta de:

2 colores (rojo y negro)

26 cartas de figuras rojas26 cartas de figuras negras

13 de corazón rojo13 trébol13 de diamante13 de corazón negro)

4 cartas de numeración(4 ases, 4 reyes, 4 reinas, etc. )

1.- Nociones de Probabilidad

Page 5: clase de estadistica inferencial (1).pptx

1.-Determina la probabilidad de los siguientes sucesos:a) en un lanzamiento de un dado resulte un número imparb) un as, 10 de diamantes o 2 de tréboles en una sola extracción de una baraja de 52 cartasc) la suma de un lanzamiento de un par de dados sea 7

Solución:

a) 3/6

b) 4/52 + 1/52 + 1/52 = 6/52

c) 6/36

Ejemplos

Page 6: clase de estadistica inferencial (1).pptx

2.- Se saca al azar una bola de una caja que contiene 6 bolas rojas, 4 blancas, 5 azules. Hallar la probabilidad de que la bola extraída sea: a) roja b) blanca c) azul d) no roja e) roja o blanca.

Solución:

1) Obtener el total de bolas de colores: 6+4+5=15

2) Obtener la probabilidad de cada inciso

a) 6/15 b) 4/15

c) 5/15 d) 9/15

e) 10/15

Ejemplos

Page 7: clase de estadistica inferencial (1).pptx

3.- Un dado se lanza 2 veces, encuentra la probabilidad de obtener 4, 5, o 6 en el primer lanzamiento 1, 2, 3, o 4 en el segundo lanzamiento.

Solución:

• 1er. Lanzamiento: 3/6

• 2do. Lanzamiento: 4/6

4.- Determinar la probabilidad o estimarla para los sucesos:a) al extraer una carta de una baraja bien mezclada se saca as, rey, o la jota de trébolesb) al lanzar un par de dados la suma salga 8c) encontrar una puerta defectuosa si al examinar 600, 12 sean defectuosad) sumar 7 u 11 en un lanzamiento de un par de dados.

Solución:

a) 4/52 + 4/52 + 1/52 = 9/52

b) 5/36

c) 12/600 = .02 ó 2%

d) P(7) = 6/36 P( 11 ) = 2/36 entonces: 6/36+2/36 = 8/36

Ejemplos

Page 8: clase de estadistica inferencial (1).pptx

2.- Distribución Binomial

Fórmula:

P (x) = N! p x q N – x__ x ! (N – x) !

Donde:

P(x)= distribución binomial

N = universo, población, número de eventos

p = probabilidad del evento

q = no probabilidad del evento q = 1-p

x = variable

! = Numero factorial

Es una definición discreta de probabilidad que es aplicable como un modelo en situaciones de toma de decisiones en las que se supone que el proceso de muestreo se ha realizado conforme a un proceso de Bernoulli.

Page 9: clase de estadistica inferencial (1).pptx

1.- Hallar la distribución binomial de que en 5 lanzamientos de un dado aparezca el no. 3: a) 0 veces, b) 1 vez, c) 2 veces, d) 3 veces, e) 4 veces , f) 5 veces

solución:

N = 5 P (x) = 5! (.166)0 (.834)5 – 0

p = 1/6 = .166 0! (5 – 0)! q = 1- .166= .834a) x=0 P(x) = .403 b) x=1 P (x) = 5! (.166)1 (.834)5 – 1

1! (5 – 1)!

P (x) = 0.40c) x=2 P (x) = 5! (.166)2 (.834)5 – 2

2! (5 – 2)! P (x) = .156

Y asi sucesivamente hasta 5 veces

Ejemplos

Page 10: clase de estadistica inferencial (1).pptx

2.-Si el 20 % de los pernos producidos por una maquina son defectuosos, determinar la distribución binomial de que, entre 4 pernos elegidos al azar:a) ninguno sea defectuosob)1 sea defectuosoc) 2 sean defectuosos

solución:a) x = 0N = 4p = .20 P (x) = 4! (.20)0 (.80)4 -0

q = 1 - .20 = .80 0! (4 – 0)!

P(x) = 0.40

b) x = 1 P (x) = 4! (.20)1 (.80)4 -1

2! (4 – 2)!

P(x) = 0.40

c) x = 2 P (x) = 4! (.20)2 (.80)4 -2

2! (4 – 2)!

P(x) = .153

Ejemplos

Page 11: clase de estadistica inferencial (1).pptx

3.- La probabilidad de que un estudiante ingrese e la universidad, se gradué es de 0.4, hallar la distribución binomial de que entre 5 estudiantes elegidos al azar:a) ninguno se graduéb) uno se graduéc) al menos uno se graduéd) todos se gradúen

solución:

p = .4 P (x) = 5! (.4)0 (.6)5 -0

q = 1- 4 = .6 0! (5– 0)! N = 5a) x = 0 P (x) = .07

b) x = 1 P (x) = 5! (.4)1 (.6)5 -1

1! (5– 1)!

P (x) = 0.2592

c) Al menos 1 se gradúe P (x) = 1 – .07

P (x) = .93

d) x = 5 P (x) = 5! (.4)5 (.6)5 -5

5! (5– 5)!

P (x) = 0.01

Ejemplos

Page 12: clase de estadistica inferencial (1).pptx

3.- Distribución de Poisson

P (x)= l X e - l

X !

Donde:

Letra griega lambda l = Np

N = población o universo, númerode eventos o tamaño de la muestra

p (x) = probabilidad del evento

e = numero de Euler (constante e = 2.718)

X = variable

Se usa para determinar la probabilidad de la ocurrencia de un número determinado de eventos cuando éstos ocurren en un continuo de espacio ó tiempo

Page 13: clase de estadistica inferencial (1).pptx

1.- Un 10 % de las herramientas producidas en una fábrica son defectuosas, hallar la distribución de Poisson de que en una muestra de 10 herramientas tomadas al azar , exactamente 2 sean defectuosas.

Solución:N= 10 λ = Np

p = .10 λ = 10 (.10) = 1

x = 2 P (x)= 1 2 (2.718) -1

e= 2.718 2!

p (x)= 0.18 ó 18%

Ejemplos

Page 14: clase de estadistica inferencial (1).pptx

2.- Si la probabilidad de que un individuo sufra una reacción negativa ante una inyección de cierto suero es 0.001, hallar la distribución de Poisson de que entre 2,000 individuos:

a) 3 de ellos reaccionen negativamenteb) 2 de ellos reaccionen negativamente

solución:

p= 0.001 λ = (2,000)(0.001) = 2N= 2,000e= 2.718

a) x = 3 P (x) = 2 3 (2.718) -2

3!

P (x) = 0.18

b) x = 2 P (x)= 2 2 (2.718) -2

2!

P (x) = 0.27

Ejemplos

Page 15: clase de estadistica inferencial (1).pptx

Fórmula:

P(x) = N! p1x1p2

x2…p k X k

X1! X2! ... X k!

Donde:

N = población o universo, tamaño de la muestra o número de eventos

p 1, 2, 3, etc. = probabilidades de los eventos

x 1, 2, 3, etc.= variables

4.- Distribucion Multinomial

Si los sucesos E1, E2, …, Ek pueden ocurrir con frecuencias p1, p2, … pk, respectivamente, entonces la probabilidad de que E1, E2, …, ocurran X1, X2, …, Xk veces, respectivamente , es:

Page 16: clase de estadistica inferencial (1).pptx

1.- Si se lanza un dado 12 veces, hallar la distribución multinomial de obtener los números de 1 al 6 dos veces cada uno.

Solución:

N = 12 p1= 1/6, p2= 1/6, p3= 1/6

p4= 1/6, p5= 1/6, p6 =1//6

x1= 2, x2= 2, x3= 2

x4= 2, x5= 2, x6= 2

P(x) = 12! (.166)2 (.166)2 (.166)2 (.166)2 (.166)2 (.166)2

2! 2! 2! 2! 2! 2!

P(x) = 0.0032 ó p(x) = 3.2 x 10-3

Ejemplos

Page 17: clase de estadistica inferencial (1).pptx

2.- Una caja contiene 5 bolas rojas , 4 blancas, 3 azules y se saca al azar una bola de la caja, se anota su color y se vuelve a poner en la caja, sacar la distribución multinomial de que entre 6 bolas así seleccionadas 3 sean rojas, 2 blancas y 1 azul

Solución:

N= 6

p roja= 5/12, p blanca= 4/12, p azul= 3/12

X roja= 3, x blanca= 2, x azul= 1

P(x)= 6! (.41)3 (.33)2 (.25)1

3! 2! 1!

P(x)= 0.11

Ejemplos

Page 18: clase de estadistica inferencial (1).pptx

3.- Hallar la distribución multinomial de no sacar el número 1,2,3 en 4 lanzamientos de un dado, 4 veces cada uno

Solución:

N= 4

P1= 5/6 x1= 4

P2 =5/6 x2= 4

P3= 5/6 x3= 4

P(x) = 4! (.83)4 (.83)4 (.83)4

1! 1! 1!

P(x) = .000184

Ejemplos

Page 19: clase de estadistica inferencial (1).pptx

La teoría del muestreo estudia la relación entre una población y las muestras tomadas de ella. Es de gran utilidad en muchos campos.

La teoría del muestreo es también útil para determinar si las diferencias observadas entre dos muestras son debidas a variaciones fortuitas o si son realmente significativas.

Las respuestas implican el uso de los llamados contrastes (o tests) de hipótesis y significación importantes en la teoría de las decisiones.

Inferencia estadística

Es un estudio de las inferencias hechas sobre una población a partir de muestras suyas, con indicación de la precisión de tales inferencias

5.- Teoría del Muestreo

Page 20: clase de estadistica inferencial (1).pptx

Muestras aleatorias y números aleatorios

Para que las conclusiones de la teoría del muestreo y de la inferencia estadística sean válidas, las muestras deben escogerse representativas de la población.

El análisis de los métodos de muestreo y problemas relacionados se llama el diseño del experimento.

Una forma de obtener una muestra representativa es mediante muestreo aleatorio, de acuerdo con el cual, cada miembro de la población tiene la misma probabilidad de ser incluido en la muestra.

Números aleatorios consiste en construir una tabla específicamente para el evento a realizar

Page 21: clase de estadistica inferencial (1).pptx

Muestreo con y sin reposición

Si sacamos un número de una urna, podemos volverlo a poner en ella o no, antes de la siguiente extracción. En el primer caso, ese número puede salir de nuevo más veces, mientras que en el segundo solo puede salir una vez.

Estos dos tipos de muestreo se llaman respectivamente muestreo con reposición y muestreo sin reposición.

Las poblaciones pueden ser finitas e infinitas. Población finita lo que tiene fin, población infinita sin fin ( para fines prácticos una población muy grande se puede considerar como infinita).

Page 22: clase de estadistica inferencial (1).pptx

Consideremos todas las posibles muestras de tamaño “N” en una población dada (con o sin reposición). Para cada muestra podemos calcular la media, la desviación típica, etc. Que variará de muestra a muestra, de esta manera obtenemos una distribución de datos que se llama:

Distribución de muestreo

5.- Teoría del MuestreoDistribución del Muestreo de Medias

Fórmulas:

µX = µ

sx = s Np - N N Np – 1

sx = s NDonde:

µX = Media Muestral

sX = Desviación Típica Muestral

Np= población , universo

N= tamaño de le muestra

Page 23: clase de estadistica inferencial (1).pptx

Ejemplos

1.- Las alturas de 3,000 estudiantes de una universidad están normalmente distribuidos con media de 68 pulgadas y desviación típica de 3 pulgadas. Si se toman 80 muestras de 25 estudiantes cada una, ¿Cuáles serán la media y la desviación típica muestrales, si el muestreo se hizo a) con reposición; b) sin reposición

µ = 68 µX = 68

s = 3 sx = s Np - N = 3 3000 - 25 = 0.6 ( .9959) N Np – 1 25 3,000 - 1

N = 25 = .5975 pulgadas

Np = 3,000 sx = s = 3 = 0.6 pulgadas N 25

Page 24: clase de estadistica inferencial (1).pptx

Ejemplos

2.- 500 bolas de algodones de una almohada tienen un peso medio de 5.02 gramos y una desviación típica de 0.30 gramos. Hallar la probabilidad (media y desviación típicas muestrales) de una muestra al azar de 100 bolas de algodón de ese conjunto.

µ = 5.02 gramos µX = 5.02 gramos

s = 0.30 gramos sx = s Np - N = 0.30 500 – 100 = 0.03( .8953) N Np – 1 100 500 - 1

N = 100 = .0268 gramos

Np = 500 sx = s = 0.30 = 0.03gramos N 100

Page 25: clase de estadistica inferencial (1).pptx

Fórmulas:

µp = p

sp = p q / N

Donde:

µp = Media Muestral de Proporciones

sp= Desviación Típica

Muestral de Proporciones

p= Probabilidad del Evento

q= No Probabilidad del Evento

N= tamaño de le muestra

5.-Teoría del MuestreoMuestreo de Proporciones

Page 26: clase de estadistica inferencial (1).pptx

1.- En unas elecciones uno de los candidatos obtuvo 46% de los votos, hallar la probabilidad (distribución de muestreo de proporciones )a) hubo un muestreo de 200 votantes elegidos al azarb) hubo un muestreo de 1000 votantes elegidos al azar.

p = 46% =.46 a) m p= p sp = p q / Nq = 1 – p = 1-.46q = .54 m p=.54 = 54% sp = (.46)(.54) / 200N =300

sp = .035 = 3.5%

b) sp = (.46)(.54) / 1000

sp = .015 = 1.5%

Ejemplos

Page 27: clase de estadistica inferencial (1).pptx

2.- Se ha encontrado que el 2% de las piezas fabricadas en una cierta maquina son defectuosos ¿Cuál es la probabilidad (muestreo de proporciones) de que en un envío de 400 piezas, cuantas serían defectuosas?

Solución:Sin reposición

p = 2% =.02 m p= p sp = p q / Nq = 1 – p = 1-.02

q = .98 m p = .54 =54% sp = (..02)(.98) / 400N =400

sp = 0.007 = .07%

Con reposición

sp = p q

sp = (..02)(.98)

sp = 0.14 =14%

Ejemplos

Page 28: clase de estadistica inferencial (1).pptx

3.-Hallar la probabilidad (muestreo de proporciones) de que en los próximos 200 nacimientos: a) 40% sean niños, b) 57% sean niñas.

Solución:

a) p = .40 m p = p

q = 1 - .40 = .60 m p = .40 = 40%N=200

s p = (.40) (.60 ) / 200

s p = .034 = 3.4%

b) p = .57 m p = .57 = 57%q = 1-.57 = .63

N = 200 s p = (.57) (.43) / 200

s p = .035 = 3.5%

Ejemplos

Page 29: clase de estadistica inferencial (1).pptx

5.- Teoría del MuestreoDistribución de Muestreo de Diferencias y Sumas

Fórmulas

mS1 - S2 = mS1 – mS2 mP1 - P2 = mP1 –

mP2

mS1 + S2 = mS1 + mS2 mP1 + P2 = mP1 +

mP2

sS1 – S2 = sS12 + sS2

2 sP1 – P2 = p1 q1 + p2 q2

N1 N2

sS1 – S2 = sS12 + sS2

2

N1 N2

sS1 – S2 = sS1 + S2

Donde:

sS1-S2 = desviación típica de diferencias

sS1+S2 = desviación típica de sumas

sS1 y sS2 = desviaciones típicas normales

mS1-S2 = diferencia de medias

mS1+S2 = suma de medias

mS1 y mS2 = medias normales

N1 y N2 = poblaciones

p1 y p2 = probabilidades del eventoq1 y q2 = no probabilidad del evento

Page 30: clase de estadistica inferencial (1).pptx

1.- Las lámparas de un fabricante A tienen vida media de 1,400 horas con desviación típica de 200 horas. Mientras que las de otro fabricante B tienen vida media de 1,200 horas, con desviación típica de 100 hrs. Si se toma una muestra de 125 lámparas de cada fabricante. Encontrar la media y la desviación típica de diferencias y sumas

Solución:

Fabricante A Fabricante B

m1 = 1,400 horas m2 = 1,200 horas ss1-s2 = s12 + s2

2 s1 = 200 horas s2 = 100 horas N1 N2

N1 = 125 horas N2 = 125 horas

ms1-s2 = ms1 – Ms2 ss1-ss2 = (200)2 + (100)2

ms1-s2 = 1,400 – 1,200 125 125ms1 –s2 = 200 horas

ms1 +s2 = ms1 + ms2 ss1-ss2 = 20 horasms1+s2 = 1,400 + 1,200ms1 +s2 = 2,600 horas ss1+ss2 = 20 horas

Ejemplos

Page 31: clase de estadistica inferencial (1).pptx

2.- Los rodillos de cierto fabricante pesan .50 gr. de media, con desviación típica de .02 gr. ¿Cuál es la media y la desviación típica de diferencias y sumas para 2 lotes de 1,000 rodillos cada uno?

Solución:

m1 = .50 grs. m2 = .50 grs.s1 = .02 grs. s2 = .02 grs.N1 = 1,000 N2 = 1,000

ss1-s2 = s12 + s22

N1 N2

ms1-s2 = ms1 – ms2 ss1-ss2 = (.02)2 + (.02)2

ms1-s2 = .050 – ..050 1,000 1,000ms1 –s2 = 0 grs.

ms1+s2 = ms1 + ms2 ss1-ss2 = .0008 grs.ms1+s2 = .50 + .50ms1 +s2 = 1 gr. ss1+ss2 = .0008 grs.

Ejemplos

Page 32: clase de estadistica inferencial (1).pptx

3.- Dos distancias se han medido como 27.3 cm y 15.6 cm con desviación típica de .16 cm y .08 cm respectivamente . ¿Hallar la media y desviación típica de la suma y la diferencia de esas distancias?

m1 = 27.3 cm m2 = 15.6 cms1 = .16 cm s2 = .08 cmN1 = 1,000 N2 = 1,000

ss1-s2 = s12 + s22 ss1-s2 = (.16)2 + (.08)2

ss1-ss2 = .178 cm ss1+ss2 = .178 cm

ms1+s2 = ms1 + ms2 ms1-s2 = ms1 - ms2ms1+s2 = 27.3 + 15.6 ms1-s2 = 27.3 - 15.6 ms1 +s2 = 42.9 cm ss1-ss2 = 11.7cm.

Ejemplos

Page 33: clase de estadistica inferencial (1).pptx

4.- Los tubos fabricados de cierta empresa tienen una vida media de 900 horas y una desviación típica de 80 horas, se envían 2 lotes de 100 tubos cada uno. Sacar la media y la desviación típica de diferencias y sumas

m1 = 900 horas m2 = 900 horass1 = 80horas s2 = 80 horasN1 = 100 N2 = 100

ms1-s2 = ms1 – ms2 ms1+s2 = ms1 + ms2

ms1-s2 = 900 – 900 ms1+s2 = 900 – 900 ms1 –s2 = 0 horas ms1 +s2 = 1,800 horas

ss1-s2 = s12 + s2

2

N1 N2

ss1-s2 = (80)2 + (80)2

100 100

ss1-s2 = 11.31 horas ss1+ss2 = 11.31 horas

Ejemplos

Page 34: clase de estadistica inferencial (1).pptx

Ejemplos

5.-Una urna contiene 60 piezas rojas y 40 blancas. Se sacan 2 conjuntos de 30 piezas cada uno. ¿Cuál es la media y la desviación típica de diferencias y sumas?

p roja = 60/100 = .60 q roja = 1- p roja = 1-.60 = .40p blanca = 40 /100 = .40 q blanca = 1- q blanca = 1- .40 = .60m1 = .4 m2 = .6

N1 = 30 N2 = 30 ms1-s2 = ms1 – ms2

ms1-s2 = .60 – .40

ms1 –s2 = .20

ms1+s2 = ms1 + ms2

ms1+s2 = .60 + .40ms1 +s2 = 1

ss1-s2 = p1q1 + p2q2

N1 N2

ss1-s2 = (.60) (.40) + (.40) (.60) 30 30

ss1-s2 = .126

ss1+s2 = .126

Page 35: clase de estadistica inferencial (1).pptx

6.- Un candidato recibe en unas elecciones el 65% de los votos. Hallar la media y la desviación típica de diferencias y sumas de 2 muestras aleatorias, de 200 votantes cada una, y comparar si hay diferencia de mas del 10% de votos a su favor.

p1 = 65% = .65 p2 = 65% = .65q1 = 1- p1 = 1- .65 = .35 q2 = 1 - .65 = .35m1 = .65 m2 = .65N1 = 200 N2 = 200

ms1-s2 = ms1 – ms2 ss1-s2 = p1q1 + p2q2

ms1-s2 = .65 – .65 N1 N2

ms1 –s2 = 0

ms1+s2 = ms1 + ms2 ss1-s2 = (.65) (.35) + (.65) (.35)ms1+s2 = .65 + .65 200 200ms1 +s2 = 1.30

ss1-s2 = .047ss1+s2 = .047

Ejemplos

Page 36: clase de estadistica inferencial (1).pptx

I II totalA a1 a2 NA

B b1 b2 NB

Total N1 N2 N

6.- Test Ji-Cuadrado (c2)Tabla 2x2

c2 = N (a1 b2 – a2 b1) N1N2NANB

Nivel de significación Se suele especificar antes de tomar la muestra, de manera que los resultados obtenidos no influyan en nuestra elección. Los niveles de significación más frecuentes son de .05 y .01

Para contestar la hipótesis o pregunta que se nos pida, hay que tomar en cuenta lo siguiente:

v = grados de libertadK = número de columnasTabla > resultadoLa hipótesis se acepta, caso contrario se rechaza

Page 37: clase de estadistica inferencial (1).pptx

1.- La siguiente tabla recoge el resultado de un experimento para investigar el efecto de un suero contra cierta enfermedad. Con nivel de significación a) 0.99 b) 0.95. Contrastar la hipótesis de que no hay diferencia entre los grupos con o sin suero

Ejemplos

Curados No curados TotalGrupo A 75 25 100Grupo B 65 35 100

Total 140 60 200

c2 = N (a1 b2 – a2 b1) N1N2NANB

c2 = 200[(75)(35) – (65)(25)]2 (140)(60)(100)(100)

c2 = 200,000,000 84,000,000

c2 = 2.38

Nivel de Significacióna) .01 v=K – 1 v = grados de libertad

v= 2 – 1 K = número de columnasv = 1

c2 = 6.636.63 > 2.38La hipótesis se acepta

b) .05 v= 1

c2 = 3.843.84 > 2.38La hipótesis se acepta

Page 38: clase de estadistica inferencial (1).pptx

6.- Test Ji-Cuadrado (c2)Tabla 2x3

I II III TotalA a1 a2 a3 NA

B b1 B2 B3 NB

Total N1 N2 N3 N

Fórmula:

c2 = N a12 + a2

2 + a32 + N b1

2 + b22 + b3

2 - N NA N1 N2 N3 NB N1 N2 N3

Nivel de significación Se suele especificar antes de tomar la muestra, de manera que los resultados obtenidos no influyan en nuestra elección. Los niveles de significación más frecuentes son de .05 y .01

Para contestar la hipótesis o pregunta que se nos pida, hay que tomar en cuenta lo siguiente:

v = grados de libertadK = número de columnasTabla > resultadoLa hipótesis se aceptaCaso contrario se rechaza

Page 39: clase de estadistica inferencial (1).pptx

1.- La siguiente tabla muestra los números de estudiantes aprobados y reprobados por 3 profesores contrastar la hipótesis de que las proporciones de reprobados por los 3 profesores son iguales. Con nivel de significación a) 0.99 b) 0.95. Contrastar la hipótesis de que no hay diferencia entre los grupos de aprobados y reprobados

Ejemplos

Profesor X Profesor Y Profesor Z TotalAprobados 50 47 56 153Reprobados 5 14 8 27

Total 55 61 64 180

c2 = N a12 + a2

2 + a32 + N b1

2 + b22 + b3

2 - N NA N1 N2 N3 NB N1 N2 N3

c2 = 180 (50)2 + (47)2 + (56)2 + 180 (5)2 + (14)2 + (8 )2 - 180 153 55 61 64 27 55 61 64

c2 = 4.53

V = K – 1 a) .01 y v=2 b) .05 y v= 2V = 3 – 1 9.21 > 4.53 5.99 > 4.53V = 2 la hipótesis se la hipótesis se

acepta acepta

Page 40: clase de estadistica inferencial (1).pptx

6.- Test Ji-Cuadrado (c2)Frecuencias Observadas y Esperadas

Evento 1 Evento 2 … Evento k

Frecuencia Observada

O1 O2 … O K

Frecuencia Esperada

e1 e2 … e k

Supongamos que en una muestra particular un conjunto de sucesos posibles E1, E2, E3, …, Ek se observa que ocurren con frecuencias O1, O2, O3, …, Ok, llamadas frecuencias observadas, y que según las leyes de las probabilidades, se espera que sucedan con frecuencias e1, e2, e3, …, ek, llamadas frecuencias esperadas o teóricas.

Una medida de la discrepancia existente entre las frecuencias observadas y esperadas viene proporcionada por el estadístico c 2 (ji-cuadrado) dado por :

c2 = (O1 – e1 )2 + ( O2 - e2)2 + … + (O k - e k)2 e1 e2 e k

Page 41: clase de estadistica inferencial (1).pptx

1.- La siguiente tabla muestra las frecuencias observadas y las frecuencias esperadas al lanzar un dado 120 veces. Contrastar la hipótesis de que el dado es bueno, con un nivel de significancia de 0.95

Ejemplos

1 2 3 4 5 6Frecuencia Observada

25 17 15 23 19 21

Frecuencia Esperada

20 20 20 20 20 20

c2 = (O1 – e1 )2 + ( O2 - e2)2 + … + (O k - e k)2 e1 e2 e k

c2 = (25 –20 )2 + (17- 20)2 + (15 – 20)2 +(23 –20 )2 + (19- 20)2 + (21 – 20)2 20 2020 20 20 20c2 = 1.25 + .45 + 1.25 + .45 + .05 + .05

c2 = 3.5

v = k – 1 con v=5 y .05 11.07 > 3.5v = 6 – 1 tabla = 11.07 la hipótesis se aceptav = 5

Page 42: clase de estadistica inferencial (1).pptx

Ejemplos

2.- La siguiente tabla recoge la distribución de los dígitos del 0 al 9 en una tabla de números aleatorios de 250 dígitos, ¿difiere la distribución observada de la esperada de forma significativa con un nivel de significancia de 0.99?

0 1 2 3 4 5 6 7 8 9Frecuencia Observada

17 36 24 18 14 20 35 30 20 36

Frecuencia Esperada

25 25 25 25 25 25 25 25 25 25

c2 = (O1 – e1 )2 + ( O2 - e2)2 + … + (O k - e k)2 e1 e2 e k

c2 = (17 –25 )2 + (36- 25)2 + (24 – 25)2 +(18 –25 )2 + (14- 25)2 + (20 – 25)2 + (35 –25 )2 + (30 –25 )2 + (20 –25 )2 + (36 –25 )2 25 25 25 25 25 25 25 25 25 25c2 = 2.56 + 4.84 +0.04 + .64 + 1.96 + 4.84 + 1 + 4 + 1 + 1 + 4.84

c2 = 23.28

v = k – 1 con v=9 y .99 21.67 < 23.28v = 10 – 1 tabla = 21.67 la hipótesis se rechazav = 9

Page 43: clase de estadistica inferencial (1).pptx

Donde:t = Distribución de StudentX = Media normalM = Media muestralN = Población o universoS = Desviación típica normalS1 y S2 = Desviación típica normal

s = Desviación típica muestral

7.- DISTRIBUCION “t” DE STUDENT

t = X – m N – 1 S

t = X1 – X2 / s 1 / N1 + 1/N2

s = N1 s12 + N2 s2

2 / N1+ N2 - 2

W. S. Gosset descubrió ésta distribución y la publicó bajo el pseudónimo “Student “ (estudiante) a principios del siglo 20

Page 44: clase de estadistica inferencial (1).pptx

1.- Una muestra de 12 medidas de la tensión de ruptura de hilos de algodón da una media de 7.38 gramos y una desviación típica de 1.24 gramos. Hallar la prueba de t de Student para los límites de confianza de a) 95% b) 99%

N =12X = 7.38 grs.S= 1.24 grs.

m = 0 t= 7.38 – 0 12-1 v = N- 1 1.24 v = 12- 1

v = 11t= (5.95) ( 3.31)

a) 95% = .95 b) 99% =.99t= 19.7 tabla = 1.796 tabla =

1.796 < 19.7 2.718<19.7

Se rechaza la hipótesis Se rechaza la hipótesis

Ejemplos

Page 45: clase de estadistica inferencial (1).pptx

2.- cinco medidas de tiempo de reacción de un individuo ante cierto estimulo ya registrado como .28, .30, .27, .33, .31 segundos. Hallar la prueba “t” de student para los límites de confianza a) 95% b) 99% para el tiempo real de reacción

N = 5X = (.28 + .30 + .27+ .33 + .31 ) / 5

X = .29 seg

S = (.29 - .28)2 + ( .29 - .30 )2 + ( .29 - .29)2 + ( .29 - .33)2 + (.29 -.31)2 5

S = (.0001+ .0001 + .0004 + .0016 + .0004 )5

S = .0026 / 5S = .022 seg

t = (.29 – 0) ( 5 – 1) V = 5 – 1 a) tabla = 2.132 .022t = (13.18 ) ( 2 ) V = 4 2.132 < 26.36 La hipótesis se rechaza

t = 26.36 seg b) tabla = 3.747

3.747 < 26.36 La hipótesis se rechaza

Ejemplos

Page 46: clase de estadistica inferencial (1).pptx

3.- Con gasolina de la marca A, el número medio de millas por galón que recorren 5 autos similares en igualdad de condiciones es 22.6, con desviación típica de 0.48, con gasolina de otra maraca B, el resultado es 21.4 con desviación típica de 0.54. Usando un nivel de significancia de 0.95 investigar si la marca A es de mejor calidad que la B.

Gas A Gas B s = 5 (.48)2 + 5 (.54)2

N1 = 5 N2 = 5 5 + 5 - 2X1 = 22.6 X2 = 27.4

S1 = .48 gal S2 = .54 s = 0.57

t = X1 – X2

s ( 1/ N1 + 1/N2 )

t = 22.6 – 21.4 .0.57 ( 1/5 + 1/5 )

t = .33 GAS A GAS B

Ejemplos

V = N1 + N2 – 2 Tabla = 1.81V = 5 + 5 – 2 1.81> .33 La hipótesis se aceptaV = 8

Page 47: clase de estadistica inferencial (1).pptx

4.-En un examen de psicología 12 estudiantes de una clase obtuvieron media de 78 con desviación típica de 6 y 15 de otra clase consiguieron media de 74 con desviación típica de 8. Mediante en nivel de significancia de 0.95 determinar si el primer grupo es superior al segundo.

Clase A Clase B s = 12 (6 )2 + 15 ( 8 )2

N1 = 12 N2 = 15 12 + 15 - 2X1 = 78 X2 = 74

S1 = 6 S2 = 8 s = 7.46

t = X1 – X2

s ( 1/ N1 + 1/N2 )

t = 78 – 74 7.46 ( 1/12 + 1/15 )

t = 1.41

Ejemplos

V = N1 + N2 – 2 Tabla = 1.708V = 12 + 15 – 2 1.708 > 1.41 La hipótesis se aceptaV = 25

Page 48: clase de estadistica inferencial (1).pptx

8.- Teoría de la CorrelaciónGrado de interconexión entre variables, que intenta determinar con que precisión describe o explica la relación entre variables de una ecuación lineal o de cualquier otro tipo.

Si todas los valores de las variables satisfacen una ecuación exactamente decimos que están perfectamente correlacionados o que hay correlación perfecta entre ellas.

Cuando solo están en juego dos variables, hablamos de correlación simple, en otro caso se habla de correlación múltiple.

Correlación Lineal

Si X e Y son las dos variables en cuestión, un diagrama de dispersión muestra la localización de los puntos (X, Y) sobre un sistema rectangular de coordenadas.

Si todos los puntos del diagrama de dispersión parecen estar en una recta , la correlación se llama lineal.

Page 49: clase de estadistica inferencial (1).pptx

Ecuaciones de las rectas de regresión de mínimos cuadrados:

Y = a0 + a1X

X = b0 + b1Y

a0 = ( SY ) ( SX 2 ) – ( SX ) ( SXY) N ( SX 2 ) - ( SX ) 2

a1 = N ( SXY ) – ( SX ) ( SY) N ( SX 2 ) - ( SX ) 2

b0 = ( SX ) ( SY 2 ) – ( SY ) ( SXY) N ( SY 2 ) - ( SY ) 2

b1 = N ( SXY ) – ( SX ) ( SY) N ( SY 2 ) - ( SY ) 2

Page 50: clase de estadistica inferencial (1).pptx

1.- La siguiente tabla presenta las calificaciones de 2 exámenes de biología “x” e “y” de 10 estudiantes:a) construir el diagrama de dispersiónb) hallar la recta de regresión de mínimos cuadrados de y/xc) hallar la recta de regresión de mininos cuadrados de x/y

Ejemplos

Examen X

Examen Y X2 Y2 XY

5 8 25 64 408 7 64 49 568 7 64 49 568 10 64 100 807 5 49 25 356 8 36 64 4810 10 100 100 1004 6 16 36 249 8 81 64 727 6 49 36 42

SX =72 SY =75 SX2 = 548 SY2 = 587 SXY = 553

Page 51: clase de estadistica inferencial (1).pptx

Encontrar los valores de a0, a1, b0 y b1

a0 = ( 75 ) (548 ) – ( 72 ) ( 553) = 4 10( 548 ) - ( 72 ) 2

a1 = 10 ( 553 ) – ( 72) ( 75) = 0.5 10 ( 548 ) - ( 72) 2

b0 = ( 72 ) ( 587 ) – ( 75 ) ( 553) = 2.4 10 ( 587 ) - ( 75 ) 2

b1 = 10( 553 ) – ( 72 ) ( 75 ) = 0.67 10 ( 587 ) - ( 75 ) 2

Ecuaciones de las rectas de regresión de mínimos cuadrados:

1) Y =4 + 0.5X 2) X =2.4 + 0.67Y

Page 52: clase de estadistica inferencial (1).pptx

Y X X Y2.5 -3 0.39 -33 -2 1.06 -2

3.5 -1 1.73 -14 0 2.4 0

4.5 1 3.07 15 2 3.74 2

5.5 3 4.41 3

-3 -2 -1 1 2 3 4 5

-1

-2

-3

6

5

4

3

2

1

Ecuaciones de las rectas de regresión de mínimos cuadrados:

1) Y =4 + 0.5X 2) X =2.4 + 0.67Y

Page 53: clase de estadistica inferencial (1).pptx

2.-La siguiente tabla da en pulgadas las respectivas estaturas de una muestra de 12 padres y sus hijos mayoresa) construir un diagrama de dispersiónb) hallar la recta de regresión de mínimos cuadrados de y/xc) hallar la recta de regresión de mínimos cuadrados de x/y

Ejemplos

Padres X Hijos Y x2 y2 xy

65 68 4225 4624 4420

63 66 3969 4356 4158

67 68 4489 4624 4556

64 65 4096 4225 4160

68 69 4624 4761 4692

62 66 3844 4356 4092

70 68 4900 4624 4760

66 65 4356 4225 4290

68 71 4624 5041 4828

67 67 4489 4489 4489

69 68 4761 4624 4692

71 70 5041 4900 4970

SX = 800 SY =811 SX2 = 53418 SY2 = 54849 SXY = 54107

Page 54: clase de estadistica inferencial (1).pptx

Encontrar los valores de a0, a1, b0 y b1

a0 = ( 811 ) (53418 ) – ( 800 ) ( 54107) = 35.82 12( 53418 ) - ( 800 ) 2

a1 = 12 ( 54107 ) – ( 800) ( 811) = 0.47 12 ( 53418 ) - ( 800) 2

b0 = ( 800 ) ( 54849 ) – ( 811 ) ( 54107) = -3.37 12 ( 54849 ) - ( 811 ) 2

b1 = 12( 54107) – ( 800 ) ( 811 ) = 1.03 12 ( 54849 ) - ( 811 ) 2

Ecuaciones de las rectas de regresión de mínimos cuadrados:

1) Y =35.82 + 0.47X 2) X =-3.37 + 1.03Y

Page 55: clase de estadistica inferencial (1).pptx

Y X X Y34.41 -3 -6.46 -334.88 -2 -5.43 -235.35 -1 -4.4 -135.82 0 -3.37 036.29 1 -2.34 136.76 2 -1.31 237.23 3 -0.28 3

-7 -6 -5 -4 -3 -2 -1 1 2 3 4 5

-1

-2

-3

36

34

32

30

20

10

Ecuaciones de las rectas de regresión de mínimos cuadrados:

1) Y =35.82 + 0.47X 2) X =-3.37 + 1.03Y