ESTADISTICA INFERENCIAL

77
INTRODUCCION A LA PROBABILIDAD Paralelamente al desarrollo de la Estadística, como disciplina científica en forma independiente, se desarrollo a partir del XVII al Cálculo de probabilidades. Sus indicadores son los matemáticos Italianos y Franceses de ese siglo, particularmente FERMAT y PASCAL, quienes iniciaron los estudios del cálculo de probabilidades, tratando de resolver problemas de juegos de azar. A fines del siglo XVIII y principios del XIX, los trabajos de LAPLACE permitieron dar su definitiva estructuración al cálculo de probabilidades. A partir de LAPLACE, las dos disciplinas, calculo de probabilidades y Estadística, que hasta entonces habían permanecido separados se fusionaron de manera que el cálculo de probabilidades se constituye en el andamiaje matemático de la Estadística, mediante el cual, esta pudo tomar el impulso teórico que habría de llevarla al extraordinario desarrollo y perfeccionamiento que alcanzó en el siglo pasado y en el presente. La estadística moderna se caracteriza por hacer uso de la estadística inferencial.

Transcript of ESTADISTICA INFERENCIAL

Page 1: ESTADISTICA INFERENCIAL

INTRODUCCION A LA PROBABILIDAD

Paralelamente al desarrollo de la Estadística, como disciplina

científica en forma independiente, se desarrollo a partir del XVII al

Cálculo de probabilidades.

Sus indicadores son los matemáticos Italianos y Franceses de ese

siglo, particularmente FERMAT y PASCAL, quienes iniciaron los

estudios del cálculo de probabilidades, tratando de resolver

problemas de juegos de azar.

A fines del siglo XVIII y principios del XIX, los trabajos de LAPLACE

permitieron dar su definitiva estructuración al cálculo de

probabilidades.

A partir de LAPLACE, las dos disciplinas, calculo de probabilidades y

Estadística, que hasta entonces habían permanecido separados se

fusionaron de manera que el cálculo de probabilidades se constituye

en el andamiaje matemático de la Estadística, mediante el cual, esta

pudo tomar el impulso teórico que habría de llevarla al extraordinario

desarrollo y perfeccionamiento que alcanzó en el siglo pasado y en el

presente.

La estadística moderna se caracteriza por hacer uso de la estadística

inferencial.

Esta incluye un conjunto de técnicas que, como se dijo en la primera

parte tiene el propósito de INFERIR O INDUCIR leyes de

comportamiento de una población a partir del estudio de una muestra

GENERALIDADES:

Page 2: ESTADISTICA INFERENCIAL

En muchas oportunidades nos hemos encontrado con afirmaciones

donde no existe el100% de certeza sobre la aparición realización de

un lecho o fenómeno.

Por ejemplo continuamente escuchamos situaciones como las

siguientes:

- Dado los niveles de inflación, en los últimos meses en el país, es

probable que el próximo año, la economía alcance niveles de

hiperinflación

- Dada la reducción continua, de los ingresos reales y el aumento

de desempleo en la población, es probable que en los próximos

mese, se desate una serie de conflictos sociales.

En estos ejemplos se puede apreciar que el resultado final no se

conoce con exactitud o certeza existe por lo tanto INCERTIDUMBRE.

Así “se vive en un mundo donde se esta en la capacidad de predecir

el futuro con completa certeza”. La necesidad de tener suficiente

poder para manejar la incertidumbre obliga a estudiar y usar la teoría

de la probabilidad.

La probabilidad por tanto, nos proporciona la base para el estudio de

la inferencia estadística. Aquí estudiaremos solo los conceptos y

técnicas de probabilidad fundamentales que nos permita comprender

el análisis estadístico.

PROBABILIDAD

La teoría de probabilidad tiene mucha importancia en problemas de

Ingeniería, Administración, Economía, Etc.

“Hay que tomar decisiones frente a la incertidumbre”

Para un Ingeniero, posiblemente no tenga sentido el preguntarse

¿Durante cuanto tiempo funcionará un determinado mecanismo?

Pero tendrá sentido el preguntarse y responderse a la pregunta ¿Cuál

es la probabilidad que este mecanismo funcione más de 1000 horas?

Page 3: ESTADISTICA INFERENCIAL

ó ¿Qué porcentaje de estos mecanismos funcionarán más de 1000

horas?

Para un fabricante a gran escala tendrá sentido el preguntarse por

porcentaje de su producto, será aceptado en el mercado.

A un candidato presidencial posiblemente no le interese que Juan

vote por el, per si le interesará saber el porcentaje de electores, que

volarán por el.

EXPERIMENTO ALEATORIO

Usted aunque no lo crea esta familiarizado con lo que es un

experimento aleatorio.

Posiblemente más de una vez, ha tenido que definir una apuesta por

medio de una moneda. En esta decisión, en el lenguaje corriente se

dice “Gana el que tiene suerte” en teoría de probabilidades diremos

que se determina “ALEATORIAMENTE” ó al azar al ganador.

Evidentemente antes de lanzar la moneda, no se podrá afirmar quien

va a ser el ganador (esta es una característica de un experimento

aleatorio)

- Sin embargo si la monada esta perfectamente equilibrada, ambas

tiene las mismas posibilidades de ganar.

A mediados del siglo XVI GIROLAMO CARDANO, matemático, medico y

jugador Italiano, escribió “El libro de los juegos de azar” en el que

aparecía el primer estudio conocido, de los principios de probabilidad.

Alrededor de 100 años mas tarde, el jugador CHEVALIER DE MERE

propuso a BLAISE PASCAL el famoso “Problemas delos puntos”, que

puede describirse como sigue:

Dos personas participan en un juego de azar, la primera que logre

acumular un cierto numero de puntos ganará la apuesta, si los

jugadores se ven forzados a suspender el juego antes de que haya

Page 4: ESTADISTICA INFERENCIAL

terminado, dado el número de puntos que ha acumulado cada uno de

ellos ¿Cómo deberá dividirse la apuesta?

Este problema constituyo un reto al ingenio de los astutos

matemáticos Franceses BLAISE PASCAL Y PIERRE DE FERMAT, quienes

iniciaron los estudios del cálculo de probabilidades tratando de

resolver problemas de juego de azar propuestas por el caballero DE

MERE.

En general todos los juegos de azar constituyen experimentos

aleatorios.

RIFA, DADOS, CARRERA DE CABALLOS, LOTERÍAS, BARAJA, ETC.

Este ejemplo nos da una idea de lo que es un experimento aleatorio

“Un experimento aleatorio ó estadístico es cualquier experimento u

operación) cuyo resultado no puede predecirse con exactitud antes

de realizarse el experimento”

Ejm.:

- Lanzar un moneda y observar la cara superior.

- Extraer un articulo de un lote que contiene artículos

defectuosos D y no defectuosos N.

- Designar un delegado de un grupo de 50 personas.

- Calcular el número de automóviles que cruzan la intersección

de dos calles, hasta antes que ocurra un accidente.

- Fabricar artículos hasta producir 5 artículos defectuosos y

contar el número total de artículos fabricados.

Son experimentos aleatorios, porque en cada caso el resultado del

experimento no puede predecirse.

En cambio.

“Soltar una piedra en el aire”

“Lanzar una pelota aun tanque de agua”

Page 5: ESTADISTICA INFERENCIAL

No son experimentos aleatorios, puesen el primer caso la piedra

caerá y en el segundo caso la pelota flotará

En general todos los juegos de azar constituyen experimentos

aleatorios.

EXPERIMENTO : Se hace rodar un dado y se observa el

número que aparece en la cara superior

ESPACIO MUESTRAL : S = [1, 2, 3, 4, 5, 6]

EVENTO A : Obtener numero par A= [2, 4, 6]

PROBABILIDAD

La definición clásica de probabilidad puede enunciarse así:

Si un evento A, Puede ocurrir de “m” formas de un total de “N”

posibles formas y si estas “N” son todas las formas posibles de

realización del evento, entonces la probabilidad de ocurrencia del

evento A, denominada P(A), esta dada por:

P (A) = mN

= CasosFavorablesCasosPosibles

Esto significa que si hay N elementos en el conjunto de resultados

posibles, la probabilidad para cualquiera de ellos, será 1/N.

Cual es la probabilidad que tirando un dado muestre un AS)

En este caso puede obtenerse como resultado, cualquiera de los seis

casos o lados (1, 2, 3, 4, 5, 6) que tiene el dado (casos posibles), esto

significa que la suerte o probabilidad que tiene cada cara es 16

P (A) = 16 =

CasosFavorablesCasosPosibles

= 0.1666 = 0.17 = 17%

Page 6: ESTADISTICA INFERENCIAL

Si se espera obtener un número par, debemospensar que hay tres

caras (2, 4, 6) que cumplen esta condición, luego la probabilidad de

obtener número par será:

P (par) = 36 =

12 = 0.50

En términos de conjunto será

N = {1,2,3,4,5,6} m = {2,4,6}

Ejem.:

Enumerar los resultados posibles de un experimento que consiste en

lanzar dos monedas.

Denotamos C Y S respectivamente

Moneda 1 : C C S S

Moneda 2 : C S C S

S = CC, CS, SC, SS

Puntos muestrales

Ejem.:

Enumerar los resultados posibles de un experimento en el que se

lanza una moneda tres veces

Los resultados posibles son 8

S = CCC, CCS, CSC, CSS, SCC, SCS, SSC, SSS

Para todo evento A

0 < P(A) < 1

2da moneda C S 1era moneda

C CC CSS SC SS

Page 7: ESTADISTICA INFERENCIAL

Si la probabilidad de un evento es 0 se dice que es imposible y si es 1

se dice que hay certeza.

Ejemplos:

Lanzar una moneda dos veces, es equivalente a lanzar dos monedas

una sola vez

Si una moneda se lanza n veces, entonces el espacio muestral 2n

eventos elementales

_Si en S se define al Evento A, entonces su complemento es A, donde: Si m es las veces que puede ocurrir el evento A, (N-m) denotará las

veces que ese evento no ocurra.

_ _Si denotamos A la no ocurrencia de A, su probabilidad P(A) (ó q) esta dado por:

(q =) P (A) = N−mN

= NN

- mN

= 1 – P (A)

De donde es fácil inferir que la suma de las probabilidades es de

ocurrencia y no ocurrencia de un evento es uno (1), es decir

p + q = P(A) + P (A)= 1

P (A)= 1- P(A)

Ejem.:

De un comité de 20 estudiantes constituido por estudiantes de

Ingeniería, Económica y Agronomía, se va a elegir al azar al

Presidente; se sabe que la probabilidad de elegir un estudiante de

Economía es 2/5 ¿Cuál es la probabilidad que el Presidente no sea de

Economía?

A = Economía Ā= No Economía

A

S

A

Page 8: ESTADISTICA INFERENCIAL

P (Ā)= 1-P(A) = 1 - 25 =

35 = 0.6

LEYES DE PROBABILIDAD

Las leyes de probabilidad son dos:

La ley de suma y la de multiplicación.

Debe tenerse en cuenta que no se aplica a cualquier caso, sin que su

aplicación esta condicionada a la naturaleza de los eventos.

LEY DE LA SUMA se aplica a dos clases de eventos.

a. EVENTOS MUTUAMENTE EXCLUYENTES

Dos eventos cualquiera A y B son (eventos) mutuamente

excluyentes si y solo si A π B = Ø .Es decir, son eventos que no

tienen elementos comunes. Son conjuntos disjuntos.

Si A y B son sucesos mutuamente excluyentes, entonces

TEOREMA 1

P (AUB) = P(A) + P(B)

Por ejemplo si en la población mayor de 20 años de edad se

define los Eventos.

A = {Población Analfabeta}

B = {Abogados}

Entonces A π B = Ø Porque no hay Abogados analfabeto

En este caso los dos eventos A y B no tienen puntos en común de

modo que A π B = Ø, no pueden ocurrir simultáneamente.

BA

S A π B = ØSon mutuamente Excluyentes

Page 9: ESTADISTICA INFERENCIAL

En general si hay varios eventos, mutuamente excluyentes.

La probabilidad de que ocurra algunos de ellos.

P (A U B U C U …….)

TEOREMA

P (AU BU C) = P (A) + P (B) + P (C)

“La suma de la probabilidad de los Eventos es igual a 1”

Ejem.:

Una caja tiene 220 tornillo iguales, de los cuales 80 son

producidos por la maquina A, 60 por la maquina B, 50 por la

maquina C y 30 por la maquina D. si se elige un tornillo al azar de

la caja ¿Cuál es la probabilidad que el tornillo elegido haya sido

producido por las maquinas A ó C?

Es claro que A, B, C, D son Eventos mutuamente excluyentes,

porque cada tornillo es producido por una y sólo una maquina.

E = {A, C}

P (A U C) = P (A) + P (C)

= 80220

+ 50220

= 0.591

Además S = {A, B,C, D}

La probabilidad haya sido producido por las maquinas AoBoCoD.

P (AUBUCUD) = P(A) + P(B) + P(C) + P(D)

= 80220

+ 60220

+ 50220

+ 30220

= 220220

= 1

S

A B C

Page 10: ESTADISTICA INFERENCIAL

b. EVENTOS (INDEPENDIENTES) NO MUTUAMENTE

EXCLUYENTES

En este caso significa la probabilidad de que ocurra el evento A ó

B ó que ocurran ambos.

En la suma de sus probabilidades, es menos la probabilidad de si

ocurrencia conjunta

Es decir que estos dos eventos tiene una porción común o

intersección A π B

TEOREMA:

P (AUB) = P (A) + P (B) – P(A π B)

Donde P(A π B) representa la probabilidad de que ocurran

simultáneamente A y B

En la suma de las probabilidades de todos los puntos P(A) + P(B)

se incluyen dos veces los puntos de A π B, por lo tanto P(A π B)

debe restarse dela suma P(A) + P(B).

Se obtiene que el resultado es el total de probabilidades de todos

los puntos de AUB, cada uno de los cuales se toma sólo una vez.

Este teorema representa el teorema general de la suma de

probabilidades.

Ejemplo:

Cual es la probabilidad de sacar un As ó una espada de una baraja

de casino.

Del grafico se deduce que A y B no son mutuamente excluyentes, porque tienen una parte en común.

BA A B

Page 11: ESTADISTICA INFERENCIAL

Los eventos A y B no son mutuamente excluyentes, pues hay un

AS de espadas.

Luego de probabilidad de extraer una carta que sea AS o una

espada o ambos casos es:

P(A) = Extraer un AS = 452

P(B) = Extraer una ESPADA= 1352

P (AUB) = P(A) + P(B) – P(A π B)

= 452

+ 1352

- (452

) (1352

) = 1652

= 413

0.308

Ejem.

En una empresa comercial trabajan 8 hombres y 18 mujeres, de

las cuales la mitad de los hombres y la mitad de las mujeres han

nacido en Lima. Hallar la probabilidad de que un trabajador

elegido al azar sea hombre ó que haya nacido en Lima.

Sea A = {El trabajador sea hombre}

B = {Trabajador nacido en Lima}

Entonces ser hombre ó nacido en Lima será A U B

P (AUB) = P(A) + P(B) – P(A π B)

P(A) = 826

P(B) = 4+926

= 1326

P(A π B) = 426

P (AUB) = 826

+ 1326

- 426

= 1726

= 0.654

S = {A, B, C}

BA A B

Page 12: ESTADISTICA INFERENCIAL

P(AUBUC)

TEOREMA:

P(AUBUC) = P(A) + P(B) + P(C) – P(A π B) – P(B π C) – P(A π C)

+ P(A π B π C)

Ejem.:

Un examen de automóviles recién desechados, debido a

descomposturas del radiador, el motor ó la transmisión, demostró

que el 40% tenía transmisiones malas, el40% tenían radiadores

malos y el 50% tenían motores malos. El 15% tenía mal, tanto la

transmisión como el radiador, el 20% la transmisión y el motor y

el 20% el radiador y el motor.

¿Cuántos tenían las 3 cosas mal?

Establecemos T = Transmisión Mal

R = Radiador Mal

M = Motor Mal

40% P(T) = 0.40 15% P(TR) = 0.15

40% P(R) = 0.40 20% P(TM) = 0.20

50% P(M) = 0.50 20% P(RM) = 0.20

Encontrar: P (TRM)

S

C

B CA C

A B

A B C

AB

M

RMTM

T R

TRM

T R

Page 13: ESTADISTICA INFERENCIAL

P(TURUM) = P(T) + P(R) + P(M) – P(T π R) – P(R π M) – P(T π M)

+ P(T π R π M)

1 = 0.40 + 0.40 + 0.50 – 0.15 – 0.20 – 0.20 + P(T π Rπ M)

P(T π R π M) = 0.25

REGLA DEL PRODUCTO DE PROBABILIDADES

Con frecuencia resulta necesario trabajar con probabilidades para una

parte, más que para todo un espacio muestral.

En este caso nos ocuparemos de la probabilidad de un evento, en un

determinado subconjunto, del espacio muestral general. Las

probabilidades asociadas con eventos en un determinado subconjunto

del espacio muestral, se llaman PROBABILIDADES CONDICIONALES.

Procedemos a desarrollar un método general para hallar

probabilidades condicionales.

DIAGRAMA DE VENN

Si en el espacio muestral S hay N resultados igualmente posibles

de los que Na son favorables al evento A; Nb favorables al B, y

Nab, favorables tanto al evento A como al B, entonces:

1.30 0.55

0.75

S

NbNa Nab

B

BA A B

Page 14: ESTADISTICA INFERENCIAL

P(A) = NaN

P(B) = NbN

P(A π B) = NabN

P(A/B) = NabNb

P(B/A) = NabNa

Si conocemos P(B) y P(A/B), podemos obtener P(A π B)

directamente, notando que

TEOREMA

P(A π B) = P(B) P (A/B)= NbN.NabNb

= NabN

A este resultado se le denomina con (frecuencia) REGLA DEL PRODUCTO

DE PROBABILIDADES

Es fácil verificar que P (A π B) es también igual al producto

P(A) P(B/A)

TEOREMA:

P (A π B) = P(A) P(B/A) = NbN.NabNa

= NabN

Extendiendo dicha regla a tres eventos A, B,C

TEOREMA

NbNa Nab

B

BA A B

Page 15: ESTADISTICA INFERENCIAL

P (A π B π C) = P (A) P(B/A) P (C/A π B)

Se conoce como la ley de la multiplicación de probabilidades y es útil en el

calculo de probabilidades de eventos compuestos, es decir eventos que

constan de dos ó más eventos simples.

REGLA DEL PRODUCTO PARA EVENTOS INDEPENDIENTES.

Si la ocurrencia o no ocurrencia de un evento A no tiene ningún efecto sobre la

probabilidad de la ocurrencia de B y viceversa, los eventos A y B son

denominados eventos independientes.

En este caso, saber que se obtuvo en el primer evento, no tendría valor alguno

en (la predicción) del resultado del segundo.

Dos eventos A y B son independientes así:

TEOREMA:

P (A π B) = P (A) P (B)

(Esta definición es llamada regla del producto para eventos independientes)

El concepto de independencia, no se limita a dos eventos.

En el caso de tres A, B, C (se dice que son independientes si solo si)

TEOREMA:

a. P (A π B π C) = P (A) P(B) P(C)

PROBABILIDAD CONDICIONAL

La regla del producto de probabilidades, es utilizada (a menudo) para obtener

probabilidades condicionales.

BA

CBA

Page 16: ESTADISTICA INFERENCIAL

Si P(B) es distinto de 0, podemos dividir los dos términos por P(B) para

obtener P (A π B) = P(B) P(A/B)

TEOREMA

P (A/B) =P (A π B)P(B) P(B) ≠ 0

De manera similar, encontramos que la probabilidad de B dado A es.

TEOREMA P (A π B) = P(A) P(B/A)

P (B/A) =P (A π B)P (A ) P(A) ≠ 0

Siempre que P (A) sea distinto de cero.

VARIABLE ALEATORIA Y DISTRIBUCION DE

PROBABILIDADES

VARIABLE ALEATORIA

Es una variable en la que no se puede fijar anticipadamente el valor que debe

tomar, porque este valor depende de los posibles resultados de un experimento

aleatorio. Se denotan por letras mayúsculas tales como: X, Y, Z etc.

Ejemplo:

En el experimento aleatorio de lanzar tres monedas legales el espacio muestral

es:

S = {ccc, ccs, csc, scc, css, scs, ssc, sss}

Sea la variable aleatoria X que representa el número de caras que se puede

obtener en cualquier resultado del experimento aleatorio.

En el experimento aleatorio de lanzar tres monedas legales, el espacio

muestral es:

Page 17: ESTADISTICA INFERENCIAL

S = {ccc, ccs, csc, scc, css, scs, ssc, sss}

Sea la variable aleatoria X que designa el número de caras que se puede

obtener en cualquier resultado del experimento.

Vemos que el rango de X es el conjunto {3, 2, 1, 0}

Los números 0, 1, 2, 3 se llaman valores de la variable aleatoria X.

En el desarrollo de la teoría de las probabilidades y sus aplicaciones, es

conveniente considerar cada uno de esos valores como un evento. Así

tenemos los eventos:

A = {X = 0} = {que la variable aleatoria tome el valor 0}

B = {X = 1} = {que la variable aleatoria tome el valor 1}

C = {X = 2} = {que la variable aleatoria tome el valor 2}

D = {X = 3} = {que la variable aleatoria tome el valor 3}

DISTRIBUCION DE PROBABILIDAD

DISTRIBUCION BINOMIAL – BERNAULLI

En este capítulo presentamos algunas distribuciones de probabilidad discreta,

desarrollando en forma analítica ciertas suposiciones básicas de un fenómeno

real. Estas distribución es tiene aplicaciones en Ingeniería, Administración, etc.

La distribución de probabilidad es de Bernaulli (en homenaje a JACQUES

BERNAULLI, quien en el año 1600 también desarrollo la teoría de las

Permutaciones) se aplica solo cuando hay dos resultados posibles.

Por ejemplo: en un test verdadero – falso

La distribución binomial se basan un una sucesión de ensayos de Bernaulli.

Un proceso binomial cumple las siguientes condiciones.

1. Cada ensayo tiene sólo dos resultados posibles, denominados por éxitos

“E” y fracasos “F”

0123

Page 18: ESTADISTICA INFERENCIAL

2. La probabilidad de éxito denotado por “p”, permanece constante de

ensayo a ensayo, por lo tanto la probabilidad de fracaso 1-p = q; también

es constante.

3. Los ensayos sucesivos son independientes, es decir el resultado de un

ensayo cualquiera es independiente de los resultados de los ensayos

anteriores, se aplica a variables discretas

La binomial es una distribución de gran aplicación. Esta distribución teórica,

aplicada a los problemas de probabilidades, ayudan al Ingeniero de control

de calidad a tomas la decisión de aceptar o rechazar un lote de transistores

fundado en el descubrimiento de (digamos) dos transistores defectuosos en

una muestra de 100 tomados al azar en el mencionado lote.

Supóngase que una operación que llamaremos prueba, puede producir

únicamente, uno de dos resultados posibles; a uno de estos resultados le

llamaremos éxitos, al otro fracaso.

El lanzamiento de una moneda, la siembre de una semilla, la investigación

de un circuito eléctrico en cuanto a su funcionamiento y la inoculación de un

paciente, son pruebas.

La moneda puede mostrar “cara” ò “sello”; la semilla puede germinar o

no; el circuito puede funcionar correctamente o ser defectuoso; y el

paciente puede recuperarse ò morir.

Sea p la probabilidad de éxito y q la probabilidad de fracaso de modo que

p + q = 1

Para la probabilidad binomial se extraen con remplazo para que no varíe,

todos los experimentos son con reemplazo para que p no varíe.

Una prueba binomial es un experimento que tiene dos posibles resultados

“éxito” y fracaso”

En una prueba Binomial

Page 19: ESTADISTICA INFERENCIAL

S =

Si se realizan n pruebas independientes Binomial

S = A1 x A2x ………… xAn

Si ocurre exactamente x éxitos en las n pruebas ocurrirá también n-x

fracasos

Como:

p = La probabilidad de éxitos

q = La probabilidad de fracasos

Se tiene para el caso

e, e, e ….. e f f …...f su probabilidad será

x éxitos n-x fracasos

p pp …. p q q …… q = px.qn-x

x veces n-x veces

Luego ocurren ( ) formas donde hay exactamente x éxitos.

Por lo tanto la probabilidad de exactamente

P (x=x) = ( ) pxqn-x x = 0, 1, ……n

P ( x=x) = C pxqn-x

FUNCION DE CUANTIA O DE PROBABILIDAD

f (x) = P (x=x) = n! . pxqn-x

x! (n-x)!

e, f

nx

nx

xn

Probabilidad de

una sucesión

cualquiera

Numero de

maneras de

obtener x

éxitos

Probabilidad de

obtener x éxitos

exactamente

Page 20: ESTADISTICA INFERENCIAL

Ejem:

La probabilidad de un estudiante que ingresa a la Universidad y logre

graduarse es 0.4 ¿Cuál es la probabilidad que de5 estudiantes nuevos. Se

gradúen 3.

n = 5 x = 3 graduados

p = 0.4 graduarse

q = 0.6 no graduarse

P (x =3) = 5! (0.4)3 (0.6)5-3 = 5! (0.4)3 (0.6)2

3! (5-3)! 3! 2!

P (x =3) = 10 (0.064) (0.36) = 0.2304

Se lanza un dado 10 veces ¿Calcular la probabilidad de obtener 4 veces

seis?

SOLUCION

La v.a. esta definida así

X = numero de veces que aparece el numero 6 en 10 lanzamientos

X = (0, 1, 2 ………………10)

Sea E = obtener un seis : P (E) = 1 = 0.1666 6

F = obtener un numero diferente de 6: P (F) = 5 6

Por lo tanto se tiene que:

n = 10 p = 1 q = 5 6 6

Luego la función de probabilidad de X es

Page 21: ESTADISTICA INFERENCIAL

P (x = x) 101 x 510-x x6 6

X = 0, 1, 2 ……….10

Estamos interesados en el calculo de p (x = 4)

P (x = 4) = 101456

4 6 6

P (x = 4) = 10!1456 = 0.048 4! (10-4)! 6 6

P (x = 4) = 210 (0.0008352) (0.2713604) = 0.0475944

FUNCION DE DISTRIBUCION O ACUMULATIVA

P ( x ≥ x) = ∑ ( nx )pxqn-x

Ejem: Un estudiante se presente a un examen de selección múltiple que

contiene 8 preguntas cada una con tres respuestas opcionales, si el

estudiante esta adivinando al responder cada pregunta y además se

sabe que para aprobar el examen debe responder correctamente 6 ò

mas preguntas ¿Cuál es la probabilidad de aprobar el examen?

Defina la variable aleatoria x tal que

x(w) = numero de respuestas concretas en las 8 preguntas

Rx = (0, 1, 2, 3, 4, 5, 6, 7, 8

Puesto que cada pregunta consta de una respuesta correcta y 2

respuestas no correctas

P(E) = 1 = p y P(F) = 2 = q ( por estar adivinando) 3 3

Luego la distribución de probabilidad de x es,

P(x) = P(x=x) = 8 1 x28-x x = 0, 1, ……8

n

x = 0

Page 22: ESTADISTICA INFERENCIAL

x 3 3

Sea A el evento “aprobar el examen” entonces

P(A) = P( x>= 6) = ∑ ( 8x )( 13 )( 23 )

= ( 86 )( 13 )( 23 ) + ( 87 )( 13 )( 23 ) + ( 13 ) = 432187

= 0.02 = 0.01966

Se ha elaborado un examen de selección múltiple consistente en 10

preguntas. Hay cuatro respuestas posibles para cada pregunta. Suponga

que ninguno de los estudiantes que van a rendir el examen concurrió a

clases o que no estudio para el examen (cosa muy frecuente) el profesor

que toma la prueba ha establecido que para aprobar debe contestar

correctamente al menos 6 preguntas. Si hubiere 100 alumnos en la clase

¿Cuántos alumnos teóricamente aprobarían?

SOLUCIÓN

1º Puesto que ninguno de los alumnos asistió a clase o no estudio para el

examen, la elección de la respuesta en cada una de las 10 preguntas se

hará al azar; por lo tanto la elección de la respuesta en cada pregunta se

considera como un ensayo de Bernaulli, con

P = Prob. deacertar la respuesta correcta 1 = 0.25 y q = 3 4 4

2º El experimento se repite 10 veces, es decir n = 10

3º Definimos la variable aleatoria X por

X (w) = numero de respuestas correctas en las 10 preguntas

Rx = 0, 1, 2, 3, ………, 10

4º La variable aleatoria X, así definida es un v.a.binomial

Por lo tanto su distribución

P (x = x) 101x310-x x = 0, 1, …….10

8

X=6

x 8-x

6 2 7 8

Page 23: ESTADISTICA INFERENCIAL

x 44

5º Para aprobar el examen debe contestar al menos 6 preguntas correctas,

es decir, la probabilidad de aprobar el examen es

P( x ≥ 6) =

P(x ≥ 6) = ( 14 )( 34 ) + ( )( 14 )( 34 ) + ( )( 14 )( 34 ) + ( ) ( 14 )( 34 ) 6

+ ( ) ( 14 )( 34 ) = 0.0197

Por lo tanto, aprobación teóricamente el examen 100 (0.0197) = 1.97 2, alumnos

u = E (X) = np media XVarianza = S2 = npqDesviación Estándar = √npq

DISTRIBUCION DE PROBABILIDADES DE UNA VARIABLE ALEATORIA

Si para cada valor de la variable X, considerado como un evento, procedemos

a calcular su respectiva probabilidad, obtenemos una función que se denomina

FUNCION DE DISTRIBUCION DE PROBABILIDADES DE LA VARIABLE

ALEATORIA X.

En la práctica, para abreviar, se omite las palabras: Función de

Es importante tener en cuenta que ∑ P (X ) = 1, esta fórmula dice en palabras:

La suma de las probabilidades de todos los eventos posibles es igual a 1.

En el ejemplo 1, del rubro 5.2.2. hemos visto que la variable aleatoria X que

designa el número de caras en cada posible resultado del experimento puede

tomar los valores: 0, 1, 2, 3.

Las probabilidades de los respectivos eventos son:

10 0

19283746

10 7

1010

10 9

10 8

10

X = 6

Page 24: ESTADISTICA INFERENCIAL

P {X = 0} = P {sss} ………… = 1/8 = 0.125

P {X = 1} = P {css, scs, ssc} = 3/8 = 0.375

P {X = 2} = P {ccs, csc, scc} = 3/8 = 0.375

P {X = 3} = P {ccc} ………… = 1/8 = 0.125

La distribución de probabilidades es la que se presenta en el cuadro

CUADRO

X O 1 2 3

P (X) 0.125 0.375 0.375 0.125

18

38

38

18

LA ESPERANZA MATEMATICA

Las dos características importantes de la distribución de una variable aleatoria,

son su tendencia central y su variabilidad. En esta parte introduciremos el

concepto de la esperanza, que es una medida de Tendencia Central de una

variable aleatoria.

La esperanza es designada de muchas (otras) formas; como esperanza

matemática, valor esperado, o simplemente la media de una variable aleatoria.

Este concepto se relaciona íntimamente con la noción familiar de la media

aritmética “La esperanza matemática de una variable aleatoria es la suma de

los productos que se obtiene multiplicando todos los posibles valores de la

variable aleatoria por su correspondiente probabilidad”.

Ejem:

La Probabilidad de que una casa de cierto tipo sea destruida por un incendio en

un periodo (cualquiera) de doce meses es de 0.005. Una Compañía de

Seguros ofrece en venta al dueño de esa casa una póliza de seguros contra

∑ P (X ) = 1

Page 25: ESTADISTICA INFERENCIAL

incendio por el término de un año en 20,000 Soles, con una prima de 150 soles

¿Cuál es la ganancia esperada de la Compañía?

La “ganancia” G, para la Compañía es una variable aleatoria con posibles

valores de 150 soles, si la casa no sufreun accidente de incendio y de 19,850

soles, si la casa se quema durante el año que cubre la póliza. La función de

probabilidad de G es entonces.

VALORES DE G, g 150 -19850

PROBABILIDAD f (g) 0.995 0.005

Con la información anterior vemos que:

E (G) = Ug = (150) (0.995) + (-19850) (0.005) = S/. 50

149.25 -99,25 = S/. 50.00

La ganancia esperada para una Compañía de Seguros debe ser positiva para

permitir a la Compañía pagar los costos administrativos y acumular reservas

para pagar a sus beneficiarios y tenedores de pólizas. Sin embargo en todos

los casos de juego de azar, en donde se juega por dinero, el valor esperado es

negativo, como se v en el ejemplo siguiente.

En general si X es una variable aleatoria discreta que toma los valores X1, X2,

Xn y tiene una función de densidad de probabilidad f(x) su esperanza

matemática se define como:

E (X) = ∑i=1

n

Xi P(Xi )

Si X es una variable aleatoria continua con una función de densidad de

probabilidad f(x), entonces.

E(X) = ∫−∞

X1P(X) dx

Page 26: ESTADISTICA INFERENCIAL

La varianza G2de una variable aleatoria X con función de probabilidad f(x) se

define como el valor esperando del cuadrado de la desviación de la media

aritmética u esto es:

Donde u = E(X)

Var (X) = ∑i=1

n

X2P(Xi) – u2

Var (X) = ∑i=1

n

(Xi−u )2P(Xi)

ESPERANZA MATEMATICA DE UNA VARIABLE ALEATORIA

Es la media ponderada de las posibles valores de la v.a..x para ponderar cada

valor de X se multiplica por su respetiva probabilidad.

La Esperanza Matemática se representa por el símbolo E(X) también se le

designa u E(X) = u

E(X) = ∑i=1

n

X i P(Xi)

En la distribución de Probabilidades

X O 1 2 3

P(X) 0.125 0.375 0.375 0.125

Calcular la E(X)

E (X) = 0. (0.125) + 1. (0.375) + 2 (0.375) + 3 (0.125)

E (X) = 0 + 0.375 + 0.750 + 0.375

Page 27: ESTADISTICA INFERENCIAL

E (X) = 1.5

VARIANZA DE UNA VARIABLE ALEATORIA 2 =Var (X) = (Xi – u)2 P (Xi)

La varianza de la v.a. X es la esperanza matemática del cuadrado de la

diferencia que se obtiene, restando a la variable por su valor esperando u.

Vemos que el cuadrado de cada diferencia se pondera multiplicándolo por cada

valor de P(x)

Ejem:

Calcular la Var (X) de la distribución de probabilidades del experimento de

lanzar 3 monedas, en donde la v.a. X designa el número de caras en cada

posible resultado.

X O 1 2 3

P(X) 18

38

38

18

E(X) = 1.5

Var (X) = (0-1.5)2 (18

) + (1-1.5)2 (38

) + (2 – 1.5)2 (38¿ + (3-1.5)2 (

18¿

Var (X) = (2.25) (18

) + (0.25) (38

) + (0.25) (38

) + (2.25) (18

)

= 0.28125 + 0.09375 + 0.09375 + 0.28125 = 0.75

Utilizando la formula

2= Var (X) = ∑i=1

n

X2P(Xi) – u2

Page 28: ESTADISTICA INFERENCIAL

Una lotería vende 10,000 boletos de 1 sol por boleto; se dará un premio de

5,000 soles al ganador de la primera jugada. Suponiendo que hemos comprado

un boleto ¿Cuánto debemos esperar ganar?

A que la variable aleatoria “ganancia” G, tiene dos posibles valores: 4,999 soles

y – 1 sol.

VALORES DE G 4999 -1

PROBABILIDAD f (g) 1 9999

10,000 10,000

E (G) = 4,999 (1

10,000) + (-1) (

999910,000

)

499910,000

- 999910,000

= 0.4999 – 0.9999 = -0.50

Esta cantidad 50 centavos negativos, es la cantidad que esperamos ganar

(perder) cada vez, si jugamos repetidas veces.

APLICACIÓN DEL CONCEPTO DE ESPERANZA MATEMATICA

a) Una lotería con 1,000 numero, consta de las siguientes premios

1 premio de S/. 100.000

2 premios de S/. 10,000

5 premios de S/. 1,000

A cuanto debe venderse el billete, para que no se gane ni se pierda?

Solución:

Los posibles valores de la variable son: (posibles premios)

Xi = 100,000 10,000 1,000

Y las probabilidades de ganar dichos premios son:

Pi = 11000

21,000

51,000

Xi

Pi

Page 29: ESTADISTICA INFERENCIAL

Luego en promedio, se espera ganar:

E(X) = 100,000 1

1,000 + 10,000

21,000

+ 1,000 5

1,000 = S/. 125

Si se venden los 1,000 numero a S/. 125 c/u, se recaudan S/. 125,000.

Pero se distribuyen S/. 125.000 en premios, luego:

No se gana ni se pierde

Por otra parte participan 1,000 personas que pagan c/u S/. 125 y

esperan ganar, en promedio

S/. 125,000 = S/. 125

1,000

También se ve que en promedio no gana ni pierden

TEOREMA QUE IMPLICA PARTICIONES

PROBABILIDAD TOTAL

Sea {A1, A2….An} particiones del espacio muestral S y sea A cualquier

evento

Entonces

P(A) = = ∑i=1

n

P (Ai) P(A/Ai)

Siempre que P (Ai) = 0 i = 1, 2, ……n

La demostración de este teorema se facilita con la figura en todo lo que sigue

i = 1, 2 …..n

Page 30: ESTADISTICA INFERENCIAL

A esta representada por la región sombreada dentro de S

S = A1 U A2U …. U An

A = A ∩ S

A = A ∩ (A1 U A2U ….U An)

A = (A A1) U ( A ∩ A2) U………..U (A ∩ An)

P (A) = P (A ∩ A1) + P (A ∩ A2) + ……….+ P (A ∩ An)

P (A) = P (A1) P (A/ A1) + P (A2) P (A/ A2) + ……. + P (An) P (A/An)

P (A) =

Ejm. PROBABILIDAD TOTAL

En un laboratorio hay tres jaulas. En la jaula I hay 2 conejos pardos y tres

blancos, en la jaula II tiene 4 conejos pardos y 2 blancos, en la jaula tres

contiene 5 conejos pardos y 5 blancos.

Se selecciona al azar una jaula y se saca un conejo aleatoriamente de esta

jaula.

¿Cuál es la probabilidad que el conejo escogido sea blanco?

Sea el evento B: salga un conejo blanco.

(Ai) P (A/Ai)

P(II) = 13

P(I) = 13

III P(B/III) = 510

B -----

B -----

II P(B/II) = 26

B -----

B ----

I P(B/I) = 35

B -----

B -----

III

5 P5 B

II

4 P2 B

I

2 P3 B

Page 31: ESTADISTICA INFERENCIAL

P(B) = P(I) P(B/I) + P (II) P(B/II) + P (III) P (B/III)

=13 .

35 + 13 .

26 + 13 .

510 = 315+ 218 + 530 =

= 15 + 1

9 + 1

6 = 43

90= 0.477777 = 0.478

PROBABILIDAD DE LAS CAUSAS – TEOREMA DE BAYES

Teorema Bayes, se refiere a la asociación de dos acontecimientos, cuando

ellos están ligadas de tal manera, que la realización de un acontecimiento,

supone también, la realización de algunas de las posibilidades del segundo.

Consideremos un acontecimiento A, y supongamos, por hipótesis, que para

que se produzca A, es indispensable, que se haya producido también, un y solo

uno de los acontecimientos excluyentes digamos:

B1, B2, …Bn

El Teorema de Bayes, trata de responder la siguiente pregunta:

Suponiendo que se ha realizado el evento A ¿Qué probabilidad existe que haya

sido conjuntamente con un determinado B por ejemplo con Bi?

A continuación demostremos la formula que responde a la pregunta del

Teorema de Bayes

Este Teorema fue propuesto por el clérigo Ingles Thomas Bayes (1761)

DEMOSTRACION TEOREMA

P(III) = 13

Page 32: ESTADISTICA INFERENCIAL

Si conozco P(A) y P(Ai/A) P(A ∩ Ai)

Por el Teorema de la multiplicación

P(A ∩ Ai) = P(A) P(Ai/A)

P(A) ≠ 0

P (A ∩ Ai) = P (A) P(Ai/A)

P(A) P (A)

P (Ai/A) = P ( A ∩ Ai)

P(A)

Sustituyendo:

P(A) = P(A1) P(A/A1) + P (A2) P(A/A2) + - - - + P(An) P(A/An)

Resulta:

P (Ai/A) = P (A ∩ Ai)

P(A1) P(A/A1) + P(A2) P(A/A2) + - - - + P(An) P(A/An)

Remplazando P( A ∩ Ai) por su equivalente P(Ai) P(A/Ai), resulta finalmente

P(Ai/A) = P (Ai) P (A/Ai)

P(A1) P(A/A1) + P(A2) P(A/A2) + - - - + P(An) P(A/An)

En una fábrica de pernos las maquinas A, B y C fabrican 25, 35, 40 por ciento

de la producción total representativamente. De lo que producen 5, 4 y 2 por

Page 33: ESTADISTICA INFERENCIAL

ciento respectivamente son pernos defectuosas. Se escoge un perno al azar

y se encuentra que es defectuoso ¿Cuál es la probabilidad que el perno

provenga de la maquina A, B, C

SOLUCION

Este problema, es una aplicación del teorema de Bayes

P(D) = P (D ∩ A) + P (D ∩ B) + P ( D ∩ C)

P(D) = P (A) P (D/A) + P (B) P (D/B) + P (C) P (D/C)

P(D) = (0.25) (0.05) + (0.35) (0.04) + (0.40) (0.02)

P(D) = 0.0125 + 0.0140 + 0.0080 = 0.0345

a) P (A/D) = P(D ∩ A) = P (A) P (D/A)P(D) P(D)

P (A/D) = (0.25) (0.05) (0.25) (0.05) + (0.35) (0.04) + (0.40) (0.02)

P (A/D) = 0.0125 = 0.362

………………D ∩ C

………………D ∩ B

………………D ∩ A

D

DD

DD

D

P(D/C) = 0.02

C

P(D/B) = 0.04

B

A

P(D/A) = 0.05

P(C) = 0.40

P(B) = 0.35

P(A) = 0.25

Page 34: ESTADISTICA INFERENCIAL

0.0345

b) P (B/D) = P (B) P (D/B) = (0.35) (0.04) =P(D) 0.0345

P (B/D) = 0.0140= 0.406 0.0345

c) P (C/D) = P (C) P (D/C) = (0.40) (0.02) = 0.008 = 0.232 P (D) 0.0345 0.0345

PERMUTACIONES FACTORIAL DE UN NÚMERO

Sea n un entero positivo, definimos el factorial de n, denotado por n!

Como el producto de todos los enteros consecutivos desde 1 hasta n

inclusive, es decir.

n! = n (n-1) (n-2) ------- 3 x 2 x 1

Así por ejemplo:

5! = 5 x 4 x 3 x 2 x 1 = 120

10! = 10 x 9 x 8 x 7 x 6 x 5 x 4 x 3 x 2 x 1 = 3`628,800

Observe que n! = n (n-1)!

De esto si n =1, tenemos 1! = 1 (0!) y definimos convencionalmente

que 0! = 1

Definición.- Una permutación es un arreglo de todos ò parte de un

conjunto de objetos

Suponga que tenemos un conjunto de tres objetos

Page 35: ESTADISTICA INFERENCIAL

A = (a, b, c), estamos interesados en el numero de arreglos con los

elementos del conjunto A las posibles permutaciones son: abc, acb,

bac, bca, cab, cba, hay 6 permutaciones distintas.

Se puede llegar a la misma respuesta sin tener que escribir todas las

anotaciones posibles, de la siguiente manera, los arreglos de los 3

objetos es equivalente a disponerlas en celdas, así:

3 2 1

Hay 3 formas posibles de llenar la primera celda, con cualquiera de

los tres objetos a, b y c, para la segunda celda hay 2 formas posibles,

cualquiera de los dos objetos restantes después de haber llenado la

primera y solamente queda una forma de llenar la tercera. Aplicando

el principio de multiplicación da un total de 3 x 2x 1 = 6 formas (o

permutaciones).

Teorema.- El número de permutaciones de n objetos diferentes es:

P = n!

Ejm: Un inspector visita 6 maquinas diferentes, durante el día. A fin

de impedir que los operadores sepan cuando inspeccionará, varía el

orden de las visitas ¿De cuantas maneras puede hacerlo?

Solución:

Puesto que tiene que inspeccionar las 6 maquinas diferentes,

entonces el número de manera es una permutas de las 6 maquinas.

Es decir:

P = 6! = 6 x 5 x 4 x 3 x 2 x 1 = 720 formas.

Ejm:

nn

6 6

Page 36: ESTADISTICA INFERENCIAL

En una competencia automovilística intervienen 40 participantes. De

cuantas formas distintas se pueden adjudicar los lugares de llegada a

los 40 competidores de la competencia

Solución:

Se desea saber de cuantas formas posibles se pueden ordenar los 40

competidores. El numero de todos los ordenados posibles es:

40P40 = 40!

Supongamos que tenemos un conjunto de n objetos diferentes y

deseamos permutar r de estos n objetos

Teorema.- El numero de permutaciones de n objetos diferentes

tomadas r a r

P(n,r)= P =

NOTA: Hemos visto que una permutación es un arreglo de todas

parte de los elementos de un conjunto que tiene objetos diferentes

Así si A = (a, b, c) se vio que las diferentes permutaciones son:

abc, acb, bac, bca, cab, cba

es decir el orden de los elementos es importante observe que

estaselementos son comparables con las termas ordenados sin

repetición de sus elementos o sea no están las termas (a,a,a) (b,b,b)

(c,c,c)

Ejem: Un grupo esta formado por5 personas y desean formar una

comisión integradapor Presidente, Secretario ¿De cuantas maneras

puede nombrarse esta comisión?

El numero de permutaciones de 5 personas tomadas 2 a 2.

P = = = 5 x 4 = 20 maneras.

El cargo de Presidente puede ser ocupadas de5 maneras diferentes. Y

una vez ocupado el cargo de Presidente, el cargo de Secretario puede

rn

n!(n-r)!

5x4x3x2x1 3x2x1x

5!(5-2)!

25

Page 37: ESTADISTICA INFERENCIAL

ser ocupadode4 maneras diferentes; entonces la elección de la

comisión se puede hacer de 5x4 = 20 forma diferentes

5 4

El lector puede dar nombre a las personas, digamos A, B, C, D, E;

entonces, se busca todos los pares ordenados que se puedan formar

con dichas letras, sin repetición.

(A,B) (A,C) (A,D) (A,E)

(B,A) (B,C) (B,D) (B,E)

(C,A) (C,B) (C,D) (C,E)

(D,A) (D,B) (D,C) (D,E)

(E,A) (E,B) (E,C) (E,D)

Donde cada letra de la primera componente, indica la persona que

ocupa el cargo de Presidente, la segunda indica la persona que ocupa

el cargo de Secretario. Así (C,B) indica que C resulto elegido

Presidente y B Secretario y es sin repetición, ya que el par (A,A) no

esta en la permutación, pues si estuviera significaría que la persona A

ocupa el cargo de Presidente y Secretario, lo cual no puede ser.

Permutaciones Circulares

La permutaciones que ocurren por arregles de objetos formadas (o

alrededor de un circulo) un circulo se llama permutaciones circulares.

En estas agrupaciones no hay primero ni último elemento, por

hallarse todas en una línea cerrada para determinar el número de

permutaciones circulares que puedan formarse con los n objetos

distintos de un conjunto.

Basta considerar fija la posición de unocualquiera de ellas, las n-1

restantes podrán cambiar de lugar de (n-1)! Formas diferentes

tomando todas las posiciones sobre la circunferencia relativa al

primer punto.

Page 38: ESTADISTICA INFERENCIAL

Si cambiamos (ahora) la posición de este, las delos demás respecto

de el, será seguro un de las ya consideradas. Por lo tanto el número

de permutaciones circulares será.

(n – 1)!

La permutación circular se denota por Pcn

Teorema.- El número de permutaciones de n objetos distintos

alrededor de un círculo es Pcn= (n – 1)!

Ejem.: ¿De cuantas formas diferentes pudieron sentarse en la ultima

cena, alrededor dela mesa Jesucristo y los 12 Apóstoles?

Solución:

a) Si la mesa fuera circular, tendremos la permutación circular. El

numero de forma es:

Pc13 = (13 – 1)! =12! = 479’, 001, 600

b) Si la mesa no es circular, se tendrá una permutación de las 13

personas. El numero de formas es:

13P13 = 13! 6,227’020,800

PERMUTACIONES CON REPETICION

Hasta ahora hemos permutado objetos diferentes, (sin embargo) no

siempre es el caso.

Teorema

El numero de permutaciones (distintas) de n objetos de las cuales n1

son una clase, n2 de una segunda clase………. nk de una k-esimoclase

todos los demás objetos de clase 1), anotado por

P =

Ejem:

Un estante de una librería tiene capacidad para 10 libros de

Matemáticas que tienen pasta verde, 8 de Física de pasta roja y 7 de

Química de pasta azul ¿Cuántas maneras pueden colocarse los libros

según los colores?

n1, n2…..nkn

n!n! n2! ……nk!

Page 39: ESTADISTICA INFERENCIAL

Solución

Como solo interés los colores entonces n1 = 10, n2 = 8, n3 = 7

Luego el número de permutaciones es

( 2510 ,8 ,7 ) =

25!10! 8!7 !

= 21,034.600

COMBINACIONES

En muchas cosas estaremos interesados en el número de formas de

seleccionar r objetos de n, sin importar el orden

Estas selecciones se llamas combinaciones

DEFINICION.- Un sub conjunto de r elementos, de un conjunto que

tiene n elementos diferentes se llaman combinaciones de n

elementos tomados r a r

El numero de combinaciones de r elementos, que se pueden forma,

con los n objetos diferentes de un conjunto, se denota por

C

Este número en matemática tiene un símbolo especial

C = ( ) = n!

r ! (n−r )!

Ejem:

Se extrae dos cartas de una baraja de 52 ¿De cuantas maneras se

puede hacer esto?

Solución

Se necesitan solo sub conjuntos dedos cartas, sin importar el orden

rn

nrf

rn

Page 40: ESTADISTICA INFERENCIAL

Entonces el número de forma de seleccionar estas dos cartas es:

C(52,2) = 52 !2!50 !

= 52 !2!50 !

= 52! x 51!2!50 !

= 26 x 51 = 1326

DISTRIBUCION HIPERGOMETRICA

Supongamos una muestra den unidades obtenida de un lote de N

unidades, en el cual a unidades son defectuosas. Esta muestra se ha

obtenido del lote extrayendo sucesivamente las unidades de tal

forma que, después de cada extradición, cualquiera delas unidades

que permanecen en el lote tiene la misma posibilidad de quedas

incluidas en la muestra.

Para la distribución binomial será valida únicamente si después de

cada extracción se repone la unidad en el lote, por lo que tendremos

que buscar una nueva distribución de probabilidad, llamada

distribución hipergeometrica.

Para resolver (este) problemas de “muestreo sin templazamiento”,

que nos dice que un subconjunto de x objetos se pueden seleccionar

de (nx)= n !

x !(n−x )!

Modos diferentes, partiendo de un conjunto de n objetos.

En el problema de encontrar la probabilidad de obtener x unidades

defectuosas en una muestra de n, tomadas sin remplazamiento,

notemos, en primer lugar, que el espacio muestral de este

experimento tiene casos posibles, que son las formas en que un Nn

Page 41: ESTADISTICA INFERENCIAL

subconjunto de n objetos. Además las x partes defectuosas se

pueden seleccionar delas a partes defectuosas de maneras.

las n – x unidades no defectuosas de la muestra

Como ejemplo de distribución hipergeomètrica, calcularemos la

probabilidad de obtener dos unidades defectuosas en una muestra de

tamaño diez, tomada sin remplazamiento de un lote de 20 unidades

que contiene 5 defectuosas, sustituyendo x =2, n =10, a = 5 y N

=20, obtenemos:

h (2; 10, 5, 20) = = = 0.348

para simplificar el calculo de probabilidades de este tipo, se pueden

usar tablas de coeficientes binomiales o tablas de los logaritmos de

los factoriales, que se pueden encontrar en cualquier manual de

tablas matemáticos.

Nótese que, si hubiésemos cometido el error de usar una distribución

binomial con n = 10 y p = 5/20 = 0.25 para calcular la probabilidad

de encontrar dos unidades defectuosas, el resultado habría sido

0.282, considerablemente menor que la probabilidad encontrada.

Se pueden seleccionar, a su vez, de las N – a unidades no

defectuosas del lote, de maneras, el total de la muestra se

podrá seleccionar de maneras. Suponiendo que cada

una de las muestras tiene lamisma probabilidad de ser

ax

5 15

2 8( ) ( )

( )20

10

64350

184.765

N - an - x )(N - an - x

ax ( )

N n

Page 42: ESTADISTICA INFERENCIAL

seleccionada, la probabilidad de obtener x casos “favorables” en n

tentativas sin remplazamiento es

h(x;n,a,N) =

(Según teorema). La distribución de probabilidad definida por esta

ecuación recibe el nombre de distribución hipergeometica; los

parámetros de esta familia de distribuciones son el tamaño de la

muestra n, el tamaño del lote (o tamaño de la población), N y el

numero a de casos “favorables” en el lote, que en nuestro ejemplo

especial es el numero total de unidades defectuosas del lote (o

población)

DISTRIBUCION DE POISSON

La distribución de Poisson es otra distribución teórica de

probabilidades discreta y que tiene muchos usos en la economía y el

comercio, en el control de calidad industrial, en las líneas de espera o

teoría de colas, llamadas telefónicas. El nombre de esta distribución

es en honor el matemático francés Simeón Poisson, quien la describió

en 1837 como un límite de la distribución binomial cuando hay un

gran numero de pruebas y la probabilidad de éxito es muy pequeña

en cada una de las pruebas.

Supuestos de la Distribución de Poisson.-

1. Existe un gran numero de pruebas posibles para la verificación

de un suceso dado dentro de cada unidad de medida, y de la

probabilidad de una ocurrencia en cualquiera de esas pruebas

N - an - x

ax ( )

N n( )

para x = 0, 1, ……., n

Page 43: ESTADISTICA INFERENCIAL

es muy pequeña, además, la variable aleatoria debe ser un

numero entero dentro de la unidad de medida.

2. Independencia, cualquier numero de ocurrencia puede

acontecer en una sola unidad de medida, y esto no afecta al

numero de ocurrencias en cualquier otra unidad de medida.

3. Estabilidad, el valor de (promedio) ג debe permanecer

constante

DISTRIBUCION DE POISSON

Función de Cuantía o de Probabilidad

F(x) = P [ x=x ] = x: 0, 1, 2, 3 …….

np = ג

Función de Distribución o Acumulativa

F(x) = P [ x≤ x ] = ∑❑

Por una propiedad de la función de Distribución, tenemos:

f (0) = F (0)

F (x) = F (x – 1) + f (x)

Entonces, la probabilidad de un punto será

f (x) =F (x) – F (x – 1)

Ejemplo:

Sea 2 = ג

Calcular P [ x=1 ]

P [ x=1 ] = P [ x≤1 ] – P [ x≤0 ]

e - ג ג x x!

x

x = 0 e - ג ג x

x!

Tabla

ג x

0 1 2 3

2.0 0.135 0.406 0.677 0.857

Page 44: ESTADISTICA INFERENCIAL

Donde:

P [ x≤1 ] = 0.406

P [ x≤0 ]= 0.135

Luego:

P [ x=1 ] = 0.406 – 0.135

= 0.271

n = 1 000

p = 0,002 x = 3 p(x=x) = e - ג ג x x!

= np = 1 000 (0.002) = 2

e-2 = 0.13534

e -2 (2) 3 = 0.13534 (8) = 1.08276 = 0.18045 ** 3! 6 6

TABLA

P (x=3) = P(x=3) – P (x=2)

P(x=3) = 0.857

P(x=2) = 0.677

P(x=3) = 0.857 – 0.677 = 0.18

PROBLEMA: Un deposito esta compuesto de 1000 elementos que

trabajan independiente uno del otro. La probabilidad de fallo de

cualquier elemento durante eltiempo t es igual a 0.002. Hallar la

probabilidad de que durante eltiempo tfallen exactamente 3

elementos.

Page 45: ESTADISTICA INFERENCIAL

PROBLEMA: La razón de mortalidad para cierta enfermedad es de 7

por 1000 ¡Cual es la probabilidad de que exactamente 5 decesos por

esta enfermedad de un grupo de 400?

P (X=5) = C -2.8 (2.8) 5 n = 400 P = 7 = 0.007 5! 1000

C-2.8 400 (0,007) = 2.8

np = ג

Multiplicando

e-2 = 0.135034 0.060808262

e0.8 = 0.449 3

(2.8)5 = 172.10368 = 0.060808262 = 10.46532566

120

= 0.087127 = 0.0872

p(x2 x) = e - ג x

x!

en la tabla f(x) = F(x) – F (x-1)

= 0.935 – 0.848 = 0.087

LA PRUEBA DE LA CHI –CUADRADA O JI – CUADRADA

Esta prueba es utilizada para el análisis de la relación entre dos

variables categóricas, es decir, para aquellas cuyos criterios de

agrupación son eminentemente cualitativos, y se representa por el

símbolo X2.

Esta prueba se calcula mediante la utilización de una tabla de

contingencia o tabulación cruzada, la cual se caracteriza porque

Chequear

Page 46: ESTADISTICA INFERENCIAL

consta de dos dimensiones; cada una correspondiente a una variable,

las cuales, a su vez pueden tener dos o más categorías o valores.

Las categorías corresponden a las frecuencias observadas de cada

variable. De la cantidad de categorías de cada variable pueden

resultar matrices de diferente dimensión: 2x2, 3x2, 2x3, etc.

La prueba consiste en la comparación de la tabla de frecuencias

realmente observadas con la tabla de frecuencias esperadas, si n

hubiese ninguna relación entre las variables. Se parte de la hipótesis

de la ausencia de relación, de manera que, si ésta verdaderamente

existe, la diferencia entre ambas tablas debe ser significativa.

Ejemplo tabla de contingencia 2x2:

Análisis del hábito de fumar, por sexo, en una población “X”

Variables: Sexo y Hábito

Objetivo: Determinar la relación entre el sexo y el hábito de fumar.

TABLA DE FRECUENCIAS REALMENTE OBSERVADAS

SEXO/HABITO FUMA NO FUMA TOTAL

Masculino 1 520 8 744 10 264

Femenino 723 9 584 10 307

TOTAL 2 243 28 328 20 571

Los valores de cada celda de la tabla de frecuencias esperadas se

calcula mediante la siguiente formula, tomando los datos de la tabla

de frecuencias observadas:

fe = (Total frecuencias de la fila) * (Total frecuencias de la columna)

Total Genera de frecuencias

Aplicando la fórmula para cada celda resultaría:

Fe11 =2243*10264 = 1119,2

20571

Page 47: ESTADISTICA INFERENCIAL

Fe12 = 18328*10264 = 9144,8

20571

Fe21 = 2243*10307 = 1123,8

20571

Fe22 = 18328*10307 = 9183,2

20571

De aquí resulta la tabla de frecuencias esperadas:

TABLA DE FRECUENCIAS ESPERADAS.

SEXO/HABITO FUMA NO FUMA TOTAL

M 1119,2 9144,8 20,264

F 1123,8 9183,2 10,307

TOTAL 2243,0 18328,0 20,571

Por ultimo, la Chi – Cuadrada(X2) se calcula mediante la siguiente

formula:

X2∑ ( fo−fe )2fe

En la que:

fo = frecuencia observada en cada celda

fe = frecuencia esperada en cada celda

Es decir, para cada celda se calcula la diferencia entre las frecuencias

observadas y esperadas, se eleva al cuadrado y se divide entre las

frecuencias esperadas. La suma de todas las celdas es la C2.

Para el cálculo podemos apoyarnos en una tabla tal como se presenta

a continuación.

CELDA fo fe fo fe (fo fe)2

1520 1119,2 400,8 160676,1 143,6

Page 48: ESTADISTICA INFERENCIAL

8744 9144,8 -400,8 160676,1 17,6

723 1123,8 -400,8 160676,1 143,0

9584 9183,2 400,8 160676,1 17,5

TOTAL 921,6

Tal como se puede apreciaren la tabla, el valor de X2 es de321,6

Para interpretar el resultado obtenido debemos utilizar el concepto de

”grados de libertad” (G), el cual se calcula mediante la siguiente

formula:

G = (r-1) (c-1)

En la que:

R = numero de filas

C = numero de columnas

Por lo que:

G= (2-1) (2-1) = 1

Luego de realizados los cálculos, debemos comparar en la tabla de

distribución de la X2, eligiendo el nivel de confianza 0.05 ò 0.01, el

valor correspondiente a los grados de libertad obtenidos. Si el valor

calculado es igual o mayor al de la tabla, esto quiere decir que las

variables están relacionadas.

En nuestro caso, el valor correspondiente a un nivel de confianza de

0,05 para 1 grado de libertad es de 3.841, como el valor calculado es

de 321,6, esto quiere decir que las variables tienen una relación

significativa.

REGRESION LINEAL SIMPLE

Page 49: ESTADISTICA INFERENCIAL

REGRESION LINEAL SIMPLE

Al comenzar a estudiarlas técnicas de correlación afirmamos que

estudiaríamos dos variables y no solamente una. Llamamos en esa

ocasión X auna de las variables y Y a la otra. En el tema que nos

ocuparemos ahora, estudiaremos la forma de predecir valores de Y

conociendo primero los valores de X. Es así que viendo la tabla similar

a la que utilizamos cuando estudiamos correlación, conociendo

elpuntaje en la prueba de habilidad mental (Variable X) para un

alumno determinado, podemos anticipar elpuntaje del examen

deadmisión (Variable Y) delmismo alumno.

Consideremos la relación lineal expresada por el Cuadro. Si dibujamos

esa relación, obtenemos el grafico. Como podemos observar todos los

puntos se alinean “exactamente” en una sola línea recta, la que

recibe el nombre de línea de regresión. Teniendo en cuenta esta

línea, podemos predecir cualquiera delos valores de Y conociendo el

valor de X. para X = 25, según la recta, correspondiente Y = 35, para

X 0 20 corresponde Y = 30, Etc. En este caso se trata de una

correlación positiva perfecta cuyo coeficiente de correlación es +1

Prueba de

Habilidad Mental

X

Examen de

Admisión

Y

Susana 5 15

Iván 10 20

Lourdes 15 25

Aldo 20 30

Juan 25 35

María 30 40

Cesar 35 45

Olga 40 50

Page 50: ESTADISTICA INFERENCIAL

Recordemos ahora el Grafico que dibujamos cuando estudiamos

correlación, en este grafico observamos el diagrama de dispersión

“aproximado” por una línea recta, la recta que mejor se “ajuste” a los

puntos del diagrama de dispersión, es decir, en la mejor medida

procure dejar igual numero de puntos del diagrama de dispersión por

encima de ella que igual numero de puntos debajo, se llama línea de

regresión.

ECUACION DE LA REGRESION RECTILINEA

La ecuación que describe la línea de regresión es:

Yr = Y + r

En donde:

Y = media de la variable Y en la muestra.

_X = media de la variable X en la muestra

X = un valor de la variable X

X5 10 15 20 25 30 35 40

50 - 45 - 40 -35 - 30 - 25 -20 - 15 - 10 - 5 -

Sy X – r SyX – r SyX 4.2.1

SxSx Sx

Page 51: ESTADISTICA INFERENCIAL

r = coeficiente de Pearson, de la correlación lineal entre las variables

X y Y

Sy = desviación estándar de Y en la muestra

Sx = desviación estándar de X en la muestra

Yr = valor Y resultante del calculo de la formula.

Veamos cómo podemos predecir los valores de Y a partir de los

valores de X. Estudiamos el Cuadro Nº 4.2.1. Como el gráfico de este

cuadro es una línea recta ascendente sabemos que su coeficiente de

correlación de Pearson r = +1. Además tenemos los siguientes

resultados:

_ _X = 22.5, Sx = 11.46, Y = 32.5 Sy = 11.46

Estos resultados se pueden calcular a partir de los datos del cuadro

Nº 4.2.1. Apliquemos estos datos a la formula Nº 4.2.1., obtenemos la

siguiente expresión:

YR = 32.5 + (1)

Simplificando términos obtenemos:

YR = 32.5 + x – 22.5

YR = 10 + x (b)

escojamos cualquier valor de X del Cuadro Nº 4.2.1., por ejemplo por

María X = 30, reemplazamos este valor en (b)

YR = 10 + 30 = 40 (c)

Vemos en el Cuadro Nº 4.2.1. El valor que corresponde a María

efectivamente es 40. Es decir, podemos usar la ecuación Nº 4.2.1

para predecir los valores de Y conociendo los valores de X.

11.46 X – (1) 11.46 22.5 (a)

11.46 11.46

Page 52: ESTADISTICA INFERENCIAL

Esta formula de regresion se puede aplicar para dos variables X y Y,

entre las cuales no es obligatorio que exista una correlación lineal

perfecta, es decir, no es obligatorio que el r para la correlación entre

X y Y se a siempre igual a 1. Este valor de r para otras aplicaciones de

la regresión, puede tomar cualquier valor distinto de 1.

Ejercicios Resueltos de Regresión Lineal Simple

Al aplicar un test de inteligencia a una muestra representativa

constituida por 800 alumnos, se obtuvo la puntuación media de 30.4

puntos, con la desviación estándar de 12.6 puntos.

La edad media de la muestra fue de 14.5 años, con la desviación

estándar de 3.2 años.

El coeficiente de correlación lineal de Pearson entre la variable Y,

edad delos sujetos estudiados y la variable X, rendimiento mental de

los mismos sujetos, fue de r = 0.89.

Con estos datos se pide determinar la ecuación de regresión

rectilínea de la edad en base del puntaje del rendimiento mental.

¿Qué edad corresponde a los sujetos que alcanzan puntuaciones de:

X1 = 18 puntos X4 = 50 puntos

X2 = 25 puntos X5 = 60 puntos

X3 = 45 puntos X6 = 80 puntos?

Datos:

_Y = 14.5 SY = 3.2 r = 0.89_X = 30.4 SX = 12.6

Aplicando estos datos en la formula Nº 4.2.1 se tiene:

Page 53: ESTADISTICA INFERENCIAL

YR = 14.5 + 0.89

YR = 14.5 + 0.226X – 6.87

YR = 7.63 + 0.226X. Es la ecuación de regresión buscada

Respuesta de la 1ra pregunta

X1 = 18

YR = 7.63 + 0.226(18) = 7.63 + 4.07

YR = 11.7 años

Segunda pregunta

X2 = 25

YR = 7.63 + 0.226(25) = 7.63 + 5.65

YR = 13.28 años

Tercera pregunta

X3 = 45

YR = 7.63 + 0.226(45) = 7.63 + 10.17

YR = 17.8 años

Cuarta pregunta

X4 = 50

YR = 7.63 + 0.226(50) = 7.63 + 11.3

YR = 18.93 años

Quinta pregunta

X5 = 60

YR = 7.63 + 0.226(60) = 7.63 + 13.56

YR = 21.19 años

Sexta pregunta

3.2 X – 0.89 3.2 30.4

12.6 12.6

Page 54: ESTADISTICA INFERENCIAL

X6 = 80

YR = 7.63 + 0.226(80) = 7.63 + 18.08

YR = 25.71 años

Pruebas Estadísticas

I Chi Cuadrado X2

II T de studet

III r de Pearson

Chi Cuadrado

Def.

Que podemos probar con el X2

a) Independiente

b) Bondad de ajuste

c) Estimar a partir de S

= universo

S = muestra

Las hipótesis se pueden probar por Chi – Cuadrado T de studet y r de

Pearson.

a) Independencia:

Def. Si tenemos 2 variables sexo femenino y masculina si existe

independencia de una variable a otra Independencia n es rechazar

la hipótesis de unidad.

En que consiste la independencia.

2

S

Page 55: ESTADISTICA INFERENCIAL

= ∑ (Fo−Fe )Fe

Fo = Frecuencia observada

Fe = Frecuencia esperada

Ejemplo:

Se administra un sociograma a estudiantes de diversas edades. El

examinador encuentra que los estudiantes mas frecuentemente

elegido, como es el que elegiría como amigo son de más edad

Si se dividen los estudiantes por la medida de la edad obtendremos

los siguientes resultados.

ESTUDIANTES ELEGIDOS TOTAL

MENOR EDAD MAYOR EDAD

9 20 29

¿Se puede decir para un nivel de significación del 5% que los

estudiantes de más edad elegidos constituyen una mayoría?

ESTUDIANTES ELEGIDOS TOTAL _ R MENOR EDAD MAYOR EDAD K X = 14.5

9 (14.50) 20 (14.50)

Hay que ver filas y columnas

Fila = h Fo Fe (Fo – Fe)2

Fe h = 1 9 14.50 k = 2

20 14.50

COLUMNAS

K

Page 56: ESTADISTICA INFERENCIAL

1) Ho = Hipótesis de nulidad

La elección es independiente dela edad cada uno ha elegido

sin tener en cuenta la edad.

2) H1 = Hipótesis Alternativa

Las de mas edad hay son una mayoría.

Las de mas edad son mayoría han elegido las de mayor edad

3) Nivel de significación ( ) = 0.05

4) La Prueba 2 = ∑ (Fo−Fe )F 2

FoFe (Fo – Fe)2

Fe

9 14.50 (9 = 14.50)2= 2.09 14.50

20 14.50 (20 = 14.50)2= 2.09 14.50

X2 = 4.18

5) Toma de Decisión

Para la toma de decisión hay que tener en cuenta la tabla del X2.

V X2 0.995 X2 0.95

3.84 m = parámetro - X y DE

V = Grado de Libertad hay un parámetro solo la X

h x k – m

V = 1 X 2 = 1 = 1 Grado de libertad = 1 el X2 0.95 = 3.84

2

Page 57: ESTADISTICA INFERENCIAL

Para toma de decisión hay que tomar el valor crítico

3.84 = es el valor critico

Toma de decisión

Como X2 0.95 es igual a 3.84 y X2 = 4.18

Entonces 3.84 < 4.18

Esta en la zona de rechazo

No es independiente

rechazamos X

Ejemplo:

Como resultado de una elección se han obtenido los siguientes datos:

IDEOLOGÍ

A

CLASES SOCIALES

C. PopularC.

MediaC. Alta

IZQUIERDA 126 61 38

CENTRO 71 93 69

DERECHA 19 14 27

Rechazo Aceptación Rechazo

4.18 3.84-3.84

h

k

Page 58: ESTADISTICA INFERENCIAL

¿Puede decirse que existe asociación entre ideología y clase sociales

a un nivel de significación de 1%

h = 3 V = (h=1) (k=1) – m

k = 3

Elaboramos otro cuadro

Resultados de nuestras observaciones

Resultados experimentales

CLASES SOCIALESTOTAL

C. POPULAR C. MEDIA C. ALTA

IZQUIERDA126

(93.82)

61

(72.97)

38

(58.20)

225

CENTRO71

(97.16)

93

(75.57)

69

(60.27)

233

DERECHA19

(25.02)

14

(19.46)

27

(15.52)

60

TOTAL 216 168 134 518

C. POPULAR C. MEDIA

216 x 225 = 93.82 168 x 225 = 72.97 518 518

216 x 233 = 97.16 168 x 233 = 75.57 518 518

216 x 60 = 25.02 168 x 60 = 19.46 518 518

CLASE ALTA

134 x 225= 58.20 134 x 60 = 15.52 518 518

Page 59: ESTADISTICA INFERENCIAL

134 x 233 = 60.27 518

Las frecuencias esperadas ( ) las que están en el paréntesis

1) Ho = Las ideologías son independientes de las clases sociales

2) H1 = Las ideologías están íntimamente vinculadas a las clases

sociales

3) Nivel de significación 0.01, 99% de certeza

4) La prueba2 = ∑ (Fo−Fe )Fe

5) Toma de decisión ( si son independiente o no son independientes)

PRUEBA

Fo Fe(Fo – Fe)2

Fe1267119619314386927

93.8297.1625.0272.9775.5719.4658.2060.2715.52

11.047.041.451.964.121.537.011.268.49

2 = 43.80

Toma de decisión

Como V = (h-1) (k-1) – m (2) (2) – 0 = 4

no hemos empleado un parámetro (X o –DE)

1) Grado de libertad = 4

2) 2 = 43.80 y 2 0.99 = 13.30 (se busca en la tabla)

2

2 = 43.80

Zona de Rechazo

2 = 13.30

Page 60: ESTADISTICA INFERENCIAL