ESTADISTICA INFERENCIAL
-
Upload
leonard-alexis-reyes-ramos -
Category
Documents
-
view
416 -
download
8
Transcript of ESTADISTICA INFERENCIAL
INTRODUCCION A LA PROBABILIDAD
Paralelamente al desarrollo de la Estadística, como disciplina
científica en forma independiente, se desarrollo a partir del XVII al
Cálculo de probabilidades.
Sus indicadores son los matemáticos Italianos y Franceses de ese
siglo, particularmente FERMAT y PASCAL, quienes iniciaron los
estudios del cálculo de probabilidades, tratando de resolver
problemas de juegos de azar.
A fines del siglo XVIII y principios del XIX, los trabajos de LAPLACE
permitieron dar su definitiva estructuración al cálculo de
probabilidades.
A partir de LAPLACE, las dos disciplinas, calculo de probabilidades y
Estadística, que hasta entonces habían permanecido separados se
fusionaron de manera que el cálculo de probabilidades se constituye
en el andamiaje matemático de la Estadística, mediante el cual, esta
pudo tomar el impulso teórico que habría de llevarla al extraordinario
desarrollo y perfeccionamiento que alcanzó en el siglo pasado y en el
presente.
La estadística moderna se caracteriza por hacer uso de la estadística
inferencial.
Esta incluye un conjunto de técnicas que, como se dijo en la primera
parte tiene el propósito de INFERIR O INDUCIR leyes de
comportamiento de una población a partir del estudio de una muestra
GENERALIDADES:
En muchas oportunidades nos hemos encontrado con afirmaciones
donde no existe el100% de certeza sobre la aparición realización de
un lecho o fenómeno.
Por ejemplo continuamente escuchamos situaciones como las
siguientes:
- Dado los niveles de inflación, en los últimos meses en el país, es
probable que el próximo año, la economía alcance niveles de
hiperinflación
- Dada la reducción continua, de los ingresos reales y el aumento
de desempleo en la población, es probable que en los próximos
mese, se desate una serie de conflictos sociales.
En estos ejemplos se puede apreciar que el resultado final no se
conoce con exactitud o certeza existe por lo tanto INCERTIDUMBRE.
Así “se vive en un mundo donde se esta en la capacidad de predecir
el futuro con completa certeza”. La necesidad de tener suficiente
poder para manejar la incertidumbre obliga a estudiar y usar la teoría
de la probabilidad.
La probabilidad por tanto, nos proporciona la base para el estudio de
la inferencia estadística. Aquí estudiaremos solo los conceptos y
técnicas de probabilidad fundamentales que nos permita comprender
el análisis estadístico.
PROBABILIDAD
La teoría de probabilidad tiene mucha importancia en problemas de
Ingeniería, Administración, Economía, Etc.
“Hay que tomar decisiones frente a la incertidumbre”
Para un Ingeniero, posiblemente no tenga sentido el preguntarse
¿Durante cuanto tiempo funcionará un determinado mecanismo?
Pero tendrá sentido el preguntarse y responderse a la pregunta ¿Cuál
es la probabilidad que este mecanismo funcione más de 1000 horas?
ó ¿Qué porcentaje de estos mecanismos funcionarán más de 1000
horas?
Para un fabricante a gran escala tendrá sentido el preguntarse por
porcentaje de su producto, será aceptado en el mercado.
A un candidato presidencial posiblemente no le interese que Juan
vote por el, per si le interesará saber el porcentaje de electores, que
volarán por el.
EXPERIMENTO ALEATORIO
Usted aunque no lo crea esta familiarizado con lo que es un
experimento aleatorio.
Posiblemente más de una vez, ha tenido que definir una apuesta por
medio de una moneda. En esta decisión, en el lenguaje corriente se
dice “Gana el que tiene suerte” en teoría de probabilidades diremos
que se determina “ALEATORIAMENTE” ó al azar al ganador.
Evidentemente antes de lanzar la moneda, no se podrá afirmar quien
va a ser el ganador (esta es una característica de un experimento
aleatorio)
- Sin embargo si la monada esta perfectamente equilibrada, ambas
tiene las mismas posibilidades de ganar.
A mediados del siglo XVI GIROLAMO CARDANO, matemático, medico y
jugador Italiano, escribió “El libro de los juegos de azar” en el que
aparecía el primer estudio conocido, de los principios de probabilidad.
Alrededor de 100 años mas tarde, el jugador CHEVALIER DE MERE
propuso a BLAISE PASCAL el famoso “Problemas delos puntos”, que
puede describirse como sigue:
Dos personas participan en un juego de azar, la primera que logre
acumular un cierto numero de puntos ganará la apuesta, si los
jugadores se ven forzados a suspender el juego antes de que haya
terminado, dado el número de puntos que ha acumulado cada uno de
ellos ¿Cómo deberá dividirse la apuesta?
Este problema constituyo un reto al ingenio de los astutos
matemáticos Franceses BLAISE PASCAL Y PIERRE DE FERMAT, quienes
iniciaron los estudios del cálculo de probabilidades tratando de
resolver problemas de juego de azar propuestas por el caballero DE
MERE.
En general todos los juegos de azar constituyen experimentos
aleatorios.
RIFA, DADOS, CARRERA DE CABALLOS, LOTERÍAS, BARAJA, ETC.
Este ejemplo nos da una idea de lo que es un experimento aleatorio
“Un experimento aleatorio ó estadístico es cualquier experimento u
operación) cuyo resultado no puede predecirse con exactitud antes
de realizarse el experimento”
Ejm.:
- Lanzar un moneda y observar la cara superior.
- Extraer un articulo de un lote que contiene artículos
defectuosos D y no defectuosos N.
- Designar un delegado de un grupo de 50 personas.
- Calcular el número de automóviles que cruzan la intersección
de dos calles, hasta antes que ocurra un accidente.
- Fabricar artículos hasta producir 5 artículos defectuosos y
contar el número total de artículos fabricados.
Son experimentos aleatorios, porque en cada caso el resultado del
experimento no puede predecirse.
En cambio.
“Soltar una piedra en el aire”
“Lanzar una pelota aun tanque de agua”
No son experimentos aleatorios, puesen el primer caso la piedra
caerá y en el segundo caso la pelota flotará
En general todos los juegos de azar constituyen experimentos
aleatorios.
EXPERIMENTO : Se hace rodar un dado y se observa el
número que aparece en la cara superior
ESPACIO MUESTRAL : S = [1, 2, 3, 4, 5, 6]
EVENTO A : Obtener numero par A= [2, 4, 6]
PROBABILIDAD
La definición clásica de probabilidad puede enunciarse así:
Si un evento A, Puede ocurrir de “m” formas de un total de “N”
posibles formas y si estas “N” son todas las formas posibles de
realización del evento, entonces la probabilidad de ocurrencia del
evento A, denominada P(A), esta dada por:
P (A) = mN
= CasosFavorablesCasosPosibles
Esto significa que si hay N elementos en el conjunto de resultados
posibles, la probabilidad para cualquiera de ellos, será 1/N.
Cual es la probabilidad que tirando un dado muestre un AS)
En este caso puede obtenerse como resultado, cualquiera de los seis
casos o lados (1, 2, 3, 4, 5, 6) que tiene el dado (casos posibles), esto
significa que la suerte o probabilidad que tiene cada cara es 16
P (A) = 16 =
CasosFavorablesCasosPosibles
= 0.1666 = 0.17 = 17%
Si se espera obtener un número par, debemospensar que hay tres
caras (2, 4, 6) que cumplen esta condición, luego la probabilidad de
obtener número par será:
P (par) = 36 =
12 = 0.50
En términos de conjunto será
N = {1,2,3,4,5,6} m = {2,4,6}
Ejem.:
Enumerar los resultados posibles de un experimento que consiste en
lanzar dos monedas.
Denotamos C Y S respectivamente
Moneda 1 : C C S S
Moneda 2 : C S C S
S = CC, CS, SC, SS
Puntos muestrales
Ejem.:
Enumerar los resultados posibles de un experimento en el que se
lanza una moneda tres veces
Los resultados posibles son 8
S = CCC, CCS, CSC, CSS, SCC, SCS, SSC, SSS
Para todo evento A
0 < P(A) < 1
2da moneda C S 1era moneda
C CC CSS SC SS
Si la probabilidad de un evento es 0 se dice que es imposible y si es 1
se dice que hay certeza.
Ejemplos:
Lanzar una moneda dos veces, es equivalente a lanzar dos monedas
una sola vez
Si una moneda se lanza n veces, entonces el espacio muestral 2n
eventos elementales
_Si en S se define al Evento A, entonces su complemento es A, donde: Si m es las veces que puede ocurrir el evento A, (N-m) denotará las
veces que ese evento no ocurra.
_ _Si denotamos A la no ocurrencia de A, su probabilidad P(A) (ó q) esta dado por:
(q =) P (A) = N−mN
= NN
- mN
= 1 – P (A)
De donde es fácil inferir que la suma de las probabilidades es de
ocurrencia y no ocurrencia de un evento es uno (1), es decir
p + q = P(A) + P (A)= 1
P (A)= 1- P(A)
Ejem.:
De un comité de 20 estudiantes constituido por estudiantes de
Ingeniería, Económica y Agronomía, se va a elegir al azar al
Presidente; se sabe que la probabilidad de elegir un estudiante de
Economía es 2/5 ¿Cuál es la probabilidad que el Presidente no sea de
Economía?
A = Economía Ā= No Economía
A
S
A
P (Ā)= 1-P(A) = 1 - 25 =
35 = 0.6
LEYES DE PROBABILIDAD
Las leyes de probabilidad son dos:
La ley de suma y la de multiplicación.
Debe tenerse en cuenta que no se aplica a cualquier caso, sin que su
aplicación esta condicionada a la naturaleza de los eventos.
LEY DE LA SUMA se aplica a dos clases de eventos.
a. EVENTOS MUTUAMENTE EXCLUYENTES
Dos eventos cualquiera A y B son (eventos) mutuamente
excluyentes si y solo si A π B = Ø .Es decir, son eventos que no
tienen elementos comunes. Son conjuntos disjuntos.
Si A y B son sucesos mutuamente excluyentes, entonces
TEOREMA 1
P (AUB) = P(A) + P(B)
Por ejemplo si en la población mayor de 20 años de edad se
define los Eventos.
A = {Población Analfabeta}
B = {Abogados}
Entonces A π B = Ø Porque no hay Abogados analfabeto
En este caso los dos eventos A y B no tienen puntos en común de
modo que A π B = Ø, no pueden ocurrir simultáneamente.
BA
S A π B = ØSon mutuamente Excluyentes
En general si hay varios eventos, mutuamente excluyentes.
La probabilidad de que ocurra algunos de ellos.
P (A U B U C U …….)
TEOREMA
P (AU BU C) = P (A) + P (B) + P (C)
“La suma de la probabilidad de los Eventos es igual a 1”
Ejem.:
Una caja tiene 220 tornillo iguales, de los cuales 80 son
producidos por la maquina A, 60 por la maquina B, 50 por la
maquina C y 30 por la maquina D. si se elige un tornillo al azar de
la caja ¿Cuál es la probabilidad que el tornillo elegido haya sido
producido por las maquinas A ó C?
Es claro que A, B, C, D son Eventos mutuamente excluyentes,
porque cada tornillo es producido por una y sólo una maquina.
E = {A, C}
P (A U C) = P (A) + P (C)
= 80220
+ 50220
= 0.591
Además S = {A, B,C, D}
La probabilidad haya sido producido por las maquinas AoBoCoD.
P (AUBUCUD) = P(A) + P(B) + P(C) + P(D)
= 80220
+ 60220
+ 50220
+ 30220
= 220220
= 1
S
A B C
b. EVENTOS (INDEPENDIENTES) NO MUTUAMENTE
EXCLUYENTES
En este caso significa la probabilidad de que ocurra el evento A ó
B ó que ocurran ambos.
En la suma de sus probabilidades, es menos la probabilidad de si
ocurrencia conjunta
Es decir que estos dos eventos tiene una porción común o
intersección A π B
TEOREMA:
P (AUB) = P (A) + P (B) – P(A π B)
Donde P(A π B) representa la probabilidad de que ocurran
simultáneamente A y B
En la suma de las probabilidades de todos los puntos P(A) + P(B)
se incluyen dos veces los puntos de A π B, por lo tanto P(A π B)
debe restarse dela suma P(A) + P(B).
Se obtiene que el resultado es el total de probabilidades de todos
los puntos de AUB, cada uno de los cuales se toma sólo una vez.
Este teorema representa el teorema general de la suma de
probabilidades.
Ejemplo:
Cual es la probabilidad de sacar un As ó una espada de una baraja
de casino.
Del grafico se deduce que A y B no son mutuamente excluyentes, porque tienen una parte en común.
BA A B
Los eventos A y B no son mutuamente excluyentes, pues hay un
AS de espadas.
Luego de probabilidad de extraer una carta que sea AS o una
espada o ambos casos es:
P(A) = Extraer un AS = 452
P(B) = Extraer una ESPADA= 1352
P (AUB) = P(A) + P(B) – P(A π B)
= 452
+ 1352
- (452
) (1352
) = 1652
= 413
0.308
Ejem.
En una empresa comercial trabajan 8 hombres y 18 mujeres, de
las cuales la mitad de los hombres y la mitad de las mujeres han
nacido en Lima. Hallar la probabilidad de que un trabajador
elegido al azar sea hombre ó que haya nacido en Lima.
Sea A = {El trabajador sea hombre}
B = {Trabajador nacido en Lima}
Entonces ser hombre ó nacido en Lima será A U B
P (AUB) = P(A) + P(B) – P(A π B)
P(A) = 826
P(B) = 4+926
= 1326
P(A π B) = 426
P (AUB) = 826
+ 1326
- 426
= 1726
= 0.654
S = {A, B, C}
BA A B
P(AUBUC)
TEOREMA:
P(AUBUC) = P(A) + P(B) + P(C) – P(A π B) – P(B π C) – P(A π C)
+ P(A π B π C)
Ejem.:
Un examen de automóviles recién desechados, debido a
descomposturas del radiador, el motor ó la transmisión, demostró
que el 40% tenía transmisiones malas, el40% tenían radiadores
malos y el 50% tenían motores malos. El 15% tenía mal, tanto la
transmisión como el radiador, el 20% la transmisión y el motor y
el 20% el radiador y el motor.
¿Cuántos tenían las 3 cosas mal?
Establecemos T = Transmisión Mal
R = Radiador Mal
M = Motor Mal
40% P(T) = 0.40 15% P(TR) = 0.15
40% P(R) = 0.40 20% P(TM) = 0.20
50% P(M) = 0.50 20% P(RM) = 0.20
Encontrar: P (TRM)
S
C
B CA C
A B
A B C
AB
M
RMTM
T R
TRM
T R
P(TURUM) = P(T) + P(R) + P(M) – P(T π R) – P(R π M) – P(T π M)
+ P(T π R π M)
1 = 0.40 + 0.40 + 0.50 – 0.15 – 0.20 – 0.20 + P(T π Rπ M)
P(T π R π M) = 0.25
REGLA DEL PRODUCTO DE PROBABILIDADES
Con frecuencia resulta necesario trabajar con probabilidades para una
parte, más que para todo un espacio muestral.
En este caso nos ocuparemos de la probabilidad de un evento, en un
determinado subconjunto, del espacio muestral general. Las
probabilidades asociadas con eventos en un determinado subconjunto
del espacio muestral, se llaman PROBABILIDADES CONDICIONALES.
Procedemos a desarrollar un método general para hallar
probabilidades condicionales.
DIAGRAMA DE VENN
Si en el espacio muestral S hay N resultados igualmente posibles
de los que Na son favorables al evento A; Nb favorables al B, y
Nab, favorables tanto al evento A como al B, entonces:
1.30 0.55
0.75
S
NbNa Nab
B
BA A B
P(A) = NaN
P(B) = NbN
P(A π B) = NabN
P(A/B) = NabNb
P(B/A) = NabNa
Si conocemos P(B) y P(A/B), podemos obtener P(A π B)
directamente, notando que
TEOREMA
P(A π B) = P(B) P (A/B)= NbN.NabNb
= NabN
A este resultado se le denomina con (frecuencia) REGLA DEL PRODUCTO
DE PROBABILIDADES
Es fácil verificar que P (A π B) es también igual al producto
P(A) P(B/A)
TEOREMA:
P (A π B) = P(A) P(B/A) = NbN.NabNa
= NabN
Extendiendo dicha regla a tres eventos A, B,C
TEOREMA
NbNa Nab
B
BA A B
P (A π B π C) = P (A) P(B/A) P (C/A π B)
Se conoce como la ley de la multiplicación de probabilidades y es útil en el
calculo de probabilidades de eventos compuestos, es decir eventos que
constan de dos ó más eventos simples.
REGLA DEL PRODUCTO PARA EVENTOS INDEPENDIENTES.
Si la ocurrencia o no ocurrencia de un evento A no tiene ningún efecto sobre la
probabilidad de la ocurrencia de B y viceversa, los eventos A y B son
denominados eventos independientes.
En este caso, saber que se obtuvo en el primer evento, no tendría valor alguno
en (la predicción) del resultado del segundo.
Dos eventos A y B son independientes así:
TEOREMA:
P (A π B) = P (A) P (B)
(Esta definición es llamada regla del producto para eventos independientes)
El concepto de independencia, no se limita a dos eventos.
En el caso de tres A, B, C (se dice que son independientes si solo si)
TEOREMA:
a. P (A π B π C) = P (A) P(B) P(C)
PROBABILIDAD CONDICIONAL
La regla del producto de probabilidades, es utilizada (a menudo) para obtener
probabilidades condicionales.
BA
CBA
Si P(B) es distinto de 0, podemos dividir los dos términos por P(B) para
obtener P (A π B) = P(B) P(A/B)
TEOREMA
P (A/B) =P (A π B)P(B) P(B) ≠ 0
De manera similar, encontramos que la probabilidad de B dado A es.
TEOREMA P (A π B) = P(A) P(B/A)
P (B/A) =P (A π B)P (A ) P(A) ≠ 0
Siempre que P (A) sea distinto de cero.
VARIABLE ALEATORIA Y DISTRIBUCION DE
PROBABILIDADES
VARIABLE ALEATORIA
Es una variable en la que no se puede fijar anticipadamente el valor que debe
tomar, porque este valor depende de los posibles resultados de un experimento
aleatorio. Se denotan por letras mayúsculas tales como: X, Y, Z etc.
Ejemplo:
En el experimento aleatorio de lanzar tres monedas legales el espacio muestral
es:
S = {ccc, ccs, csc, scc, css, scs, ssc, sss}
Sea la variable aleatoria X que representa el número de caras que se puede
obtener en cualquier resultado del experimento aleatorio.
En el experimento aleatorio de lanzar tres monedas legales, el espacio
muestral es:
S = {ccc, ccs, csc, scc, css, scs, ssc, sss}
Sea la variable aleatoria X que designa el número de caras que se puede
obtener en cualquier resultado del experimento.
Vemos que el rango de X es el conjunto {3, 2, 1, 0}
Los números 0, 1, 2, 3 se llaman valores de la variable aleatoria X.
En el desarrollo de la teoría de las probabilidades y sus aplicaciones, es
conveniente considerar cada uno de esos valores como un evento. Así
tenemos los eventos:
A = {X = 0} = {que la variable aleatoria tome el valor 0}
B = {X = 1} = {que la variable aleatoria tome el valor 1}
C = {X = 2} = {que la variable aleatoria tome el valor 2}
D = {X = 3} = {que la variable aleatoria tome el valor 3}
DISTRIBUCION DE PROBABILIDAD
DISTRIBUCION BINOMIAL – BERNAULLI
En este capítulo presentamos algunas distribuciones de probabilidad discreta,
desarrollando en forma analítica ciertas suposiciones básicas de un fenómeno
real. Estas distribución es tiene aplicaciones en Ingeniería, Administración, etc.
La distribución de probabilidad es de Bernaulli (en homenaje a JACQUES
BERNAULLI, quien en el año 1600 también desarrollo la teoría de las
Permutaciones) se aplica solo cuando hay dos resultados posibles.
Por ejemplo: en un test verdadero – falso
La distribución binomial se basan un una sucesión de ensayos de Bernaulli.
Un proceso binomial cumple las siguientes condiciones.
1. Cada ensayo tiene sólo dos resultados posibles, denominados por éxitos
“E” y fracasos “F”
0123
2. La probabilidad de éxito denotado por “p”, permanece constante de
ensayo a ensayo, por lo tanto la probabilidad de fracaso 1-p = q; también
es constante.
3. Los ensayos sucesivos son independientes, es decir el resultado de un
ensayo cualquiera es independiente de los resultados de los ensayos
anteriores, se aplica a variables discretas
La binomial es una distribución de gran aplicación. Esta distribución teórica,
aplicada a los problemas de probabilidades, ayudan al Ingeniero de control
de calidad a tomas la decisión de aceptar o rechazar un lote de transistores
fundado en el descubrimiento de (digamos) dos transistores defectuosos en
una muestra de 100 tomados al azar en el mencionado lote.
Supóngase que una operación que llamaremos prueba, puede producir
únicamente, uno de dos resultados posibles; a uno de estos resultados le
llamaremos éxitos, al otro fracaso.
El lanzamiento de una moneda, la siembre de una semilla, la investigación
de un circuito eléctrico en cuanto a su funcionamiento y la inoculación de un
paciente, son pruebas.
La moneda puede mostrar “cara” ò “sello”; la semilla puede germinar o
no; el circuito puede funcionar correctamente o ser defectuoso; y el
paciente puede recuperarse ò morir.
Sea p la probabilidad de éxito y q la probabilidad de fracaso de modo que
p + q = 1
Para la probabilidad binomial se extraen con remplazo para que no varíe,
todos los experimentos son con reemplazo para que p no varíe.
Una prueba binomial es un experimento que tiene dos posibles resultados
“éxito” y fracaso”
En una prueba Binomial
S =
Si se realizan n pruebas independientes Binomial
S = A1 x A2x ………… xAn
Si ocurre exactamente x éxitos en las n pruebas ocurrirá también n-x
fracasos
Como:
p = La probabilidad de éxitos
q = La probabilidad de fracasos
Se tiene para el caso
e, e, e ….. e f f …...f su probabilidad será
x éxitos n-x fracasos
p pp …. p q q …… q = px.qn-x
x veces n-x veces
Luego ocurren ( ) formas donde hay exactamente x éxitos.
Por lo tanto la probabilidad de exactamente
P (x=x) = ( ) pxqn-x x = 0, 1, ……n
P ( x=x) = C pxqn-x
FUNCION DE CUANTIA O DE PROBABILIDAD
f (x) = P (x=x) = n! . pxqn-x
x! (n-x)!
e, f
nx
nx
xn
Probabilidad de
una sucesión
cualquiera
Numero de
maneras de
obtener x
éxitos
Probabilidad de
obtener x éxitos
exactamente
Ejem:
La probabilidad de un estudiante que ingresa a la Universidad y logre
graduarse es 0.4 ¿Cuál es la probabilidad que de5 estudiantes nuevos. Se
gradúen 3.
n = 5 x = 3 graduados
p = 0.4 graduarse
q = 0.6 no graduarse
P (x =3) = 5! (0.4)3 (0.6)5-3 = 5! (0.4)3 (0.6)2
3! (5-3)! 3! 2!
P (x =3) = 10 (0.064) (0.36) = 0.2304
Se lanza un dado 10 veces ¿Calcular la probabilidad de obtener 4 veces
seis?
SOLUCION
La v.a. esta definida así
X = numero de veces que aparece el numero 6 en 10 lanzamientos
X = (0, 1, 2 ………………10)
Sea E = obtener un seis : P (E) = 1 = 0.1666 6
F = obtener un numero diferente de 6: P (F) = 5 6
Por lo tanto se tiene que:
n = 10 p = 1 q = 5 6 6
Luego la función de probabilidad de X es
P (x = x) 101 x 510-x x6 6
X = 0, 1, 2 ……….10
Estamos interesados en el calculo de p (x = 4)
P (x = 4) = 101456
4 6 6
P (x = 4) = 10!1456 = 0.048 4! (10-4)! 6 6
P (x = 4) = 210 (0.0008352) (0.2713604) = 0.0475944
FUNCION DE DISTRIBUCION O ACUMULATIVA
P ( x ≥ x) = ∑ ( nx )pxqn-x
Ejem: Un estudiante se presente a un examen de selección múltiple que
contiene 8 preguntas cada una con tres respuestas opcionales, si el
estudiante esta adivinando al responder cada pregunta y además se
sabe que para aprobar el examen debe responder correctamente 6 ò
mas preguntas ¿Cuál es la probabilidad de aprobar el examen?
Defina la variable aleatoria x tal que
x(w) = numero de respuestas concretas en las 8 preguntas
Rx = (0, 1, 2, 3, 4, 5, 6, 7, 8
Puesto que cada pregunta consta de una respuesta correcta y 2
respuestas no correctas
P(E) = 1 = p y P(F) = 2 = q ( por estar adivinando) 3 3
Luego la distribución de probabilidad de x es,
P(x) = P(x=x) = 8 1 x28-x x = 0, 1, ……8
n
x = 0
x 3 3
Sea A el evento “aprobar el examen” entonces
P(A) = P( x>= 6) = ∑ ( 8x )( 13 )( 23 )
= ( 86 )( 13 )( 23 ) + ( 87 )( 13 )( 23 ) + ( 13 ) = 432187
= 0.02 = 0.01966
Se ha elaborado un examen de selección múltiple consistente en 10
preguntas. Hay cuatro respuestas posibles para cada pregunta. Suponga
que ninguno de los estudiantes que van a rendir el examen concurrió a
clases o que no estudio para el examen (cosa muy frecuente) el profesor
que toma la prueba ha establecido que para aprobar debe contestar
correctamente al menos 6 preguntas. Si hubiere 100 alumnos en la clase
¿Cuántos alumnos teóricamente aprobarían?
SOLUCIÓN
1º Puesto que ninguno de los alumnos asistió a clase o no estudio para el
examen, la elección de la respuesta en cada una de las 10 preguntas se
hará al azar; por lo tanto la elección de la respuesta en cada pregunta se
considera como un ensayo de Bernaulli, con
P = Prob. deacertar la respuesta correcta 1 = 0.25 y q = 3 4 4
2º El experimento se repite 10 veces, es decir n = 10
3º Definimos la variable aleatoria X por
X (w) = numero de respuestas correctas en las 10 preguntas
Rx = 0, 1, 2, 3, ………, 10
4º La variable aleatoria X, así definida es un v.a.binomial
Por lo tanto su distribución
P (x = x) 101x310-x x = 0, 1, …….10
8
X=6
x 8-x
6 2 7 8
x 44
5º Para aprobar el examen debe contestar al menos 6 preguntas correctas,
es decir, la probabilidad de aprobar el examen es
P( x ≥ 6) =
P(x ≥ 6) = ( 14 )( 34 ) + ( )( 14 )( 34 ) + ( )( 14 )( 34 ) + ( ) ( 14 )( 34 ) 6
+ ( ) ( 14 )( 34 ) = 0.0197
Por lo tanto, aprobación teóricamente el examen 100 (0.0197) = 1.97 2, alumnos
u = E (X) = np media XVarianza = S2 = npqDesviación Estándar = √npq
DISTRIBUCION DE PROBABILIDADES DE UNA VARIABLE ALEATORIA
Si para cada valor de la variable X, considerado como un evento, procedemos
a calcular su respectiva probabilidad, obtenemos una función que se denomina
FUNCION DE DISTRIBUCION DE PROBABILIDADES DE LA VARIABLE
ALEATORIA X.
En la práctica, para abreviar, se omite las palabras: Función de
Es importante tener en cuenta que ∑ P (X ) = 1, esta fórmula dice en palabras:
La suma de las probabilidades de todos los eventos posibles es igual a 1.
En el ejemplo 1, del rubro 5.2.2. hemos visto que la variable aleatoria X que
designa el número de caras en cada posible resultado del experimento puede
tomar los valores: 0, 1, 2, 3.
Las probabilidades de los respectivos eventos son:
10 0
19283746
10 7
1010
10 9
10 8
10
X = 6
P {X = 0} = P {sss} ………… = 1/8 = 0.125
P {X = 1} = P {css, scs, ssc} = 3/8 = 0.375
P {X = 2} = P {ccs, csc, scc} = 3/8 = 0.375
P {X = 3} = P {ccc} ………… = 1/8 = 0.125
La distribución de probabilidades es la que se presenta en el cuadro
CUADRO
X O 1 2 3
P (X) 0.125 0.375 0.375 0.125
18
38
38
18
LA ESPERANZA MATEMATICA
Las dos características importantes de la distribución de una variable aleatoria,
son su tendencia central y su variabilidad. En esta parte introduciremos el
concepto de la esperanza, que es una medida de Tendencia Central de una
variable aleatoria.
La esperanza es designada de muchas (otras) formas; como esperanza
matemática, valor esperado, o simplemente la media de una variable aleatoria.
Este concepto se relaciona íntimamente con la noción familiar de la media
aritmética “La esperanza matemática de una variable aleatoria es la suma de
los productos que se obtiene multiplicando todos los posibles valores de la
variable aleatoria por su correspondiente probabilidad”.
Ejem:
La Probabilidad de que una casa de cierto tipo sea destruida por un incendio en
un periodo (cualquiera) de doce meses es de 0.005. Una Compañía de
Seguros ofrece en venta al dueño de esa casa una póliza de seguros contra
∑ P (X ) = 1
incendio por el término de un año en 20,000 Soles, con una prima de 150 soles
¿Cuál es la ganancia esperada de la Compañía?
La “ganancia” G, para la Compañía es una variable aleatoria con posibles
valores de 150 soles, si la casa no sufreun accidente de incendio y de 19,850
soles, si la casa se quema durante el año que cubre la póliza. La función de
probabilidad de G es entonces.
VALORES DE G, g 150 -19850
PROBABILIDAD f (g) 0.995 0.005
Con la información anterior vemos que:
E (G) = Ug = (150) (0.995) + (-19850) (0.005) = S/. 50
149.25 -99,25 = S/. 50.00
La ganancia esperada para una Compañía de Seguros debe ser positiva para
permitir a la Compañía pagar los costos administrativos y acumular reservas
para pagar a sus beneficiarios y tenedores de pólizas. Sin embargo en todos
los casos de juego de azar, en donde se juega por dinero, el valor esperado es
negativo, como se v en el ejemplo siguiente.
En general si X es una variable aleatoria discreta que toma los valores X1, X2,
Xn y tiene una función de densidad de probabilidad f(x) su esperanza
matemática se define como:
E (X) = ∑i=1
n
Xi P(Xi )
Si X es una variable aleatoria continua con una función de densidad de
probabilidad f(x), entonces.
E(X) = ∫−∞
∞
X1P(X) dx
La varianza G2de una variable aleatoria X con función de probabilidad f(x) se
define como el valor esperando del cuadrado de la desviación de la media
aritmética u esto es:
Donde u = E(X)
Var (X) = ∑i=1
n
X2P(Xi) – u2
Var (X) = ∑i=1
n
(Xi−u )2P(Xi)
ESPERANZA MATEMATICA DE UNA VARIABLE ALEATORIA
Es la media ponderada de las posibles valores de la v.a..x para ponderar cada
valor de X se multiplica por su respetiva probabilidad.
La Esperanza Matemática se representa por el símbolo E(X) también se le
designa u E(X) = u
E(X) = ∑i=1
n
X i P(Xi)
En la distribución de Probabilidades
X O 1 2 3
P(X) 0.125 0.375 0.375 0.125
Calcular la E(X)
E (X) = 0. (0.125) + 1. (0.375) + 2 (0.375) + 3 (0.125)
E (X) = 0 + 0.375 + 0.750 + 0.375
E (X) = 1.5
VARIANZA DE UNA VARIABLE ALEATORIA 2 =Var (X) = (Xi – u)2 P (Xi)
La varianza de la v.a. X es la esperanza matemática del cuadrado de la
diferencia que se obtiene, restando a la variable por su valor esperando u.
Vemos que el cuadrado de cada diferencia se pondera multiplicándolo por cada
valor de P(x)
Ejem:
Calcular la Var (X) de la distribución de probabilidades del experimento de
lanzar 3 monedas, en donde la v.a. X designa el número de caras en cada
posible resultado.
X O 1 2 3
P(X) 18
38
38
18
E(X) = 1.5
Var (X) = (0-1.5)2 (18
) + (1-1.5)2 (38
) + (2 – 1.5)2 (38¿ + (3-1.5)2 (
18¿
Var (X) = (2.25) (18
) + (0.25) (38
) + (0.25) (38
) + (2.25) (18
)
= 0.28125 + 0.09375 + 0.09375 + 0.28125 = 0.75
Utilizando la formula
2= Var (X) = ∑i=1
n
X2P(Xi) – u2
Una lotería vende 10,000 boletos de 1 sol por boleto; se dará un premio de
5,000 soles al ganador de la primera jugada. Suponiendo que hemos comprado
un boleto ¿Cuánto debemos esperar ganar?
A que la variable aleatoria “ganancia” G, tiene dos posibles valores: 4,999 soles
y – 1 sol.
VALORES DE G 4999 -1
PROBABILIDAD f (g) 1 9999
10,000 10,000
E (G) = 4,999 (1
10,000) + (-1) (
999910,000
)
499910,000
- 999910,000
= 0.4999 – 0.9999 = -0.50
Esta cantidad 50 centavos negativos, es la cantidad que esperamos ganar
(perder) cada vez, si jugamos repetidas veces.
APLICACIÓN DEL CONCEPTO DE ESPERANZA MATEMATICA
a) Una lotería con 1,000 numero, consta de las siguientes premios
1 premio de S/. 100.000
2 premios de S/. 10,000
5 premios de S/. 1,000
A cuanto debe venderse el billete, para que no se gane ni se pierda?
Solución:
Los posibles valores de la variable son: (posibles premios)
Xi = 100,000 10,000 1,000
Y las probabilidades de ganar dichos premios son:
Pi = 11000
21,000
51,000
Xi
Pi
Luego en promedio, se espera ganar:
E(X) = 100,000 1
1,000 + 10,000
21,000
+ 1,000 5
1,000 = S/. 125
Si se venden los 1,000 numero a S/. 125 c/u, se recaudan S/. 125,000.
Pero se distribuyen S/. 125.000 en premios, luego:
No se gana ni se pierde
Por otra parte participan 1,000 personas que pagan c/u S/. 125 y
esperan ganar, en promedio
S/. 125,000 = S/. 125
1,000
También se ve que en promedio no gana ni pierden
TEOREMA QUE IMPLICA PARTICIONES
PROBABILIDAD TOTAL
Sea {A1, A2….An} particiones del espacio muestral S y sea A cualquier
evento
Entonces
P(A) = = ∑i=1
n
P (Ai) P(A/Ai)
Siempre que P (Ai) = 0 i = 1, 2, ……n
La demostración de este teorema se facilita con la figura en todo lo que sigue
i = 1, 2 …..n
A esta representada por la región sombreada dentro de S
S = A1 U A2U …. U An
A = A ∩ S
A = A ∩ (A1 U A2U ….U An)
A = (A A1) U ( A ∩ A2) U………..U (A ∩ An)
P (A) = P (A ∩ A1) + P (A ∩ A2) + ……….+ P (A ∩ An)
P (A) = P (A1) P (A/ A1) + P (A2) P (A/ A2) + ……. + P (An) P (A/An)
P (A) =
Ejm. PROBABILIDAD TOTAL
En un laboratorio hay tres jaulas. En la jaula I hay 2 conejos pardos y tres
blancos, en la jaula II tiene 4 conejos pardos y 2 blancos, en la jaula tres
contiene 5 conejos pardos y 5 blancos.
Se selecciona al azar una jaula y se saca un conejo aleatoriamente de esta
jaula.
¿Cuál es la probabilidad que el conejo escogido sea blanco?
Sea el evento B: salga un conejo blanco.
(Ai) P (A/Ai)
P(II) = 13
P(I) = 13
III P(B/III) = 510
B -----
B -----
II P(B/II) = 26
B -----
B ----
I P(B/I) = 35
B -----
B -----
III
5 P5 B
II
4 P2 B
I
2 P3 B
P(B) = P(I) P(B/I) + P (II) P(B/II) + P (III) P (B/III)
=13 .
35 + 13 .
26 + 13 .
510 = 315+ 218 + 530 =
= 15 + 1
9 + 1
6 = 43
90= 0.477777 = 0.478
PROBABILIDAD DE LAS CAUSAS – TEOREMA DE BAYES
Teorema Bayes, se refiere a la asociación de dos acontecimientos, cuando
ellos están ligadas de tal manera, que la realización de un acontecimiento,
supone también, la realización de algunas de las posibilidades del segundo.
Consideremos un acontecimiento A, y supongamos, por hipótesis, que para
que se produzca A, es indispensable, que se haya producido también, un y solo
uno de los acontecimientos excluyentes digamos:
B1, B2, …Bn
El Teorema de Bayes, trata de responder la siguiente pregunta:
Suponiendo que se ha realizado el evento A ¿Qué probabilidad existe que haya
sido conjuntamente con un determinado B por ejemplo con Bi?
A continuación demostremos la formula que responde a la pregunta del
Teorema de Bayes
Este Teorema fue propuesto por el clérigo Ingles Thomas Bayes (1761)
DEMOSTRACION TEOREMA
P(III) = 13
Si conozco P(A) y P(Ai/A) P(A ∩ Ai)
Por el Teorema de la multiplicación
P(A ∩ Ai) = P(A) P(Ai/A)
P(A) ≠ 0
P (A ∩ Ai) = P (A) P(Ai/A)
P(A) P (A)
P (Ai/A) = P ( A ∩ Ai)
P(A)
Sustituyendo:
P(A) = P(A1) P(A/A1) + P (A2) P(A/A2) + - - - + P(An) P(A/An)
Resulta:
P (Ai/A) = P (A ∩ Ai)
P(A1) P(A/A1) + P(A2) P(A/A2) + - - - + P(An) P(A/An)
Remplazando P( A ∩ Ai) por su equivalente P(Ai) P(A/Ai), resulta finalmente
P(Ai/A) = P (Ai) P (A/Ai)
P(A1) P(A/A1) + P(A2) P(A/A2) + - - - + P(An) P(A/An)
En una fábrica de pernos las maquinas A, B y C fabrican 25, 35, 40 por ciento
de la producción total representativamente. De lo que producen 5, 4 y 2 por
ciento respectivamente son pernos defectuosas. Se escoge un perno al azar
y se encuentra que es defectuoso ¿Cuál es la probabilidad que el perno
provenga de la maquina A, B, C
SOLUCION
Este problema, es una aplicación del teorema de Bayes
P(D) = P (D ∩ A) + P (D ∩ B) + P ( D ∩ C)
P(D) = P (A) P (D/A) + P (B) P (D/B) + P (C) P (D/C)
P(D) = (0.25) (0.05) + (0.35) (0.04) + (0.40) (0.02)
P(D) = 0.0125 + 0.0140 + 0.0080 = 0.0345
a) P (A/D) = P(D ∩ A) = P (A) P (D/A)P(D) P(D)
P (A/D) = (0.25) (0.05) (0.25) (0.05) + (0.35) (0.04) + (0.40) (0.02)
P (A/D) = 0.0125 = 0.362
………………D ∩ C
………………D ∩ B
………………D ∩ A
D
DD
DD
D
P(D/C) = 0.02
C
P(D/B) = 0.04
B
A
P(D/A) = 0.05
P(C) = 0.40
P(B) = 0.35
P(A) = 0.25
0.0345
b) P (B/D) = P (B) P (D/B) = (0.35) (0.04) =P(D) 0.0345
P (B/D) = 0.0140= 0.406 0.0345
c) P (C/D) = P (C) P (D/C) = (0.40) (0.02) = 0.008 = 0.232 P (D) 0.0345 0.0345
PERMUTACIONES FACTORIAL DE UN NÚMERO
Sea n un entero positivo, definimos el factorial de n, denotado por n!
Como el producto de todos los enteros consecutivos desde 1 hasta n
inclusive, es decir.
n! = n (n-1) (n-2) ------- 3 x 2 x 1
Así por ejemplo:
5! = 5 x 4 x 3 x 2 x 1 = 120
10! = 10 x 9 x 8 x 7 x 6 x 5 x 4 x 3 x 2 x 1 = 3`628,800
Observe que n! = n (n-1)!
De esto si n =1, tenemos 1! = 1 (0!) y definimos convencionalmente
que 0! = 1
Definición.- Una permutación es un arreglo de todos ò parte de un
conjunto de objetos
Suponga que tenemos un conjunto de tres objetos
A = (a, b, c), estamos interesados en el numero de arreglos con los
elementos del conjunto A las posibles permutaciones son: abc, acb,
bac, bca, cab, cba, hay 6 permutaciones distintas.
Se puede llegar a la misma respuesta sin tener que escribir todas las
anotaciones posibles, de la siguiente manera, los arreglos de los 3
objetos es equivalente a disponerlas en celdas, así:
3 2 1
Hay 3 formas posibles de llenar la primera celda, con cualquiera de
los tres objetos a, b y c, para la segunda celda hay 2 formas posibles,
cualquiera de los dos objetos restantes después de haber llenado la
primera y solamente queda una forma de llenar la tercera. Aplicando
el principio de multiplicación da un total de 3 x 2x 1 = 6 formas (o
permutaciones).
Teorema.- El número de permutaciones de n objetos diferentes es:
P = n!
Ejm: Un inspector visita 6 maquinas diferentes, durante el día. A fin
de impedir que los operadores sepan cuando inspeccionará, varía el
orden de las visitas ¿De cuantas maneras puede hacerlo?
Solución:
Puesto que tiene que inspeccionar las 6 maquinas diferentes,
entonces el número de manera es una permutas de las 6 maquinas.
Es decir:
P = 6! = 6 x 5 x 4 x 3 x 2 x 1 = 720 formas.
Ejm:
nn
6 6
En una competencia automovilística intervienen 40 participantes. De
cuantas formas distintas se pueden adjudicar los lugares de llegada a
los 40 competidores de la competencia
Solución:
Se desea saber de cuantas formas posibles se pueden ordenar los 40
competidores. El numero de todos los ordenados posibles es:
40P40 = 40!
Supongamos que tenemos un conjunto de n objetos diferentes y
deseamos permutar r de estos n objetos
Teorema.- El numero de permutaciones de n objetos diferentes
tomadas r a r
P(n,r)= P =
NOTA: Hemos visto que una permutación es un arreglo de todas
parte de los elementos de un conjunto que tiene objetos diferentes
Así si A = (a, b, c) se vio que las diferentes permutaciones son:
abc, acb, bac, bca, cab, cba
es decir el orden de los elementos es importante observe que
estaselementos son comparables con las termas ordenados sin
repetición de sus elementos o sea no están las termas (a,a,a) (b,b,b)
(c,c,c)
Ejem: Un grupo esta formado por5 personas y desean formar una
comisión integradapor Presidente, Secretario ¿De cuantas maneras
puede nombrarse esta comisión?
El numero de permutaciones de 5 personas tomadas 2 a 2.
P = = = 5 x 4 = 20 maneras.
El cargo de Presidente puede ser ocupadas de5 maneras diferentes. Y
una vez ocupado el cargo de Presidente, el cargo de Secretario puede
rn
n!(n-r)!
5x4x3x2x1 3x2x1x
5!(5-2)!
25
ser ocupadode4 maneras diferentes; entonces la elección de la
comisión se puede hacer de 5x4 = 20 forma diferentes
5 4
El lector puede dar nombre a las personas, digamos A, B, C, D, E;
entonces, se busca todos los pares ordenados que se puedan formar
con dichas letras, sin repetición.
(A,B) (A,C) (A,D) (A,E)
(B,A) (B,C) (B,D) (B,E)
(C,A) (C,B) (C,D) (C,E)
(D,A) (D,B) (D,C) (D,E)
(E,A) (E,B) (E,C) (E,D)
Donde cada letra de la primera componente, indica la persona que
ocupa el cargo de Presidente, la segunda indica la persona que ocupa
el cargo de Secretario. Así (C,B) indica que C resulto elegido
Presidente y B Secretario y es sin repetición, ya que el par (A,A) no
esta en la permutación, pues si estuviera significaría que la persona A
ocupa el cargo de Presidente y Secretario, lo cual no puede ser.
Permutaciones Circulares
La permutaciones que ocurren por arregles de objetos formadas (o
alrededor de un circulo) un circulo se llama permutaciones circulares.
En estas agrupaciones no hay primero ni último elemento, por
hallarse todas en una línea cerrada para determinar el número de
permutaciones circulares que puedan formarse con los n objetos
distintos de un conjunto.
Basta considerar fija la posición de unocualquiera de ellas, las n-1
restantes podrán cambiar de lugar de (n-1)! Formas diferentes
tomando todas las posiciones sobre la circunferencia relativa al
primer punto.
Si cambiamos (ahora) la posición de este, las delos demás respecto
de el, será seguro un de las ya consideradas. Por lo tanto el número
de permutaciones circulares será.
(n – 1)!
La permutación circular se denota por Pcn
Teorema.- El número de permutaciones de n objetos distintos
alrededor de un círculo es Pcn= (n – 1)!
Ejem.: ¿De cuantas formas diferentes pudieron sentarse en la ultima
cena, alrededor dela mesa Jesucristo y los 12 Apóstoles?
Solución:
a) Si la mesa fuera circular, tendremos la permutación circular. El
numero de forma es:
Pc13 = (13 – 1)! =12! = 479’, 001, 600
b) Si la mesa no es circular, se tendrá una permutación de las 13
personas. El numero de formas es:
13P13 = 13! 6,227’020,800
PERMUTACIONES CON REPETICION
Hasta ahora hemos permutado objetos diferentes, (sin embargo) no
siempre es el caso.
Teorema
El numero de permutaciones (distintas) de n objetos de las cuales n1
son una clase, n2 de una segunda clase………. nk de una k-esimoclase
todos los demás objetos de clase 1), anotado por
P =
Ejem:
Un estante de una librería tiene capacidad para 10 libros de
Matemáticas que tienen pasta verde, 8 de Física de pasta roja y 7 de
Química de pasta azul ¿Cuántas maneras pueden colocarse los libros
según los colores?
n1, n2…..nkn
n!n! n2! ……nk!
Solución
Como solo interés los colores entonces n1 = 10, n2 = 8, n3 = 7
Luego el número de permutaciones es
( 2510 ,8 ,7 ) =
25!10! 8!7 !
= 21,034.600
COMBINACIONES
En muchas cosas estaremos interesados en el número de formas de
seleccionar r objetos de n, sin importar el orden
Estas selecciones se llamas combinaciones
DEFINICION.- Un sub conjunto de r elementos, de un conjunto que
tiene n elementos diferentes se llaman combinaciones de n
elementos tomados r a r
El numero de combinaciones de r elementos, que se pueden forma,
con los n objetos diferentes de un conjunto, se denota por
C
Este número en matemática tiene un símbolo especial
C = ( ) = n!
r ! (n−r )!
Ejem:
Se extrae dos cartas de una baraja de 52 ¿De cuantas maneras se
puede hacer esto?
Solución
Se necesitan solo sub conjuntos dedos cartas, sin importar el orden
rn
nrf
rn
Entonces el número de forma de seleccionar estas dos cartas es:
C(52,2) = 52 !2!50 !
= 52 !2!50 !
= 52! x 51!2!50 !
= 26 x 51 = 1326
DISTRIBUCION HIPERGOMETRICA
Supongamos una muestra den unidades obtenida de un lote de N
unidades, en el cual a unidades son defectuosas. Esta muestra se ha
obtenido del lote extrayendo sucesivamente las unidades de tal
forma que, después de cada extradición, cualquiera delas unidades
que permanecen en el lote tiene la misma posibilidad de quedas
incluidas en la muestra.
Para la distribución binomial será valida únicamente si después de
cada extracción se repone la unidad en el lote, por lo que tendremos
que buscar una nueva distribución de probabilidad, llamada
distribución hipergeometrica.
Para resolver (este) problemas de “muestreo sin templazamiento”,
que nos dice que un subconjunto de x objetos se pueden seleccionar
de (nx)= n !
x !(n−x )!
Modos diferentes, partiendo de un conjunto de n objetos.
En el problema de encontrar la probabilidad de obtener x unidades
defectuosas en una muestra de n, tomadas sin remplazamiento,
notemos, en primer lugar, que el espacio muestral de este
experimento tiene casos posibles, que son las formas en que un Nn
subconjunto de n objetos. Además las x partes defectuosas se
pueden seleccionar delas a partes defectuosas de maneras.
las n – x unidades no defectuosas de la muestra
Como ejemplo de distribución hipergeomètrica, calcularemos la
probabilidad de obtener dos unidades defectuosas en una muestra de
tamaño diez, tomada sin remplazamiento de un lote de 20 unidades
que contiene 5 defectuosas, sustituyendo x =2, n =10, a = 5 y N
=20, obtenemos:
h (2; 10, 5, 20) = = = 0.348
para simplificar el calculo de probabilidades de este tipo, se pueden
usar tablas de coeficientes binomiales o tablas de los logaritmos de
los factoriales, que se pueden encontrar en cualquier manual de
tablas matemáticos.
Nótese que, si hubiésemos cometido el error de usar una distribución
binomial con n = 10 y p = 5/20 = 0.25 para calcular la probabilidad
de encontrar dos unidades defectuosas, el resultado habría sido
0.282, considerablemente menor que la probabilidad encontrada.
Se pueden seleccionar, a su vez, de las N – a unidades no
defectuosas del lote, de maneras, el total de la muestra se
podrá seleccionar de maneras. Suponiendo que cada
una de las muestras tiene lamisma probabilidad de ser
ax
5 15
2 8( ) ( )
( )20
10
64350
184.765
N - an - x )(N - an - x
ax ( )
N n
seleccionada, la probabilidad de obtener x casos “favorables” en n
tentativas sin remplazamiento es
h(x;n,a,N) =
(Según teorema). La distribución de probabilidad definida por esta
ecuación recibe el nombre de distribución hipergeometica; los
parámetros de esta familia de distribuciones son el tamaño de la
muestra n, el tamaño del lote (o tamaño de la población), N y el
numero a de casos “favorables” en el lote, que en nuestro ejemplo
especial es el numero total de unidades defectuosas del lote (o
población)
DISTRIBUCION DE POISSON
La distribución de Poisson es otra distribución teórica de
probabilidades discreta y que tiene muchos usos en la economía y el
comercio, en el control de calidad industrial, en las líneas de espera o
teoría de colas, llamadas telefónicas. El nombre de esta distribución
es en honor el matemático francés Simeón Poisson, quien la describió
en 1837 como un límite de la distribución binomial cuando hay un
gran numero de pruebas y la probabilidad de éxito es muy pequeña
en cada una de las pruebas.
Supuestos de la Distribución de Poisson.-
1. Existe un gran numero de pruebas posibles para la verificación
de un suceso dado dentro de cada unidad de medida, y de la
probabilidad de una ocurrencia en cualquiera de esas pruebas
N - an - x
ax ( )
N n( )
para x = 0, 1, ……., n
es muy pequeña, además, la variable aleatoria debe ser un
numero entero dentro de la unidad de medida.
2. Independencia, cualquier numero de ocurrencia puede
acontecer en una sola unidad de medida, y esto no afecta al
numero de ocurrencias en cualquier otra unidad de medida.
3. Estabilidad, el valor de (promedio) ג debe permanecer
constante
DISTRIBUCION DE POISSON
Función de Cuantía o de Probabilidad
F(x) = P [ x=x ] = x: 0, 1, 2, 3 …….
np = ג
Función de Distribución o Acumulativa
F(x) = P [ x≤ x ] = ∑❑
Por una propiedad de la función de Distribución, tenemos:
f (0) = F (0)
F (x) = F (x – 1) + f (x)
Entonces, la probabilidad de un punto será
f (x) =F (x) – F (x – 1)
Ejemplo:
Sea 2 = ג
Calcular P [ x=1 ]
P [ x=1 ] = P [ x≤1 ] – P [ x≤0 ]
e - ג ג x x!
x
x = 0 e - ג ג x
x!
Tabla
ג x
0 1 2 3
2.0 0.135 0.406 0.677 0.857
Donde:
P [ x≤1 ] = 0.406
P [ x≤0 ]= 0.135
Luego:
P [ x=1 ] = 0.406 – 0.135
= 0.271
n = 1 000
p = 0,002 x = 3 p(x=x) = e - ג ג x x!
= np = 1 000 (0.002) = 2
e-2 = 0.13534
e -2 (2) 3 = 0.13534 (8) = 1.08276 = 0.18045 ** 3! 6 6
TABLA
P (x=3) = P(x=3) – P (x=2)
P(x=3) = 0.857
P(x=2) = 0.677
P(x=3) = 0.857 – 0.677 = 0.18
PROBLEMA: Un deposito esta compuesto de 1000 elementos que
trabajan independiente uno del otro. La probabilidad de fallo de
cualquier elemento durante eltiempo t es igual a 0.002. Hallar la
probabilidad de que durante eltiempo tfallen exactamente 3
elementos.
PROBLEMA: La razón de mortalidad para cierta enfermedad es de 7
por 1000 ¡Cual es la probabilidad de que exactamente 5 decesos por
esta enfermedad de un grupo de 400?
P (X=5) = C -2.8 (2.8) 5 n = 400 P = 7 = 0.007 5! 1000
C-2.8 400 (0,007) = 2.8
np = ג
Multiplicando
e-2 = 0.135034 0.060808262
e0.8 = 0.449 3
(2.8)5 = 172.10368 = 0.060808262 = 10.46532566
120
= 0.087127 = 0.0872
p(x2 x) = e - ג x
x!
en la tabla f(x) = F(x) – F (x-1)
= 0.935 – 0.848 = 0.087
LA PRUEBA DE LA CHI –CUADRADA O JI – CUADRADA
Esta prueba es utilizada para el análisis de la relación entre dos
variables categóricas, es decir, para aquellas cuyos criterios de
agrupación son eminentemente cualitativos, y se representa por el
símbolo X2.
Esta prueba se calcula mediante la utilización de una tabla de
contingencia o tabulación cruzada, la cual se caracteriza porque
Chequear
consta de dos dimensiones; cada una correspondiente a una variable,
las cuales, a su vez pueden tener dos o más categorías o valores.
Las categorías corresponden a las frecuencias observadas de cada
variable. De la cantidad de categorías de cada variable pueden
resultar matrices de diferente dimensión: 2x2, 3x2, 2x3, etc.
La prueba consiste en la comparación de la tabla de frecuencias
realmente observadas con la tabla de frecuencias esperadas, si n
hubiese ninguna relación entre las variables. Se parte de la hipótesis
de la ausencia de relación, de manera que, si ésta verdaderamente
existe, la diferencia entre ambas tablas debe ser significativa.
Ejemplo tabla de contingencia 2x2:
Análisis del hábito de fumar, por sexo, en una población “X”
Variables: Sexo y Hábito
Objetivo: Determinar la relación entre el sexo y el hábito de fumar.
TABLA DE FRECUENCIAS REALMENTE OBSERVADAS
SEXO/HABITO FUMA NO FUMA TOTAL
Masculino 1 520 8 744 10 264
Femenino 723 9 584 10 307
TOTAL 2 243 28 328 20 571
Los valores de cada celda de la tabla de frecuencias esperadas se
calcula mediante la siguiente formula, tomando los datos de la tabla
de frecuencias observadas:
fe = (Total frecuencias de la fila) * (Total frecuencias de la columna)
Total Genera de frecuencias
Aplicando la fórmula para cada celda resultaría:
Fe11 =2243*10264 = 1119,2
20571
Fe12 = 18328*10264 = 9144,8
20571
Fe21 = 2243*10307 = 1123,8
20571
Fe22 = 18328*10307 = 9183,2
20571
De aquí resulta la tabla de frecuencias esperadas:
TABLA DE FRECUENCIAS ESPERADAS.
SEXO/HABITO FUMA NO FUMA TOTAL
M 1119,2 9144,8 20,264
F 1123,8 9183,2 10,307
TOTAL 2243,0 18328,0 20,571
Por ultimo, la Chi – Cuadrada(X2) se calcula mediante la siguiente
formula:
X2∑ ( fo−fe )2fe
En la que:
fo = frecuencia observada en cada celda
fe = frecuencia esperada en cada celda
Es decir, para cada celda se calcula la diferencia entre las frecuencias
observadas y esperadas, se eleva al cuadrado y se divide entre las
frecuencias esperadas. La suma de todas las celdas es la C2.
Para el cálculo podemos apoyarnos en una tabla tal como se presenta
a continuación.
CELDA fo fe fo fe (fo fe)2
1520 1119,2 400,8 160676,1 143,6
8744 9144,8 -400,8 160676,1 17,6
723 1123,8 -400,8 160676,1 143,0
9584 9183,2 400,8 160676,1 17,5
TOTAL 921,6
Tal como se puede apreciaren la tabla, el valor de X2 es de321,6
Para interpretar el resultado obtenido debemos utilizar el concepto de
”grados de libertad” (G), el cual se calcula mediante la siguiente
formula:
G = (r-1) (c-1)
En la que:
R = numero de filas
C = numero de columnas
Por lo que:
G= (2-1) (2-1) = 1
Luego de realizados los cálculos, debemos comparar en la tabla de
distribución de la X2, eligiendo el nivel de confianza 0.05 ò 0.01, el
valor correspondiente a los grados de libertad obtenidos. Si el valor
calculado es igual o mayor al de la tabla, esto quiere decir que las
variables están relacionadas.
En nuestro caso, el valor correspondiente a un nivel de confianza de
0,05 para 1 grado de libertad es de 3.841, como el valor calculado es
de 321,6, esto quiere decir que las variables tienen una relación
significativa.
REGRESION LINEAL SIMPLE
REGRESION LINEAL SIMPLE
Al comenzar a estudiarlas técnicas de correlación afirmamos que
estudiaríamos dos variables y no solamente una. Llamamos en esa
ocasión X auna de las variables y Y a la otra. En el tema que nos
ocuparemos ahora, estudiaremos la forma de predecir valores de Y
conociendo primero los valores de X. Es así que viendo la tabla similar
a la que utilizamos cuando estudiamos correlación, conociendo
elpuntaje en la prueba de habilidad mental (Variable X) para un
alumno determinado, podemos anticipar elpuntaje del examen
deadmisión (Variable Y) delmismo alumno.
Consideremos la relación lineal expresada por el Cuadro. Si dibujamos
esa relación, obtenemos el grafico. Como podemos observar todos los
puntos se alinean “exactamente” en una sola línea recta, la que
recibe el nombre de línea de regresión. Teniendo en cuenta esta
línea, podemos predecir cualquiera delos valores de Y conociendo el
valor de X. para X = 25, según la recta, correspondiente Y = 35, para
X 0 20 corresponde Y = 30, Etc. En este caso se trata de una
correlación positiva perfecta cuyo coeficiente de correlación es +1
Prueba de
Habilidad Mental
X
Examen de
Admisión
Y
Susana 5 15
Iván 10 20
Lourdes 15 25
Aldo 20 30
Juan 25 35
María 30 40
Cesar 35 45
Olga 40 50
Recordemos ahora el Grafico que dibujamos cuando estudiamos
correlación, en este grafico observamos el diagrama de dispersión
“aproximado” por una línea recta, la recta que mejor se “ajuste” a los
puntos del diagrama de dispersión, es decir, en la mejor medida
procure dejar igual numero de puntos del diagrama de dispersión por
encima de ella que igual numero de puntos debajo, se llama línea de
regresión.
ECUACION DE LA REGRESION RECTILINEA
La ecuación que describe la línea de regresión es:
Yr = Y + r
En donde:
Y = media de la variable Y en la muestra.
_X = media de la variable X en la muestra
X = un valor de la variable X
X5 10 15 20 25 30 35 40
50 - 45 - 40 -35 - 30 - 25 -20 - 15 - 10 - 5 -
Sy X – r SyX – r SyX 4.2.1
SxSx Sx
r = coeficiente de Pearson, de la correlación lineal entre las variables
X y Y
Sy = desviación estándar de Y en la muestra
Sx = desviación estándar de X en la muestra
Yr = valor Y resultante del calculo de la formula.
Veamos cómo podemos predecir los valores de Y a partir de los
valores de X. Estudiamos el Cuadro Nº 4.2.1. Como el gráfico de este
cuadro es una línea recta ascendente sabemos que su coeficiente de
correlación de Pearson r = +1. Además tenemos los siguientes
resultados:
_ _X = 22.5, Sx = 11.46, Y = 32.5 Sy = 11.46
Estos resultados se pueden calcular a partir de los datos del cuadro
Nº 4.2.1. Apliquemos estos datos a la formula Nº 4.2.1., obtenemos la
siguiente expresión:
YR = 32.5 + (1)
Simplificando términos obtenemos:
YR = 32.5 + x – 22.5
YR = 10 + x (b)
escojamos cualquier valor de X del Cuadro Nº 4.2.1., por ejemplo por
María X = 30, reemplazamos este valor en (b)
YR = 10 + 30 = 40 (c)
Vemos en el Cuadro Nº 4.2.1. El valor que corresponde a María
efectivamente es 40. Es decir, podemos usar la ecuación Nº 4.2.1
para predecir los valores de Y conociendo los valores de X.
11.46 X – (1) 11.46 22.5 (a)
11.46 11.46
Esta formula de regresion se puede aplicar para dos variables X y Y,
entre las cuales no es obligatorio que exista una correlación lineal
perfecta, es decir, no es obligatorio que el r para la correlación entre
X y Y se a siempre igual a 1. Este valor de r para otras aplicaciones de
la regresión, puede tomar cualquier valor distinto de 1.
Ejercicios Resueltos de Regresión Lineal Simple
Al aplicar un test de inteligencia a una muestra representativa
constituida por 800 alumnos, se obtuvo la puntuación media de 30.4
puntos, con la desviación estándar de 12.6 puntos.
La edad media de la muestra fue de 14.5 años, con la desviación
estándar de 3.2 años.
El coeficiente de correlación lineal de Pearson entre la variable Y,
edad delos sujetos estudiados y la variable X, rendimiento mental de
los mismos sujetos, fue de r = 0.89.
Con estos datos se pide determinar la ecuación de regresión
rectilínea de la edad en base del puntaje del rendimiento mental.
¿Qué edad corresponde a los sujetos que alcanzan puntuaciones de:
X1 = 18 puntos X4 = 50 puntos
X2 = 25 puntos X5 = 60 puntos
X3 = 45 puntos X6 = 80 puntos?
Datos:
_Y = 14.5 SY = 3.2 r = 0.89_X = 30.4 SX = 12.6
Aplicando estos datos en la formula Nº 4.2.1 se tiene:
YR = 14.5 + 0.89
YR = 14.5 + 0.226X – 6.87
YR = 7.63 + 0.226X. Es la ecuación de regresión buscada
Respuesta de la 1ra pregunta
X1 = 18
YR = 7.63 + 0.226(18) = 7.63 + 4.07
YR = 11.7 años
Segunda pregunta
X2 = 25
YR = 7.63 + 0.226(25) = 7.63 + 5.65
YR = 13.28 años
Tercera pregunta
X3 = 45
YR = 7.63 + 0.226(45) = 7.63 + 10.17
YR = 17.8 años
Cuarta pregunta
X4 = 50
YR = 7.63 + 0.226(50) = 7.63 + 11.3
YR = 18.93 años
Quinta pregunta
X5 = 60
YR = 7.63 + 0.226(60) = 7.63 + 13.56
YR = 21.19 años
Sexta pregunta
3.2 X – 0.89 3.2 30.4
12.6 12.6
X6 = 80
YR = 7.63 + 0.226(80) = 7.63 + 18.08
YR = 25.71 años
Pruebas Estadísticas
I Chi Cuadrado X2
II T de studet
III r de Pearson
Chi Cuadrado
Def.
Que podemos probar con el X2
a) Independiente
b) Bondad de ajuste
c) Estimar a partir de S
= universo
S = muestra
Las hipótesis se pueden probar por Chi – Cuadrado T de studet y r de
Pearson.
a) Independencia:
Def. Si tenemos 2 variables sexo femenino y masculina si existe
independencia de una variable a otra Independencia n es rechazar
la hipótesis de unidad.
En que consiste la independencia.
2
S
= ∑ (Fo−Fe )Fe
Fo = Frecuencia observada
Fe = Frecuencia esperada
Ejemplo:
Se administra un sociograma a estudiantes de diversas edades. El
examinador encuentra que los estudiantes mas frecuentemente
elegido, como es el que elegiría como amigo son de más edad
Si se dividen los estudiantes por la medida de la edad obtendremos
los siguientes resultados.
ESTUDIANTES ELEGIDOS TOTAL
MENOR EDAD MAYOR EDAD
9 20 29
¿Se puede decir para un nivel de significación del 5% que los
estudiantes de más edad elegidos constituyen una mayoría?
ESTUDIANTES ELEGIDOS TOTAL _ R MENOR EDAD MAYOR EDAD K X = 14.5
9 (14.50) 20 (14.50)
Hay que ver filas y columnas
Fila = h Fo Fe (Fo – Fe)2
Fe h = 1 9 14.50 k = 2
20 14.50
COLUMNAS
K
1) Ho = Hipótesis de nulidad
La elección es independiente dela edad cada uno ha elegido
sin tener en cuenta la edad.
2) H1 = Hipótesis Alternativa
Las de mas edad hay son una mayoría.
Las de mas edad son mayoría han elegido las de mayor edad
3) Nivel de significación ( ) = 0.05
4) La Prueba 2 = ∑ (Fo−Fe )F 2
FoFe (Fo – Fe)2
Fe
9 14.50 (9 = 14.50)2= 2.09 14.50
20 14.50 (20 = 14.50)2= 2.09 14.50
X2 = 4.18
5) Toma de Decisión
Para la toma de decisión hay que tener en cuenta la tabla del X2.
V X2 0.995 X2 0.95
3.84 m = parámetro - X y DE
V = Grado de Libertad hay un parámetro solo la X
h x k – m
V = 1 X 2 = 1 = 1 Grado de libertad = 1 el X2 0.95 = 3.84
2
Para toma de decisión hay que tomar el valor crítico
3.84 = es el valor critico
Toma de decisión
Como X2 0.95 es igual a 3.84 y X2 = 4.18
Entonces 3.84 < 4.18
Esta en la zona de rechazo
No es independiente
rechazamos X
Ejemplo:
Como resultado de una elección se han obtenido los siguientes datos:
IDEOLOGÍ
A
CLASES SOCIALES
C. PopularC.
MediaC. Alta
IZQUIERDA 126 61 38
CENTRO 71 93 69
DERECHA 19 14 27
Rechazo Aceptación Rechazo
4.18 3.84-3.84
h
k
¿Puede decirse que existe asociación entre ideología y clase sociales
a un nivel de significación de 1%
h = 3 V = (h=1) (k=1) – m
k = 3
Elaboramos otro cuadro
Resultados de nuestras observaciones
Resultados experimentales
CLASES SOCIALESTOTAL
C. POPULAR C. MEDIA C. ALTA
IZQUIERDA126
(93.82)
61
(72.97)
38
(58.20)
225
CENTRO71
(97.16)
93
(75.57)
69
(60.27)
233
DERECHA19
(25.02)
14
(19.46)
27
(15.52)
60
TOTAL 216 168 134 518
C. POPULAR C. MEDIA
216 x 225 = 93.82 168 x 225 = 72.97 518 518
216 x 233 = 97.16 168 x 233 = 75.57 518 518
216 x 60 = 25.02 168 x 60 = 19.46 518 518
CLASE ALTA
134 x 225= 58.20 134 x 60 = 15.52 518 518
134 x 233 = 60.27 518
Las frecuencias esperadas ( ) las que están en el paréntesis
1) Ho = Las ideologías son independientes de las clases sociales
2) H1 = Las ideologías están íntimamente vinculadas a las clases
sociales
3) Nivel de significación 0.01, 99% de certeza
4) La prueba2 = ∑ (Fo−Fe )Fe
5) Toma de decisión ( si son independiente o no son independientes)
PRUEBA
Fo Fe(Fo – Fe)2
Fe1267119619314386927
93.8297.1625.0272.9775.5719.4658.2060.2715.52
11.047.041.451.964.121.537.011.268.49
2 = 43.80
Toma de decisión
Como V = (h-1) (k-1) – m (2) (2) – 0 = 4
no hemos empleado un parámetro (X o –DE)
1) Grado de libertad = 4
2) 2 = 43.80 y 2 0.99 = 13.30 (se busca en la tabla)
2
2 = 43.80
Zona de Rechazo
2 = 13.30