Estad stica Aplicada I (ESMA3101) - UPRM

12
Estad´ ıstica Aplicada I (ESMA3101) Prof. Pedro A. Torres Saavedra March 20, 2014 Lecciones 15-21: Probabilidad y Reglas de Conteo En esta lecci´on vamos a hablar de la probabilidad de ocurrencia de un evento y algunas propiedades relacionadas al c´ alculo de probabilidades. Es la frecuencia relativa con la cu´al el evento ocurre. Probabilidad de un Evento: B Hay tres formas de calcular la probabilidad de un evento: 1. Probabilidad emp´ ırica o experimental. 2. Probabilidad te´ orica. 3. Probabilidad subjetiva. La probabilidad emp´ ırica y te´ orica son explicadas a continuaci´on. Una probabilidad subjetiva hace referencia a un valor num´ erico para un evento expresado por un experto. Dicha probabilidad es subjetiva ya que esta puede variar si cambiamos de experto. Esta probabilidad no ser´a discutida en esta lecci´ on. Probabilidad Emp´ ırica ´o Experimental (Observada) Suponga que queremos calcular la probabilidad de obtener una cara (Head-H ) en el lan- zamiento de una moneda. Defina el evento A:=“El resultado es cara”. Suponga que para calcular dicha probabilidad lanzamos la moneda 30 veces y registramos los resultados. Por ejemplo, T,H,T,...,T . Si al final obtenemos 17 H’s entonces decimos que la probabilidad de la ocurencia de A (H) es 17/30 = 0.567. Es decir, la frecuencia relativa de ocurrencia del evento “H”. 1

Transcript of Estad stica Aplicada I (ESMA3101) - UPRM

Page 1: Estad stica Aplicada I (ESMA3101) - UPRM

Estadıstica Aplicada I (ESMA3101)Prof. Pedro A. Torres Saavedra

March 20, 2014

Lecciones 15-21: Probabilidad y Reglas de Conteo

En esta leccion vamos a hablar de la probabilidad de ocurrencia de un evento y algunaspropiedades relacionadas al calculo de probabilidades.

Es la frecuencia relativa con la cual el evento ocurre.

Probabilidad de un Evento:

B

Hay tres formas de calcular la probabilidad de un evento:

1. Probabilidad empırica o experimental.

2. Probabilidad teorica.

3. Probabilidad subjetiva.

La probabilidad empırica y teorica son explicadas a continuacion. Una probabilidadsubjetiva hace referencia a un valor numerico para un evento expresado por un experto.Dicha probabilidad es subjetiva ya que esta puede variar si cambiamos de experto. Estaprobabilidad no sera discutida en esta leccion.

Probabilidad Empırica o Experimental (Observada)

Suponga que queremos calcular la probabilidad de obtener una cara (Head-H ) en el lan-zamiento de una moneda. Defina el evento A:=“El resultado es cara”. Suponga que paracalcular dicha probabilidad lanzamos la moneda 30 veces y registramos los resultados. Porejemplo, T,H, T, . . . , T . Si al final obtenemos 17 H’s entonces decimos que la probabilidadde la ocurencia de A (H) es 17/30 = 0.567. Es decir, la frecuencia relativa de ocurrencia delevento “H”.

1

Page 2: Estad stica Aplicada I (ESMA3101) - UPRM

Notas de Clase - Estadıstica Aplicada I (Applied Statistics I ) (ESMA3101)

Probabilidad empırica de un evento A =# de ocurrencias de A

# de ensayos (o repeticiones)

En terminos algebraicos decimos

PE(A) =n(A)

n,

donde n(A) es el numero de veces que el evento A ocurre y n es el numero deensayos o repeticiones del experimento. Note que hemos agregado el subındice Epara indicar que la probabilidad es empırica.

Definicion: Probabilidad Empırica de un Evento A:

B

Probabilidad Teorica

De otro lado, podemos calcular la probabilidad teorica de un evento A. Sin embargo, primeronecesitamos definir el espacio muestral.

El espacio muestral, denotado con la letra S, es la lista de todos los posibles resultadosde un experimento. Los siguientes ejemplos ilustran el concepto de espacio muestral.

Experimento Espacio Muestral Tamano n(S)

Lanzamiento de unamoneda

S = {H,T} 2

Lanzamiento de undado corriente

S = {1, 2, 3, 4, 5, 6} 6

Seleccionar una bolade una urna con unabola roja, una azul yuna verde

S = {Rojo,Azul, V erde} 3

Diga cual es el espacio muestral S de los siguientes experimentos:

1. Lanzamiento de dos dados corrientes.

2. Seleccionar una carta de una baraja de poker.

Ejercicio: Espacio Muestral:

B

En todos los ejemplos anteriores los resultados (outcomes) en el espacio muestral sonigualmente probables. Un evento, denotado por letras A, B, etc, es un subconjunto del

c©2014 Prof. Pedro A. Torres Saavedra [email protected] Page 2 of 12

Page 3: Estad stica Aplicada I (ESMA3101) - UPRM

Notas de Clase - Estadıstica Aplicada I (Applied Statistics I ) (ESMA3101)

espacio muestral. Por ejemplo, en el lanzamiento de un dado, el evento A puede ser que elnumero que salga sea par. O simplemente, el evento B puede ser que el numero que salgasea 1.

Probabilidad teorica de un evento A =# de ocurrencias de A en S

# de elementos en S

En terminos algebraicos decimos

P (A) =n(A)

n(S),

donde n(A) es el numero de veces que el evento A ocurre.

Definicion: Probabilidad Teorica de un Evento A:

B

Suponga que lanzamos dos dados corrientes. Defina el evento A:=“Ambosresultados son iguales”. Calcule P (A).

Primero, el tamano del espacio muestral del experimento es n(S) = 36.Ahora, del total de 36 posibles resultados, solo seis resultados conforman el eventoA:

A = {(1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6)}.

Por lo tanto, P (A) = n(A)/n(S) = 6/36 = 1/6.

Ejemplo: Lanzamiento de dos dados corrientes:

§

Calcule la probabilidad teorica de los siguientes eventos en el lanzamiento de dosdados corrientes (ver espacio muestral en Figura 1):

1. A:=“Los resultados de los dos dados son menores que 4”.

2. B:=“Los resultados de los dos dados son differentes”.

3. C:=“La suma de los dos resultados es 7”.

4. D:=“La suma de los dos resultados es impar”.

Ejercicio: Lanzamiento de dos dados corrientes

B

c©2014 Prof. Pedro A. Torres Saavedra [email protected] Page 3 of 12

Page 4: Estad stica Aplicada I (ESMA3101) - UPRM

Notas de Clase - Estadıstica Aplicada I (Applied Statistics I ) (ESMA3101)

Figure 1: Espacio muestral en el lanzamiento de dos dados corrientes

Figure 2: Espacio muestral al seleccionar una carta de una baraja de poker

Diagramas Arbol

Una forma de encontrar el espacio muestral de un experimento y calcular probabilidadeses usando un diagrama de arbol. Para ilustrar el uso de un diagrama de arbol veamos elsiguiente ejemplo.

Determine el espacio muestral del experimento que consiste en el lanzamiento dedos monedas corrientes. Use un diagrama de arbol para representar el experimento.En este ejemple denotaremos el resultado cara con la letra H y cruz con la letra T .Abajo mostramos el diagrama de arbol para este ejemplo.

Ejemplo: Lanzamiento de dos monedas corrientes:

§

c©2014 Prof. Pedro A. Torres Saavedra [email protected] Page 4 of 12

Page 5: Estad stica Aplicada I (ESMA3101) - UPRM

Notas de Clase - Estadıstica Aplicada I (Applied Statistics I ) (ESMA3101)

Lanz. 1

T

T ⇒ P (T, T ) = 12· 12

= 14

12

H ⇒ P (T,H) = 12· 12

= 14

12

12

H

T ⇒ P (H,T ) = 12· 12

= 14

12

H ⇒ P (H,H) = 12· 12

= 14

12

12

Determine el espacio muestral del experimento que consiste en el lanzamiento deuna moneda y luego un dado corriente. Use un diagrama de arbol para representarel experimento y encontrar las probabilidades de todos los posibles eventos en elespacio muestral.

Ejercicio: Lanzamiento una moneda y un dado corrientes:

B

Propiedades de la Probabilidad

La probabilidad de un evento A siempre es un numero entre 0 y 1.

0 ≤ PE(A) ≤ 1, and 0 ≤ P (A) ≤ 1.

En particular, decimos que un evento A es imposible (no puede ocurrir) si P (A) = 0.Al contrario, decimos que un evento A es seguro de ocurrir (siempre ocurre) siP (A) = 1.

Propiedad 1

B

La suma de todos los posibles resultados del experimento es 1.∑Todos los resultados

PE(A) = 1, and∑

Todos los resultados

P (A) = 1.

Propiedad 2

B

c©2014 Prof. Pedro A. Torres Saavedra [email protected] Page 5 of 12

Page 6: Estad stica Aplicada I (ESMA3101) - UPRM

Notas de Clase - Estadıstica Aplicada I (Applied Statistics I ) (ESMA3101)

Ley (Debil) de los Grandes Numeros (Weak Law of Large Numbers-WLLN)

Si el numero de repeticiones n de un experimento incrementa, la ley de los grandes numerosdice que la probabilidad empırica de un evento A, PE(A) tiende a la probabilidad teorica delevento A, P (A).

Pror ejemplo, en el lanzamiento de una moneda corriente, la probabilidad teorica delevento H es P (H) = 0.5. Ahora, suponga que lanzamos la moneda n = 2, 5, 10, 100, 1000, . . .veces hasta un numero grande de lanzamientos. Cada vez que hacemos un experimentocon n lanzamientos calculamos PE(H). Es decir, el numero de H’s divido en el total delanzamientos n. Cuando n es grande, por ejemplo n = 5, 000 uno esperarıa que PE(H) esapproximadamente 1/2. Este resultado se ve claramente en la siguiente grafica. Note quela probabilidad empırica de H, PE(H) tiende a la probabilidad teorica de H, P (H) = 0.5,cuando el numero de lanzamientos es grande.

Figure 3: Ilustracion de la Ley (Debil) de los Grandes Numeros en el lanzamiento de unamoneda corriente (H = Cara)

0 1000 2000 3000 4000 5000

0.0

0.5

1.0

Ley (Débil) de los Grandes Números

Número de lanzamientos

P(H

)

Empírica Teórica

c©2014 Prof. Pedro A. Torres Saavedra [email protected] Page 6 of 12

Page 7: Estad stica Aplicada I (ESMA3101) - UPRM

Notas de Clase - Estadıstica Aplicada I (Applied Statistics I ) (ESMA3101)

Probabilidad Condicional de un Evento

En esta parte hablaremos de la probabilidad de un evento A condicionado a que un eventoB ya ha ocurrido. La forma de escribir la probabilidad de A dado B es P (A|B).

Suponga que el experimento consiste en lanzar dos dados corrientes. Calcule lassiguientes probabilidades condicionales:

1. La suma de los resultados sea siete dado que ambos resultados fueron numerospares.

2. Ambos resultados sean numeros pares dado que los resultados fueron iguales.

3. La suma de los resultados sea cinco dado que el maximo de los resultados esmenor o igual a cuatro.

Ejercicio: Probabilidad condicional en el lanzamiento de dos dados corrientes

B

Probabilidad Condicional y Tablas de Contingencia

El concepto de probabilidad condicional fue realmente introducido cuando hablamos detablas de contingencia. Recordemos que en las tablas de contingencia analizamos datos dedos variableas aleatorias cualitativas. Ası, los eventos en este caso corresponden a posiblescategorıas de las variables aleatorias en las filas o columnas de la tabla de contingencia.

Para ilustrar la relacion entre las tablas de contingencia y las probabilidades usemos losdatos del estudio de nutricion.

library(gmodels)

# Crea variables con otros nombres y define las categorıas

SEX=factor(SEX, levels=c(1,2), labels=c("M", "F"))

VITUSE=factor(VITUSE, levels=c(1,2,3), labels=c("Bastante", "Frec.", "No"))

CrossTable(SEX, VITUSE,

prop.chisq=FALSE, format="SPSS",

digits=1)

Cell Contents

|-------------------------|

| Count |

c©2014 Prof. Pedro A. Torres Saavedra [email protected] Page 7 of 12

Page 8: Estad stica Aplicada I (ESMA3101) - UPRM

Notas de Clase - Estadıstica Aplicada I (Applied Statistics I ) (ESMA3101)

| Row Percent |

| Column Percent |

| Total Percent |

|-------------------------|

Total Observations in Table: 315

| VITUSE

SEX | Bastante | Frec. | No | Row Total |

-------------|-----------|-----------|-----------|-----------|

M | 13 | 5 | 24 | 42 |

| 31.0% | 11.9% | 57.1% | 13.3% |

| 10.7% | 6.1% | 21.6% | |

| 4.1% | 1.6% | 7.6% | |

-------------|-----------|-----------|-----------|-----------|

F | 109 | 77 | 87 | 273 |

| 39.9% | 28.2% | 31.9% | 86.7% |

| 89.3% | 93.9% | 78.4% | |

| 34.6% | 24.4% | 27.6% | |

-------------|-----------|-----------|-----------|-----------|

Column Total | 122 | 82 | 111 | 315 |

| 38.7% | 26.0% | 35.2% | |

-------------|-----------|-----------|-----------|-----------|

Suponga que una persona es seleccionada aleatoriamente de entre los 315 individuos enla muestra. Halle las siguientes probabilidades:

1. Probabilidad de que el individuo seleccionado sea hombre dado que consume vitaminasfrecuentemente.

2. Probabilidad de que el individuo seleccionado no consuma vitaminas dado que es mujer.

Como ultimo comentario, podemos hablar de las probabilidades anteriores unicamentesi asumimos que hemos seleccionado aleatoriamente una persona del total de encuestados.Este supuesto de aleatoriedad es fundamental para referirnos a probabilidades de eventos.

Algunas Reglas de Probabilidad

1. Suponga que la probabilidad de A es igual a p, P (A) = p. Entonces la probabilidadde que no ocurra A (se dice el complemento de A y se denota como Ac) es igual aP (Ac) = 1− p.

c©2014 Prof. Pedro A. Torres Saavedra [email protected] Page 8 of 12

Page 9: Estad stica Aplicada I (ESMA3101) - UPRM

Notas de Clase - Estadıstica Aplicada I (Applied Statistics I ) (ESMA3101)

Si el reportero dle tiempo dice que la probabilidad de lluvia para hoy es de 75%,esto significa que la probabilidad de no lluvia es de 25%.

Ejemplo: Evento complementario

§

2. Dos eventos A y B son independientes si la ocurrencia de A no afecta la probabilidadde B, o viceversa. Si dos eventos A y B son independientes entonces P (A y B) =P (A) · P (B).

Suponga que lanzamos dos monedas corrientes. Calcule P (C1 y C2). Es decir, laprobabilidad de obtener cara en el primero y segundo lanzamiento de la moneda(equivalentement, en la primera y segunda moneda).

P (C1 y C2) = P (C1)P (C2|C1) = P (C1)P (C2) =1

2· 1

2=

1

4.

En este ejemplo tenemos que P (C2|C1) = P (C2) ya que lo ocurre con la primeramoneda no afecta el resultado o la probabilidad de la segunda moneda.

Ejemplo: Eventos Independientes

§

3. Dos eventos A y B son exclusivos si no pueden ocurrir al mismo tiempo. En estecaso, P (A y B) = 0. Una consecuencia de que los eventos sean exclusivos es que

P (A|B) = 0 y P (B|A) = 0.

Suponga que lanzamos dos dados corrientes. Defina A :=“La suma de los re-sultados es cinco” y B :=“Los dos resultados son iguales (dobles)”. EntoncesA = {(1, 4), (4, 1), (2, 3), (3, 2)} y B = {(1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6)}.Claramente, A y B no tienen elementos en comun. Por lo tanto, P (A y B) = 0.

Ejemplo: Eventos Mutuamente Exclusivos

§

4. Si dos eventos A y B son no son exclusivos entonces P (A o B) = P (A) + P (B) −P (A y B).

c©2014 Prof. Pedro A. Torres Saavedra [email protected] Page 9 of 12

Page 10: Estad stica Aplicada I (ESMA3101) - UPRM

Notas de Clase - Estadıstica Aplicada I (Applied Statistics I ) (ESMA3101)

Suponga que lanzamos dos dados corrientes. Defina A :=“La suma de los resul-tados es seis” y B :=“Los dos resultados son iguales (dobles)”. Entonces A ={(1, 5), (5, 1), (2, 4), (4, 2), (3, 3)} y B = {(1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6)}.Note que A y B = {(3, 3)}. Ası,

P (A o B) = P (A) + P (B)− P (A y B) =5

36+

6

36− 1

36=

10

36=

5

18.

Ejemplo

§

5. Si dos eventos A y B son exclusivos entonces P (A o B) = P (A) + P (B).

Reglas de Conteo

1. Suponga que tengo n elementos. El numero de formas distintas de ordenar estoselementos es igual a n · (n− 1) · · · 2 · 1 = n! formas (se lee n factorial).

¿De cuantas formas se pueden subir tres personas a una guagua? Si denotamos alas personas con las letras (A,B,C) entonces se pueden subir de 3! = 3 ·2 ·1 maneras:ABC, ACB, BCA, BAC, CAB, CBA.

Ejemplo

§

2. Suponga que tengo n elementos diferentes y quiero elegir k elementos. ¿De cuantasmaneras se puede hacer si el orden de la seleccion no importa? La respuesta es de(

n

k

)=

n!

(n− k)!k!

formas (el termino anterior se lee, n combinado k y se conoce como combinatoria).

Suponga que tengo cuatro candidatos a ocupar dos plazas vacantes para el mismoempleo. ¿De cuantas maneras se puede llenar las dos plazas?(

4

2

)=

4!

(4− 2)!2!=

4 · 3 · 2 · 1(2 · 1)(2 · 1)

= 6.

Si denotamos los cuatro candidatos con las letras (A,B,C,D) entonces estan las seisposibles formas de llenar las dos plazas vacantes: AB, AC, AD, BC, BD, CD.

Ejemplo

§

Tanto los factoriales como las combinatorias se pueden calcular en R.

c©2014 Prof. Pedro A. Torres Saavedra [email protected] Page 10 of 12

Page 11: Estad stica Aplicada I (ESMA3101) - UPRM

Notas de Clase - Estadıstica Aplicada I (Applied Statistics I ) (ESMA3101)

factorial(3)

## [1] 6

choose(4, 2)

## [1] 6

c©2014 Prof. Pedro A. Torres Saavedra [email protected] Page 11 of 12

Page 12: Estad stica Aplicada I (ESMA3101) - UPRM

Notas de Clase - Estadıstica Aplicada I (Applied Statistics I ) (ESMA3101)

Recursos Adicionales

• Secciones 5.1-5.5 del libro de texto.

c©2014 Prof. Pedro A. Torres Saavedra [email protected] Page 12 of 12