Probabilidades y Estadística 08

download Probabilidades y Estadística 08

of 5

Transcript of Probabilidades y Estadística 08

  • 7/31/2019 Probabilidades y Estadstica 08

    1/5

    Probabilidades y Estadstica (Computacin)Facultad de Ciencias Exactas y Naturales Universidad de Buenos AiresAna M. Bianco y Elena J. Martnez 2004

    81

    Generacin de Nmeros Aleatorios

    Nmeros elegidos al azar son tiles en diversas aplicaciones, entre las cules podemosmencionar:

    Simulacin o mtodos de Monte Carlo : se simula un proceso natural en formacomputacional. Estas aplicaciones se realizan en muy variados campos con el fin deemular distintos comportamientos: fsica (por ejemplo, para simular colisiones entrepartculas), ingeniera (diseo de obras hidrulicas, puentes, etc. ), inversiones decapital, redes, servicios a clientes, call centers, etc. La simulacin a travs de lacomputadora es una herramienta poderosa para comprender la naturaleza desistemas complejos.

    Muestreo : con el fin de seleccionar una submuestra de una poblacin.

    Anlisis Numrico : algunas tcnicas para resolver problemas de anlisis numricocomplejos han sido desarrolladas usando nmeros aleatorios.

    Programacin : la generacin de valores aleatorios puede ser til para poner aprueba la efectividad de un algoritmo. Tambin son tiles en criptologa.

    A pesar de que fue en la dcada del 40 que las primeras computadoras modernas fuerondesarrolladas, la simulacin ya exista en forma embrionaria an antes de que lacomputadora apareciera en escena. As, por ejemplo, en la segunda mitad del siglo XIX,se realizaban experiencias arrojando agujas al azar sobre una superficie reglada con el finde estimar el nmero . En 1908 W. S. Gosset, bajo el seudnimo de Student, realizaba

    un muestreo experimental con el fin de descubrir la distribucin de un estimador de lacorrelacin en una distribucin normal bivariada. En ese momento los nmeros aleatoriosse generaban mediante mtodos observacionales (mecanismos fsicos) tales como tirar un dado, extraer una carta de un mazo o mediante una ruleta.

    Dado el esfuerzo que significaba generar nmeros aleatorios cada vez que erannecesarios, parece razonable que se hayan construido tales nmeros y luego tabulado.Tippett (1927) public una tabla con 41600 nmeros aleatorios tomados en formaaleatoria de informes censales. Cada nmero era uno de los enteros 0, 1, 2, 3, 4, 5, 6, 7,8, 9 y el usuario tomaba varios de ellos y agregaba un punto decimal para formar unnmero aleatorio entre 0 y 1. Desde ese momento fueron propuestos una serie degeneradores de nmeros aleatorios. La primera mquina fue usada en 1939 por Kendall y

    Babington-Smith con el fin de producir una tabla de 100000 dgitos aleatorios y en 1955 laRAND Corporation utiliz extensamente una tabla de 1000000 dgitos aleatorios que fueobtenida a partir de una ruleta electrnica especialmente diseada. ERNIE fue unafamosa mquina de nmeros aleatorios que fue usada por la lotera britnica, es decir laBritish Premium Savings Bonds Lottery .

    Poco despus de la aparicin de las computadoras, se comenz a buscar maneraseficientes de obtener nmeros aleatorios, pues an cuando se podan usar las tablasexistentes ste era un recurso limitado, ya sea por el espacio de memoria necesario como

  • 7/31/2019 Probabilidades y Estadstica 08

    2/5

    Probabilidades y Estadstica (Computacin)Facultad de Ciencias Exactas y Naturales Universidad de Buenos AiresAna M. Bianco y Elena J. Martnez 2004

    82

    por resultar, en algunos casos, cortas. Si bien mquinas como ERNIE podran haber trabajado junto con una computadora, una solucin en la que la computadora provee todopareca ms satisfactoria. La bsqueda se orient, entonces, a la produccin de nmeros

    aleatorios usando operaciones aritmticas en una computadora. John von Neumannsugiri en un principio, alrededor de 1946, usar el mtodo del cuadrado medio. Su ideaera calcular el cuadrado del nmero aleatorio anterior y tomar los dgitos del medio delnmero calculado. As, por ejemplo, si queremos generar un nmero aleatorio de 10dgitos y el nmero anterior es

    5772156649 33317792380594909201

    el nuevo nmero ser 7923805949.

    La primera pregunta que cabe hacer es: porqu motivo un nmero generado por esteprocedimiento que es determinstico, va a resultar aleatorio?. La respuesta es que elnmero no es aleatorio, pero parece serlo, en el sentido en que en una aplicacin larelacin real entre un nmero y el siguiente no tiene ningn significado fsico. Por lo tanto,el carcter no aleatorio no es una caracterstica indeseable y podra ser que el cuadradomedio resultase ser un buen batido del nmero anterior. Es claro, de todas formas, queun mecanismo de esta naturaleza no podra haber reemplazado a ERNIE.

    Las secuencias de nmeros generadas en forma determinstica reciben el nombre desecuencias pseudo-aleatorias o quasi-aleatorias, si bien nosotros nos referiremos a ellascomo secuencias aleatorias, sobreentendiendo que slo parecen aleatorias. Nmerosaleatorios generados en forma determinstica en una computadora funcionan muy bien enmuchsimas aplicaciones, a condicin de que el mtodo de generacin sea bueno.

    Volviendo a la propuesta de von Neumann, sta no parece ser una buena fuente denmeros aleatorios. Podra suceder que la secuencia caiga en un ciclo corto derepeticiones, siendo el caso extremo el del cero el cual, si aparece en la secuencia,seguir repitindose siempre. A partir de los aos 50 se realizaron diversas experienciascon el mtodo propuesto por von Neumann. Trabajando con nmeros de 4 dgitos enlugar de 10, G. E. Forsythe prob con 16 nmeros iniciales. Con 12 de ellos termin conel ciclo 6100, 2100, 4100, 8100, 6100, etc. Y con otras dos termin en cero. En efecto,

    6100**2 = 372100002100**2 = 44100004100**2 = 168100008100**2 = 65610000

    Metrpolis realiz muchas pruebas con los nmeros del middle-square , en especial consistemas de nmeros binarios. Mostr que en secuencias de 20 dgitos, hay 13 ciclosdiferentes en los que la secuencia puede caer, el ms largo de los cuales tiene longitud

  • 7/31/2019 Probabilidades y Estadstica 08

    3/5

    Probabilidades y Estadstica (Computacin)Facultad de Ciencias Exactas y Naturales Universidad de Buenos AiresAna M. Bianco y Elena J. Martnez 2004

    83

    142. Estas falencias del middle-square son algunas de las consideraciones quedebemos hacer ante un generador de nmeros aleatorios.

    En principio consideraremos mtodos para generar nmeros con distribucin uniforme enel intervalo (0,1). sto podemos lograrlo generando enteros Xn entre 0 y un nmeronatural m y luego tomando la fraccin:

    m

    X U nn =

    Usualmente m es un nmero muy grande. El ms popular de los generadores de nmerosaleatorios es el Mtodo Lineal de Congruencias , que es un caso especial del mtodointroducido por Lehmer en 1949.

    Dados cuatro nmeros m, a, c y X0, formamos la secuencia de nmeros aleatorios X n dela siguiente forma

    0 ,mod )(1 ++ nmcaX X nn

    es decir que 1+n X es el resto entero de dividir caX n + por m (y por lo tanto es un enteroentre 0 y m-1). Esta es una secuencia lineal congruente. Tengamos en cuenta que

    m es el mdulo m>0a es el multiplicador 0 a

  • 7/31/2019 Probabilidades y Estadstica 08

    4/5

    Probabilidades y Estadstica (Computacin)Facultad de Ciencias Exactas y Naturales Universidad de Buenos AiresAna M. Bianco y Elena J. Martnez 2004

    84

    Como ya observamos ms arriba, con estos algoritmos se generan nmeros aleatoriosque se comportan como si proviniesen de una distribucin U(0,1). La pregunta que es

    razonable hacerse es porqu sto es suficiente. El siguiente teorema nos da unarespuesta.

    Teorema: Sean U una variable aleatoria con distribucin )1,0(U y G una funcin dedistribucin acumulada continua y estrictamente creciente. Si )(1 U G X = , entonces lafuncin de distribucin acumulada de X es G , es decir .G F X =

    Dem:

    Recordemos que si )1,0(~ U U , entonces su funcin de distribucin es de la forma

    =

    0si 1

    0si 0

    )(

    xe

    x

    x F x

    X

    Dado)1,0(

    y, la inversa de

    X F es

    )1ln(1

    )(1 y y F X =

    Luego, si )1,0(~ U U ,

    )(~)1ln(1

    E U

  • 7/31/2019 Probabilidades y Estadstica 08

    5/5

    Probabilidades y Estadstica (Computacin)Facultad de Ciencias Exactas y Naturales Universidad de Buenos AiresAna M. Bianco y Elena J. Martnez 2004

    85

    Si la distribucin G tiene saltos o es constante de a trozos, no existir su inversa. Sinembargo se puede demostrar que existe una H con las propiedades requeridas en el

    teorema anterior, de manera que, aunque sin demostracin, enunciaremos el siguienteresultado.

    Teorema: Sean U una variable aleatoria con distribucin )1,0(U y G una funcin dedistribucin acumulada. Existe una funcin H tal que )(U H tiene distribucin acumuladaG .

    Ejemplos: Queremos generar una variable con distribucin de Bernoulli de parmetro p apartir de una v.a. uniforme. Podemos aplicar el siguiente procedimiento. Generamos

    )1,0(~ U U y definimos: