Analisis de Replicas (1)

25
1 Recordando la Estadística

description

asdas

Transcript of Analisis de Replicas (1)

  • *Recordando la Estadstica

  • *Recordando la EstadsticaPoblacin:Es la recoleccin completa de todas las observaciones de inters para el investigadorParmetro:Es una medida descriptiva de la poblacin total de todas las observaciones de inters para el investigador.Muestra:Es una parte representativa de la poblacin que se selecciona para ser estudiadaEstadstico:Elemento que describe una muestra y sirve como una estimacin del parmetro de la poblacinVariable:Es una caracterstica de la poblacin que se esta analizando en un estudio estadstico.

  • *Medidas de Tendencia CentralLa media:Es la medida de tendencia central que normalmente es considerada como el promedio.Si tenemos 56, 67, 52, 45, 67, la media se calcula as:

  • *Medidas de Tendencia CentralLa mediana:La mitad de las observaciones estar por debajo de ella y la otra mitad por encima.

    Posicin de la mediana = =

    Para los datos ordenados, la mediana es 56 (la tercera posicin).Si tenemos: 35, 45, 52, 56, 67 y 67. (n es par), promediamos los dos valores medios (52 + 56)/2 = 54

  • *Medidas de Tendencia CentralLa moda:Observacin que ocurre con mayor frecuencia.Si tenemos 35, 45, 52, 56, 67, 67, la moda es 67Si agregramos una observacin adicional de 56, el conjunto de datos seria bimodal, con modas 56 y 67.

  • *Medidas de DispersinMiden que tanto se dispersan las observaciones alrededor de su media.El rango:Es la diferencia entre la observacin mas alta y mas baja. Su desventaja es que considera solo dos observaciones del total de observaciones.

  • *Medidas de DispersinLa Varianza:Es el promedio de las desviaciones respecto a su media elevadas al cuadradoVarianza poblacional:

    Varianza de una muestra:

  • *Medidas de DispersinLa Varianza:Si tenemos: 87, 120, 54, 92, 73, 80 y 63

    La media de los valores observados es de 81.29, contendencia a variar por arriba o debajo de dicha media en21.58

  • *Intervalos de ConfianzaEl teorema del limite central asume que el resultado de tendr una distribucin normal.Supongamos que la simulacin se esta utilizando para analizar las demoras en un proceso de produccin.Cada replica independiente del modelo produce una respuesta potencial de la distribucin de todas las posibles demoras. Una sola salida, produce solo una muestra de la distribucin.

  • *Intervalos de ConfianzaAsumamos 100 puntos estimados del promedio de demora en un proceso esta normalmente distribuido con una media de 40 y una desviacin estndar de 12. Cien muestras de esta distribucin pueden ser distribuidas como siguen

  • *Intervalos de Confianza

  • *Intervalos de ConfianzaLos principios de inferencia estadstica, nos permiten hacer estimaciones de una media verdadera y una varianza 2 Suponga que los siguientes valores son aleatoriamente seleccionados de la distribucin mostrada en el grfico anterior: 26, 31, 38, 49, 50 y 58.Un punto estimado de es designado como: La varianza de la distribucin es aproximada como:

  • *Intervalos de ConfianzaComo la cantidad de datos (n=6) es menor que 30, usamos un valor t de una distribucin t, para construir el intervalo de confianza para el punto estimado , un intervalo de confianza nos dice con que certeza (90%), el parmetro de la media verdadera esta contenida dentro de nuestro intervalo calculado.Usamos = 10%Un 90% de certeza

  • *Media Muestral vs. Verdadera= 40MediaMuestralMediaPoblacional_X = 42

  • *Intervalos de ConfianzaQue son?Un intervalo, expresado en el formato (min, max), el cual provee un estimado realista del valor verdadero de un parmetro del sistema particular tal como el ciclo de tiempo o el promedio diario de atenciones.La longitud del intervalo depende del tamao n de la muestra. Los niveles tpicos son: 90%, 95% y 99%.

  • *Intervalos de Confianza

  • *Intervalos de ConfianzaEl principio del intervalo de confianza puede ser demostrado utilizando los nmeros descritos en la distribucin normal anterior.El siguiente ejercicio ilustra esta explicacin.Coloque los nmeros de la distribucin normal en 100 papeles pequeos.Ponga los papeles en un contenedor.Busque en el contenedor y extraiga seis papeles.Registre el nmero mostrado en cada papel seleccionado.Calcule un intervalo de confianza a un 90%, para los seis valores obtenidos.Retorne todos los papeles al contenedor.

  • *Intervalos de ConfianzaSi ejecutamos los pasos tres al seis, 100 veces, podemos esperar que 90 de los intervalos de confianza calculados, contienen el parmetro de la media verdadera ( = 40 en este ejemplo).Desarrollar el siguiente ejemplo y verifique los resultados para 10 repeticiones.

  • *Intervalos de Confianza

    Exp.Valores SeleccionadosIntervaloIntervalo contiene a = 40?12345678910

  • *Nmero de RplicasUn mtodo esencial para mejorar la confiabilidad de los resultados es ejecutar mltiples replicas independientes de la simulacin.Los resultados de mltiples rplicas del modelo deben ser analizados con principios de inferencia estadstica para realizar conclusiones validas.El ejm. anterior puede ser usado para demostrar el nivel de confianza asociado al numero de replicas necesarias para asegurar la exactitud de (un punto estimado de ) con respecto a la media verdadera de la distribucin

  • *Nmero de RplicasLa simulacin usa el principio RIRO

  • *Nmero de RplicasLa ecuacin para conocer el numero de replicas necesarias es: Donde:N:Numero de replicas necesarias para lograr un nivel de exactitud deseadoS(n):Es un punto estimado de , basado en n replicas del modelo.e:Denota la cantidad de error entre la media estimada y t: Valor critico de la tabla t

  • *Nmero de RplicasDeseamos conocer cuantas replicas del modelo deben ser realizadas para tener un 90% de confianza que nuestra media estimada no varia de la media verdadera por mas de 9 das.

  • *Nmero de RplicasEstimamos el valor de , seleccionando aleatoriamente seis valores de la distribucin (en la simulacin esto equivale a realizar 6 replicas independientes del modelo)Si los valores seleccionados son 26, 31, 38, 49, 50 y 58El estimado de la desviacin estndar es 12.3Insertando estos valores en la ecuacin anterior, esto nos da N=8.Implica que si aleatoriamente seleccionamos 8 muestras de la distribucin y calculamos un valor de Podemos esperar que aproximadamente 90 veces de un total de 100, el valor de no variara de la media verdadera = 40, por mas de 9 das, verificar estos resultados en la siguiente tabla.

  • *Nmero de Rplicasverificar los resultados anteriores en la siguiente tabla:

    exp.Valores SeleccionadosDentro del limite 9?( = 40)12345678910

    **************Cuando analizamos la informacin estadstica de los resultados obtenidos por la simulacin (puede ser costos, tiempos de ciclo, cantidad de clientes insatisfechos, cantidad de solicitudes denegadas, entre otros), debemos estar consientes de que obtendremos un promedio muestral (resultante de ejecutar el modelo) y de que existe otro promedio verdadero, el cual, posiblemente, nunca lleguemos a conocer.El hecho de que no conoscamos el valor exacto de la media verdadera no implica que no podamos establecer el intervalo en el cual se define su valor y compararlo con respecto a la media muestral.

    Notas:

    *No conocemos la distribucin de probabilidad que representa todos los resultados obtenidos por el modelo de simulacin. Sin embargo, podemos estimar la media verdadera de la distribucin, tomando muestras aleatorias de la distribucin (producidas por las rplicas). Con esta informacin, podemos usar una funcin normal estandar para definir los intervalos de confianza para puntos estimados de la media.

    Adems podemos especificar los niveles de confianza, por ejemplo un nivel de confianza del 90% significa que hay una probabilidad de 10% de que un intervalo calculado no contenga el parmetro de la media verdadera.*Como explicamos anteriormente, le tener un intervalo de confianza hace que tengamos una cierta probabilidad de que el intervalo calculado no contenga el parmetro de la media verdadera.

    Puede apreciar en el grfico superior un nivel de confianza del 95% y el rango posible para dicho intervalo. Note que si el nivel de confianza sube, digamos a un 99%, el intervalo calculado ser mas pequeo.

    *****La simulacin usa datos de entrada que son aleatorios para reflejar la incertidumbre de los sistemas modelados, del mismo modo, los datos obtenidos como resultados de la simulacin son tambin aleatorios.

    Notas:

    ****