Download - Estad Uma 05b

Transcript
  • Bioestadstica. U. Mlaga.Tema 5: Modelos probabilsticos*BioestadsticaTema 5: Modelos probabilsticos

    Tema 5: Modelos probabilsticos

  • Tema 5: Modelos probabilsticos*Bioestadstica. U. Mlaga.Variable aleatoriaEl resultado de un experimento aleatorio puede ser descrito en ocasiones como una cantidad numrica.

    En estos casos aparece la nocin de variable aleatoriaFuncin que asigna a cada suceso un nmero.

    Las variables aleatorias pueden ser discretas o continuas (como en el primer tema del curso).

    En las siguientes transparencias vamos a recordar conceptos de temas anteriores, junto con su nueva designacin. Los nombres son nuevos. Los conceptos no.

    Tema 5: Modelos probabilsticos

  • Tema 5: Modelos probabilsticos*Bioestadstica. U. Mlaga.Funcin de probabilidad (V. Discretas)Asigna a cada posible valor de una variable discreta su probabilidad.Recuerda los conceptos de frecuencia relativa y diagrama de barras.EjemploNmero de caras al lanzar 3 monedas.

    Tema 5: Modelos probabilsticos

  • Tema 5: Modelos probabilsticos*Bioestadstica. U. Mlaga.Funcin de densidad (V. Continuas)DefinicinEs una funcin no negativa de integral 1.Pinsalo como la generalizacin del histograma con frecuencias relativas para variables continuas.

    Para qu lo voy a usar?Nunca lo vas a usar directamente.Sus valores no representan probabilidades.

    Tema 5: Modelos probabilsticos

  • Tema 5: Modelos probabilsticos*Bioestadstica. U. Mlaga.Para qu sirve la f. densidad?Muchos procesos aleatorios vienen descritos por variables de forma que son conocidas las probabilidades en intervalos.

    La integral definida de la funcin de densidad en dichos intervalos coincide con la probabilidad de los mismos.

    Es decir, identificamos la probabilidad de un intervalo con el rea bajo la funcin de densidad.

    Tema 5: Modelos probabilsticos

  • Tema 5: Modelos probabilsticos*Bioestadstica. U. Mlaga.Funcin de distribucinEs la funcin que asocia a cada valor de una variable, la probabilidad acumulada de los valores inferiores o iguales.

    Pinsalo como la generalizacin de las frecuencias acumuladas. Diagrama integral.

    A los valores extremadamente bajos les corresponden valores de la funcin de distribucin cercanos a cero.

    A los valores extremadamente altos les corresponden valores de la funcin de distribucin cercanos a uno.

    Lo encontraremos en los artculos y aplicaciones en forma de p-valor, significacin,No le deis ms importancia a este comentario ahora. Ya os ir sonando conforme avancemos.

    Tema 5: Modelos probabilsticos

  • Tema 5: Modelos probabilsticos*Bioestadstica. U. Mlaga.Para qu sirve la f. distribucin?Contrastar lo anmalo de una observacin concreta.

    S que una persona de altura 210cm es anmala porque la funcin de distribucin en 210 es muy alta.S que una persona adulta que mida menos de 140cm es anmala porque la funcin de distribucin es muy baja para 140cm.

    S que una persona que mida 170cm no posee una altura nada extraa pues su funcin de distribucin es aproximadamente 0,5.

    Relacinalo con la idea de cuantil.

    En otro contexto (contrastes de hiptesis) podremos observar unos resultados experimentales y contrastar lo anmalos que son en conjunto con respecto a una hiptesis de terminada.

    Intenta comprender la explicacin de clase si puedes. Si no, ignora esto de momento. Revisita este punto cuando hayamos visto el tema de contrastes de hiptesis.

    Tema 5: Modelos probabilsticos

  • Tema 5: Modelos probabilsticos*Bioestadstica. U. Mlaga.Valor esperado y varianza de una v.a. XValor esperado Se representa mediante E[X] Es el equivalente a la mediaMs detalles: Ver libro.

    VarianzaSe representa mediante VAR[X] o 2 Es el equivalente a la varianzaSe llama desviacin tpica a Ms detalles: Ver libro.

    Tema 5: Modelos probabilsticos

  • Tema 5: Modelos probabilsticos*Bioestadstica. U. Mlaga.Distribucin normal o de GaussAparece de manera natural:Errores de medida.Distancia de frenado. Altura, peso, propensin al crimenDistribuciones binomiales con n grande (n>30) y p ni pequeo (np>5) ni grande (nq>5).

    Est caracterizada por dos parmetros: La media, , y la desviacin tpica, .

    Su funcin de densidad es:

    Tema 5: Modelos probabilsticos

  • Tema 5: Modelos probabilsticos*Bioestadstica. U. Mlaga.N(, ): Interpretacin geomtricaPodis interpretar la media como un factor de traslacin.

    Y la desviacin tpica como un factor de escala, grado de dispersin,

    Tema 5: Modelos probabilsticos

  • Tema 5: Modelos probabilsticos*Bioestadstica. U. Mlaga.N(, ): Interpretacin probabilistaEntre la media y una desviacin tpica tenemos siempre la misma probabilidad: aprox. 68%

    Entre la media y dos desviaciones tpicas aprox. 95%

    Tema 5: Modelos probabilsticos

  • Tema 5: Modelos probabilsticos*Bioestadstica. U. Mlaga.Algunas caractersticasLa funcin de densidad es simtrica, mesocrtica y unimodal.Media, mediana y moda coinciden.

    Los puntos de inflexin de la fun. de densidad estn a distancia de .

    Si tomamos intervalos centrados en , y cuyos extremos estna distancia , tenemos probabilidad 68%a distancia 2 , tenemos probabilidad 95%a distancia 25 tenemos probabilidad 99%

    No es posible calcular la probabilidad de un intervalo simplemente usando la primitiva de la funcin de densidad, ya que no tiene primitiva expresable en trminos de funciones comunes.

    Todas las distribuciones normales N(, ), pueden ponerse mediante una traslacin , y un cambio de escala , como N(0,1). Esta distribucin especial se llama normal tipificada.Justifica la tcnica de tipificacin, cuando intentamos comparar individuos diferentes obtenidos de sendas poblaciones normales.

    Tema 5: Modelos probabilsticos

  • Tema 5: Modelos probabilsticos*Bioestadstica. U. Mlaga.TipificacinDada una variable de media y desviacin tpica , se denomina valor tipificado,z, de una observacin x, a la distancia (con signo) con respecto a la media, medido en desviaciones tpicas, es decir

    En el caso de variable X normal, la interpretacin es clara: Asigna a todo valor de N(, ), un valor de N(0,1) que deja exctamente la misma probabilidad por debajo.

    Nos permite as comparar entre dos valores de dos distribuciones normales diferentes, para saber cul de los dos es ms extremo.

    Tema 5: Modelos probabilsticos

  • Tema 5: Modelos probabilsticos*Bioestadstica. U. Mlaga.Tabla N(0,1)Z es normal tipificada.

    Calcular P[Z

  • Tema 5: Modelos probabilsticos*Bioestadstica. U. Mlaga.Tabla N(0,1)Z es normal tipificada.

    Calcular P[Z

  • Tema 5: Modelos probabilsticos*Bioestadstica. U. Mlaga.Tabla N(0,1)Z es normal tipificada.

    Calcular P[-0,54

  • Tema 5: Modelos probabilsticos*Bioestadstica. U. Mlaga.Ejemplo: Clculo con probabilidades normales

    El colesterol en la poblacin tiene distribucin normal, con media 200 y desviacin 10.

    Qu porcentaje de indivduos tiene colesterol inferior a 210?

    Qu valor del colesterol slo es superado por el 10% de los individuos.

    Tema 5: Modelos probabilsticos

  • Tema 5: Modelos probabilsticos*Bioestadstica. U. Mlaga.Todas las distribuciones normales son similares salvo traslacin y cambio de escala: Tipifiquemos.

    Tema 5: Modelos probabilsticos

  • Tema 5: Modelos probabilsticos*Bioestadstica. U. Mlaga.El valor del colesterol que slo supera el 10% de los individuos es el percentil 90. Calculemos el percentil 90 de la N(0,1) y deshacemos la tipificacin.

    Tema 5: Modelos probabilsticos

  • Tema 5: Modelos probabilsticos*Bioestadstica. U. Mlaga.Ejemplo: TipificacinSe quiere dar una beca a uno de dos estudiantes de sistemas educativos diferentes. Se asignar al que tenga mejor expediente acadmico.El estudiante A tiene una calificacin de 8 en un sistema donde la calificacin de los alumnos se comporta como N(6,1).El estudiante B tiene una calificacin de 80 en un sistema donde la calificacin de los alumnos se comporta como N(70,10).SolucinNo podemos comparar directamente 8 puntos de A frente a los 80 de B, pero como ambas poblaciones se comportan de modo normal, podemos tipificar y observar las puntuaciones sobre una distribucin de referencia N(0,1)

    Tema 5: Modelos probabilsticos

  • Tema 5: Modelos probabilsticos*Bioestadstica. U. Mlaga.Como ZA>ZB, podemos decir que el porcentaje de compaeros del mismo sistema de estudios que ha superado en calificacin el estudiante A es mayor que el que ha superado B.Podramos pensar en principio que A es mejor candidato para la beca.

    Tema 5: Modelos probabilsticos

  • Tema 5: Modelos probabilsticos*Bioestadstica. U. Mlaga.Por qu es importante la distribucin normal?Las propiedades que tiene la distribucin normal son interesantes, pero todava no hemos hablado de por qu es una distribucin especialmente importante.

    La razn es que aunque una v.a. no posea distribucin normal, ciertos estadsticos/estimadores calculados sobre muestras elegidas al azar s que poseen una distribucin normal.

    Es decir, tengan las distribucin que tengan nuestros datos, los objetos que resumen la informacin de una muestra, posiblemente tengan distribucin normal (o asociada).

    Tema 5: Modelos probabilsticos

  • Tema 5: Modelos probabilsticos*Bioestadstica. U. Mlaga.Aplic. de la normal: Estimacin en muestrasComo ilustracin mostramos una variable que presenta valores distribuidos de forma muy asimtrica. Claramente no normal.

    Saquemos muestras de diferentes tamaos, y usemos la media de cada muestra para estimar la media de la poblacin.

    Tema 5: Modelos probabilsticos

  • Tema 5: Modelos probabilsticos*Bioestadstica. U. Mlaga.Aplic. de la normal: Estimacin en muestrasCada muestra ofrece un resultado diferente: La media muestral es variable aleatoria.

    Su distribucin es ms parecida a la normal que la original.

    Tambin est menos dispersa. A su dispersin (desv. tpica del estimador media muestral os gusta el nombre largo?) se le suele denominar error tpico.

    Tema 5: Modelos probabilsticos

  • Tema 5: Modelos probabilsticos*Bioestadstica. U. Mlaga.Aplic. de la normal: Estimacin en muestrasAl aumentar el tamao, n, de la muestra:

    La normalidad de las estimaciones mejora

    El error tpico disminuye.

    Tema 5: Modelos probabilsticos

  • Tema 5: Modelos probabilsticos*Bioestadstica. U. Mlaga.Aplic. de la normal: Estimacin en muestrasPuedo garantizar medias muestrales tan cercanas como quiera a la verdadera media, sin ms que tomar n bastante grande

    Se utiliza esta propiedad para dimensionar el tamao de una muestra antes de empezar una investigacin.

    Tema 5: Modelos probabilsticos

  • Tema 5: Modelos probabilsticos*Bioestadstica. U. Mlaga.Resumen: Teorema del lmite centralDada una v.a. cualquiera, si extraemos muestras de tamao n, y calculamos los promedios muestrales, entonces:

    dichos promedios tienen distribucin aproximadamente normal;

    La media de los promedios muestrales es la misma que la de la variable original.

    La desviacin tpica de los promedios disminuye en un factor raz de n (error estndar).

    Las aproximaciones anteriores se hacen exactas cuando n tiende a infinito.

    Este teorema justifica la importancia de la distribucin normal.

    Sea lo que sea lo que midamos, cuando se promedie sobre una muestra grande (n>30) nos va a aparecer de manera natural la distribucin normal.

    Tema 5: Modelos probabilsticos

  • Tema 5: Modelos probabilsticos*Bioestadstica. U. Mlaga.Distribuciones asociadas a la normalCuando queramos hacer inferencia estadstica hemos visto que la distribucin normal aparece de forma casi inevitable.

    Dependiendo del problema, podemos encontrar otras (asociadas):X2 (chi cuadrado)t- studentF-Snedecor

    Estas distribuciones resultan directamente de operar con distribuciones normales. Tpicamente aparecen como distribuciones de ciertos estadsticos.

    Veamos algunas propiedades que tienen (superficialmente). Para ms detalles consultad el manual.

    Sobre todo nos interesa saber qu valores de dichas distribuciones son atpicos.Significacin, p-valores,

    Tema 5: Modelos probabilsticos

  • Tema 5: Modelos probabilsticos*Bioestadstica. U. Mlaga.Chi cuadradoTiene un slo parmetro denominado grados de libertad.

    La funcin de densidad es asimtrica positiva. Slo tienen densidad los valores positivos.

    La funcin de densidad se hace ms simtrica incluso casi gausiana cuando aumenta el nmero de grados de libertad.

    Normalmente consideraremos anmalos aquellos valores de la variable de la cola de la derecha.

    Tema 5: Modelos probabilsticos

  • Tema 5: Modelos probabilsticos*Bioestadstica. U. Mlaga.T de studentTiene un parmetro denominado grados de libertad.

    Cuando aumentan los grados de libertad, ms se acerca a N(0,1).

    Es simtrica con respecto al cero.

    Se consideran valores anmalos los que se alejan de cero (positivos o negativos).

    Tema 5: Modelos probabilsticos

  • Tema 5: Modelos probabilsticos*Bioestadstica. U. Mlaga.F de SnedecorTiene dos parmetros denominados grados de libertad.

    Slo toma valores positivos. Es asimtrica.

    Normalmente se consideran valores anmalos los de la cola de la derecha.

    Tema 5: Modelos probabilsticos

  • Tema 5: Modelos probabilsticos*Bioestadstica. U. Mlaga.Qu hemos visto?En v.a. hay conceptos equivalentes a los de temas anteriores Funcin de probabilidad Frec. Relativa.Funcin de densidad histogramaFuncin de distribucin diagr. Integral.Valor esperado media, Modelos de v.a. de especial importancia:NormalPropiedades geomtricasTipificacinAparece tanto en problemas con variables cualitativas (dicotmicas, Bernoulli) como numricasDistribuciones asociadasT-studentX2F de Snedecor

    Tema 5: Modelos probabilsticos

    ********************************