Ccw Bioestadistica Y EpidemiologíA
-
Upload
guest1c2eca -
Category
Economy & Finance
-
view
1.487 -
download
1
description
Transcript of Ccw Bioestadistica Y EpidemiologíA
Bioestadística y Epidemiología
Carla Lorena Castro WittingCarla Lorena Castro Witting
26 de Junio del 200926 de Junio del 2009
Estadísticas y Epidemiología
Estadísticas y epidemiologíaEstadísticas y epidemiología
En Epidemiología, la Estadística es, fundamentalmente, un conjunto de métodos para evaluar los datos obtenidos en poblaciones humanas.
La Estadística es una técnica para la cuantificación y medición de fenómenos inciertos.
Inferencia Estadística: Permite cuantificar el grado de certidumbre con el que se pueden establecer afirmaciones sobre los datos. Se obtienen conclusiones a partir de una información incompleta.
3
Variables Estadísticas
Variables
Tipos
Variables cualitativas o atributos: no se pueden medir numéricamente (por ejemplo: nacionalidad, color de la piel, sexo).
Variables cuantitativas: tienen valor numérico (edad, precio de un producto, ingresos anuales).
Variables cuantitativasVariables cuantitativas
Discretas◦ Sólo pueden tomar valores enteros (1, 2, 8,
-4, etc.). Por ejemplo: número de hermanos (puede ser 1, 2, 3....,etc, pero, por ejemplo, nunca podrá ser 3,45).
Continuas◦ Pueden tomar cualquier valor real dentro
de un intervalo. Por ejemplo, la velocidad de un vehículo puede ser 80,3 km/h, 94,57 km/h...etc.
Individuo◦ Cualquier elemento que aporte información sobre
el fenómeno que se estudia. Así, si estudiamos la altura de los niños de una clase, cada alumno es un individuo.
Población ◦ Conjunto de todos los individuos (personas, objetos, animales,
etc.) que porten información sobre el fenómeno que se estudia. Por ejemplo, si estudiamos el precio de la vivienda en una ciudad, la población será el total de las viviendas de dicha ciudad.
Muestra◦ Subconjunto que seleccionamos de la población. Así, si se estudia
el precio de la vivienda de una ciudad, lo normal será no recoger información sobre todas las viviendas de la ciudad (sería una labor muy compleja), sino que se suele seleccionar un subgrupo (muestra) que se entienda que es suficientemente representativo.
Conceptos a tomar en cuenta al estudiar el comportamiento de una variable.
Medidas de Posición
Medidas de Posición Medidas de Posición
Nos facilitan información sobre la serie de datos que estamos analizando
Clases◦ a) Medidas de posición central:
informan sobre los valores medios de la serie de datos.
◦ b) Medidas de posición no centrales: informan de como se distribuye el resto de los valores de la serie.
Medidas de posición central
Media Es el valor medio ponderado de la serie de
datos. Media aritmética Se calcula multiplicando cada valor por el número de veces
que se repite. La suma de todos estos productos se divide por el total de datos de la muestra
Media geométrica: Se eleva cada valor al número de veces que se ha repetido.
Se multiplican todo estos resultados y al producto final se le calcula la raíz "n" (siendo "n" el total de datos de la muestra).
MEDIANA Es el valor de la serie de datos que se sitúa
justamente en el centro de la muestra (un 50% de valores son inferiores y otro 50% son superiores).
No presentan el problema de estar influido por los valores extremos, pero en cambio no utiliza en su cálculo toda la información de la serie de datos (no pondera cada valor por el número de veces que se ha repetido).
MODAMODA Es el valor que más se repite en la muestra
Medidas de posición central
Medidas de posición no centralesMedidas de posición no centrales Permiten conocer otros puntos característicos de la
distribución que no son los valores centrales.
Entre otros indicadores, se suelen utilizar una serie de valores que dividen la muestra en tramos iguales:
◦ Cuartiles: son 3 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cuatro tramos iguales, en los que cada uno de ellos concentra el 25% de los resultados.
◦ Deciles: son 9 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en diez tramos iguales, en los que cada uno de ellos concentra el 10% de los resultados.
◦ Percentiles: son 99 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cien tramos iguales, en los que cada uno de ellos concentra el 1% de los resultados.
Medidas de Dispersión
Medidas de Dispersión
Estudia la distribución de los valores de la serie, analizando si estos se encuentran más o menos concentrados, o más o menos dispersos.
Existen diversas medidas de dispersión
Rango◦ Mide la amplitud de los valores de la muestra y se calcula
por diferencia entre el valor más elevado y el valor más bajo.
Varianza◦ Mide la distancia existente entre los valores de la serie y la
media. Se calcula como sumatorio de las diferencias al cuadrado entre cada valor y la media, multiplicadas por el número de veces que se ha repetido cada valor. El sumatorio obtenido se divide por el tamaño de la muestra.
Medidas de Dispersión
Varianza (Continuación)◦ La varianza siempre será mayor que cero.
Mientras más se aproxima a cero, más concentrados están los valores de la serie alrededor de la media. Por el contrario, mientras mayor sea la varianza, más dispersos están.
Desviación típica◦ Se calcula como raíz cuadrada de la varianza.
Coeficiente de variación de Pearson◦ Se calcula como cociente entre la desviación
típica y la media.
Coeficiente de Variación de Pearson
El coeficiente de variación es un porcentaje que permite comparar el nivel de dispersión de dos muestras. Esto no ocurre con la desviación típica, ya que viene expresada en las mismas unidas que los datos de la serie.
Por ejemplo, para comparar el nivel de dispersión de una serie de datos de la altura de los alumnos de una clase y otra serie con el peso de dichos alumnos, no se puede utilizar las desviaciones típicas (una viene expresada en cm y la otra en kg). En cambio, sus coeficientes de variación son ambos porcentajes, por lo que sí se pueden comparar.
Probabilidades
Rol de la aleatorización
Si el proceso de las enfermedades fuera determinístico, todas las variables relacionadas a la enfermedad podrían ser controladas y el resultado podría ser predicho con certeza.
Ante un estímulo externo, el resultado de este estímulo o la enfermedad sigue un proceso estocástico o aleatorio. La probabilidad es un factor importante en el análisis epidemiológico.
Los métodos cuantitativos usados actualmente en el análisis de datos de salud pública se basan en la teoría de probabilidades.
Conceptos
La probabilidad mide la frecuencia
con la que aparece un resultado deter-
minado cuando se realiza un experi-
mento.◦ Ejemplo: tiramos un dado al aire y queremos saber cual es
la probabilidad de que salga un 2, o que salga un número par, o que salga un número menor que 4.
El experimento tiene que ser aleatorio, es decir, que pueden presentarse diversos resultados, dentro de un conjunto posible de soluciones, y esto aún realizando el experimento en las mismas condiciones.
¿Cómo se mide la probabilidad?
Uno de los métodos más utilizados es aplicando la Regla de Laplace: ◦ Define la probabilidad de un suceso como el cociente
entre casos favorables y casos posibles.
◦ P(A) = Casos favorables / casos posibles
◦ Probabilidad de que al lanzar un dado salga un número par: en este caso los casos favorables son tres (que salga el dos, el cuatro o el seis), mientras que los casos posibles siguen siendo seis. Por lo tanto:
◦ P(A) = 3 / 6 = 0,50 (o lo que es lo mismo, 50%)
Reglas para su aplicación
a) El número de resultados posibles (sucesos) tiene que ser finito. ◦ Si hubiera infinitos resultados, al aplicar la regla "casos
favorables / casos posibles" el cociente siempre sería cero.
b) Todos los sucesos tienen que tener la misma probabilidad. ◦ Si al lanzar un dado, algunas caras tuvieran mayor
probabilidad de salir que otras, no podríamos aplicar esta regla.
Estudios Observacionales
Estudios Observacionales
Los Estudios epidemiológicos observacionales o no experimentales tienen por objeto definir la etiología de la enfermedad.
Los tipos más importantes son:1.Transversales2.Casos y Controles3.CohorteTransversales: También se les denomina de
prevalencia y dependiendo del número de poblaciones estudiadas pueden ser descriptivos (una población) o analíticos (comparación de dos o más poblaciones) .
En estos diseños se mide la causa y el efecto en un momento determinado por lo que su principal desventaja es la ambigüedad temporal.
23
Estudios Observacionales
Estudios de casos y controles: Son estudios análiticos y pueden ser retrospectivos o prospectivos. Se les utiliza en enfermedades poco frecuentes que tienen una latencia larga (cáncer en niños y adolescentes).
Estudios de cohorte: En Epidemiología, una cohorte es un conjunto de individuos de una población que comparten la experiencia, dentro de un determinado periodo temporal, de un mismo suceso. Normalmente se identifica con el grupo de nacidos en un determinado período, pero puede referirse a otro evento. Por ejemplo: la cohorte de personas que nacieron entre 1936y 1939, o también la cohorte de mujeres que tuvieron su primer hijo durante el feriado largo de Fiestas Patrias.
24
Características de Estudios Observacionales
Transversal Casos y Controles CohortePoblación definidaLa población en riesgo no Población en riesgo
definida está definida
Casos no selecciona- Casos seleccionados Casos noselecionados
dos por examen pobla por el investigador a partir pero evaluados me-
cional de una reserva disponible. diante seguimiento.
Los no casos incluyen Controles seleccionados Los individuos
individuos sin la enfer- por el investigador para control no seleccio-
medad en el momento que sean semejantes a nados evolucionan
de un único examen los casos en forma natural
poblacional
25
Características de Estudios ObservacionalesTransversal Casos y Controles Cohorte
La exposición se mide La exposición se mide, re- La exposición se
Y reconstruye después organiza o recoge después se mide antes del
Del desarrollo de la enf. del desarrollo de la enf. desarrollo de la enf.
El riesgo o la incidencia El riesgo o la incidencia de El riesgo o incidencia
De la enfermedad no la enfermedad no puede de la enfermedad y el
pueden medirse directa- medirse directamente riesgo relativo se mi-
mente. Den directamente
El riesgo relativo de la El riesgo relativo de la Se pueden estudiar
Exposición puede esti- exposición puede estimarse múltiples resultados
marse mediante razón mediante razón de momios finales (enfermeda-
de momios des) para cada una
de las exposiciones
Los no casos incluyen Controles seleccionados Los individuos
individuos sin la enfer- por el investigador para control no seleccio-
medad en el momento que sean semejantes a nados evolucionan
de un único examen los casos en forma natural
poblacional
26
Estadísticas Aplicadas a Ciencias de la Salud
Medidas de Medidas de Frecuencia deFrecuencia deenfermedadenfermedad
Medidas de Medidas de AsociaciónAsociación(de efecto)(de efecto)
Medidas de Medidas de ImpactoImpactoPotencialPotencial
Incidencia Prevalencia Medidas deDiferenciaAbsoluta
Medidas deDiferenciaRelativa o de Razón
(Riesgo Relativo)
MEDICIONES USADAS EN EPIDEMIOLOGIAMEDICIONES USADAS EN EPIDEMIOLOGIA
28
Impacto de relacionar la exposición sobre los expuestos
Impacto de Relacionar la exposición
en la población
• Incidencia Acumulada• Proporción de Incidencia
• Puntual• Periodo • Diferencia
de riesgo• Exceso de riesgo• Riesgos Atribuible
• Razón de Riesgo• Razón de Incidencia Acumulada
• Razón de tasas• Razón de Tasa de Incidencia
• Densidad de Incidencia• Tasa de Incidencia • Número
necesario a tratar
• Riesgo Atribuible• Exceso de Riesgo
• Riesgo Atribuible Poblacional
• Riesgo Atribuible Porcentual• Fracción Etiológica Porcentual
• Riesgo Atribuible Poblacional Porcentual• Fracción Atribuible Poblacional
• Odds Ratio• OR prevalencia
• Odds de Prevalencia
Medidas de frecuencia: Prevalencia
Número de casos existentes de una enfermedad.
Estima la carga de la enfermedadUsada en enfermedades crónicas o aquellas
de larga duraciónPeriodo de prevalencia: Una proporción
definida como:N° de casos existentes en una periodo de tiempos
especifico
Población en riesgo en el mismo periodo
Punto de prevalencia: Igual que el periodo, sólo que es en un punto en el tiempo
Medidas de frecuencia: Incidencia
Número de nuevos casos de una enfermedad en un periodo de tiempo específico.
Usada en enfermedades infecciosas o aquellas de corta duración.
Incidencia acumulada: Una proporción definida como: riesgo de enfermedad en una población. Una medida del riesgo para una población.
N° de nuevos casos en una población definida en un periodo de tiempo específico
Población en riesgo
Tasa de Ataque: Incidencia acumulada para un período corto de tiempo.
Tasa de densidad de incidencia: Definida como:N° de nuevos casos en una población definida en un periodo de tiempo
Total de tiempo que cada persona fue seguida u observada, sumado para todas las personas en la población de interés
Medidas de asociación
Útiles para evaluar la existencia de una relación entre la exposición a un factor de riesgo específico y el estatus de enfermedad.
Riesgo relativo (Razón de riesgo) (RR): Razón de tasas de ataque en grupos expuestos y no expuestos.◦ RR = 1 tasa igual en ambos grupos◦ RR>1 el expuesto es nás posible que enferme
◦ RR<1 el no expuesto es más posible que enferme
Medidas de asociación
Odds Ratio: Es el cociente entre la probabilidad de que un evento suceda y la probabilidad de que no suceda.
OR=1 si no hay asociación entre la presencia del factor y el evento.
OR>1 si la asociación es positiva, es decir si la presencia del factor se asocia a mayor ocurrencia del evento.
OR<1 si la asociación es negativa.
32
Medidas de asociación usadas en estudios de casos y controles
Razón de momios (Razón de Productos Cruzados, Odds Ratio) cuando las tasas de enfermedad no están disponibles. La razón de los momios u Odds Ratio de la exposición entre casos y controles.
Si la enfermedad es rara, la RM será similar al RR (si RM>1 indica que la relación de la enfermedad a la exposición es improbable que sea por azar).
Medidas de asociación usadas en Medidas de asociación usadas en estudios cohorteestudios cohorte
Diferencia de riesgo - diferencia en las tasas de ataque de los grupos expuestos y no expuestos se calcula para determinar si es significativamente diferente de cero ( no efecto).
Razón de riesgos - La razón de dos tasas de densidad de incidencia. Útiles cuando la información de tiempo-persona está disponible. Interpretación casi igual a RR.
Modelos estadísticos para evaluar relaciones
Regresión logística: Cuando resultados específicos por estratos no pueden ser explicados con una medida resumida simple. Se usa cuando el análisis estratificado deja a los datos muy dispersos.
En estudios de casos y controles, o transversales, la estimación de máxima probabilidad no tiene significado y no deberá ser usada. Razón de momios es la medida estadística más común del modelo de regresión logística.
Modelos estadísticos para para evaluar relaciones
Análisis de sobrevida - procedimiento de modelaje más popular en epidemiología. Usado para modelar el tiempo hasta que se presente un evento.
Análisis de tablas vitales - un procedimiento que produce un resumen de la experiencia de mortalidad en una población.
Vigilancia
Método usado para predecir eventos futuros. De importancia para monitoreo de epidemias o cambios en el proceso de enfermedad. El monitoreo permite rápida respuesta de salud pública a cambios en las tasas esperadas de enfermedad. Útil en la planificación de prevención de enfermedades.
Modelos matemáticos: Usados para patrones de datos recolectados en el tiempo. (datos de series de tiempo).
Una vez que los método de modelaje apropiados son determinados para trazar observaciones existentes, pueden ser usados para vigilar futuros valores de las series.
Vigilancia
Metodología de Box-Jenkings: orma univariable para modelaje de datos de series temporales. Incluye modelos que son también conocidos como modelos autoregresivos de promedio cambiante (ARIMA)
Estos modelos son utilizados para series mostrando estacionalidad (común en salud pública).
Gracias!