Ccw Bioestadistica Y EpidemiologíA

Bioestadística y Epidemiología

Carla Lorena Castro WittingCarla Lorena Castro Witting

26 de Junio del 200926 de Junio del 2009

Estadísticas y Epidemiología

Estadísticas y epidemiologíaEstadísticas y epidemiología

En Epidemiología, la Estadística es, fundamentalmente, un conjunto de métodos para evaluar los datos obtenidos en poblaciones humanas.

La Estadística es una técnica para la cuantificación y medición de fenómenos inciertos.

Inferencia Estadística: Permite cuantificar el grado de certidumbre con el que se pueden establecer afirmaciones sobre los datos. Se obtienen conclusiones a partir de una información incompleta.

3

Variables Estadísticas

Variables

Tipos

Variables cualitativas o atributos: no se pueden medir numéricamente (por ejemplo: nacionalidad, color de la piel, sexo).

Variables cuantitativas: tienen valor numérico (edad, precio de un producto, ingresos anuales).

Variables cuantitativasVariables cuantitativas

Discretas◦ Sólo pueden tomar valores enteros (1, 2, 8,

-4, etc.). Por ejemplo: número de hermanos (puede ser 1, 2, 3....,etc, pero, por ejemplo, nunca podrá ser 3,45).

Continuas◦ Pueden tomar cualquier valor real dentro

de un intervalo. Por ejemplo, la velocidad de un vehículo puede ser 80,3 km/h, 94,57 km/h...etc.

Individuo◦ Cualquier elemento que aporte información sobre

el fenómeno que se estudia. Así, si estudiamos la altura de los niños de una clase, cada alumno es un individuo.

Población ◦ Conjunto de todos los individuos (personas, objetos, animales,

etc.) que porten información sobre el fenómeno que se estudia. Por ejemplo, si estudiamos el precio de la vivienda en una ciudad, la población será el total de las viviendas de dicha ciudad.

Muestra◦ Subconjunto que seleccionamos de la población. Así, si se estudia

el precio de la vivienda de una ciudad, lo normal será no recoger información sobre todas las viviendas de la ciudad (sería una labor muy compleja), sino que se suele seleccionar un subgrupo (muestra) que se entienda que es suficientemente representativo.

Conceptos a tomar en cuenta al estudiar el comportamiento de una variable.

Medidas de Posición

Medidas de Posición Medidas de Posición

Nos facilitan información sobre la serie de datos que estamos analizando

Clases◦ a) Medidas de posición central:

informan sobre los valores medios de la serie de datos.

◦ b) Medidas de posición no centrales: informan de como se distribuye el resto de los valores de la serie.

Medidas de posición central

Media Es el valor medio ponderado de la serie de

datos. Media aritmética Se calcula multiplicando cada valor por el número de veces

que se repite. La suma de todos estos productos se divide por el total de datos de la muestra

Media geométrica: Se eleva cada valor al número de veces que se ha repetido.

Se multiplican todo estos resultados y al producto final se le calcula la raíz "n" (siendo "n" el total de datos de la muestra).

MEDIANA Es el valor de la serie de datos que se sitúa

justamente en el centro de la muestra (un 50% de valores son inferiores y otro 50% son superiores).

No presentan el problema de estar influido por los valores extremos, pero en cambio no utiliza en su cálculo toda la información de la serie de datos (no pondera cada valor por el número de veces que se ha repetido).

MODAMODA Es el valor que más se repite en la muestra

Medidas de posición central

Medidas de posición no centralesMedidas de posición no centrales Permiten conocer otros puntos característicos de la

distribución que no son los valores centrales.

Entre otros indicadores, se suelen utilizar una serie de valores que dividen la muestra en tramos iguales:

◦ Cuartiles: son 3 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cuatro tramos iguales, en los que cada uno de ellos concentra el 25% de los resultados.

◦ Deciles: son 9 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en diez tramos iguales, en los que cada uno de ellos concentra el 10% de los resultados.

◦ Percentiles: son 99 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cien tramos iguales, en los que cada uno de ellos concentra el 1% de los resultados.

Medidas de Dispersión


Estudia la distribución de los valores de la serie, analizando si estos se encuentran más o menos concentrados, o más o menos dispersos.

Existen diversas medidas de dispersión

Rango◦ Mide la amplitud de los valores de la muestra y se calcula

por diferencia entre el valor más elevado y el valor más bajo.

Varianza◦ Mide la distancia existente entre los valores de la serie y la

media. Se calcula como sumatorio de las diferencias al cuadrado entre cada valor y la media, multiplicadas por el número de veces que se ha repetido cada valor. El sumatorio obtenido se divide por el tamaño de la muestra.


Varianza (Continuación)◦ La varianza siempre será mayor que cero.

Mientras más se aproxima a cero, más concentrados están los valores de la serie alrededor de la media. Por el contrario, mientras mayor sea la varianza, más dispersos están.

Desviación típica◦ Se calcula como raíz cuadrada de la varianza.

Coeficiente de variación de Pearson◦ Se calcula como cociente entre la desviación

típica y la media.

Coeficiente de Variación de Pearson

El coeficiente de variación es un porcentaje que permite comparar el nivel de dispersión de dos muestras. Esto no ocurre con la desviación típica, ya que viene expresada en las mismas unidas que los datos de la serie.

Por ejemplo, para comparar el nivel de dispersión de una serie de datos de la altura de los alumnos de una clase y otra serie con el peso de dichos alumnos, no se puede utilizar las desviaciones típicas (una viene expresada en cm y la otra en kg). En cambio, sus coeficientes de variación son ambos porcentajes, por lo que sí se pueden comparar.

Probabilidades

Rol de la aleatorización

Si el proceso de las enfermedades fuera determinístico, todas las variables relacionadas a la enfermedad podrían ser controladas y el resultado podría ser predicho con certeza.

Ante un estímulo externo, el resultado de este estímulo o la enfermedad sigue un proceso estocástico o aleatorio. La probabilidad es un factor importante en el análisis epidemiológico.

Los métodos cuantitativos usados actualmente en el análisis de datos de salud pública se basan en la teoría de probabilidades.

Conceptos

La probabilidad mide la frecuencia

con la que aparece un resultado deter-

minado cuando se realiza un experi-

mento.◦ Ejemplo: tiramos un dado al aire y queremos saber cual es

la probabilidad de que salga un 2, o que salga un número par, o que salga un número menor que 4.

El experimento tiene que ser aleatorio, es decir, que pueden presentarse diversos resultados, dentro de un conjunto posible de soluciones, y esto aún realizando el experimento en las mismas condiciones.

¿Cómo se mide la probabilidad?

Uno de los métodos más utilizados es aplicando la Regla de Laplace: ◦ Define la probabilidad de un suceso como el cociente

entre casos favorables y casos posibles.

◦ P(A) = Casos favorables / casos posibles

◦ Probabilidad de que al lanzar un dado salga un número par: en este caso los casos favorables son tres (que salga el dos, el cuatro o el seis), mientras que los casos posibles siguen siendo seis. Por lo tanto:

◦ P(A) = 3 / 6 = 0,50 (o lo que es lo mismo, 50%)

Reglas para su aplicación

a) El número de resultados posibles (sucesos) tiene que ser finito. ◦ Si hubiera infinitos resultados, al aplicar la regla "casos

favorables / casos posibles" el cociente siempre sería cero.

b) Todos los sucesos tienen que tener la misma probabilidad. ◦ Si al lanzar un dado, algunas caras tuvieran mayor

probabilidad de salir que otras, no podríamos aplicar esta regla.

Estudios Observacionales


Los Estudios epidemiológicos observacionales o no experimentales tienen por objeto definir la etiología de la enfermedad.

Los tipos más importantes son:1.Transversales2.Casos y Controles3.CohorteTransversales: También se les denomina de

prevalencia y dependiendo del número de poblaciones estudiadas pueden ser descriptivos (una población) o analíticos (comparación de dos o más poblaciones) .

En estos diseños se mide la causa y el efecto en un momento determinado por lo que su principal desventaja es la ambigüedad temporal.

23


Estudios de casos y controles: Son estudios análiticos y pueden ser retrospectivos o prospectivos. Se les utiliza en enfermedades poco frecuentes que tienen una latencia larga (cáncer en niños y adolescentes).

Estudios de cohorte: En Epidemiología, una cohorte es un conjunto de individuos de una población que comparten la experiencia, dentro de un determinado periodo temporal, de un mismo suceso. Normalmente se identifica con el grupo de nacidos en un determinado período, pero puede referirse a otro evento. Por ejemplo: la cohorte de personas que nacieron entre 1936y 1939, o también la cohorte de mujeres que tuvieron su primer hijo durante el feriado largo de Fiestas Patrias.

24

Características de Estudios Observacionales

Transversal Casos y Controles CohortePoblación definidaLa población en riesgo no Población en riesgo

definida está definida

Casos no selecciona- Casos seleccionados Casos noselecionados

dos por examen pobla por el investigador a partir pero evaluados me-

cional de una reserva disponible. diante seguimiento.

Los no casos incluyen Controles seleccionados Los individuos

individuos sin la enfer- por el investigador para control no seleccio-

medad en el momento que sean semejantes a nados evolucionan

de un único examen los casos en forma natural

poblacional

25

Características de Estudios ObservacionalesTransversal Casos y Controles Cohorte

La exposición se mide La exposición se mide, re- La exposición se

Y reconstruye después organiza o recoge después se mide antes del

Del desarrollo de la enf. del desarrollo de la enf. desarrollo de la enf.

El riesgo o la incidencia El riesgo o la incidencia de El riesgo o incidencia

De la enfermedad no la enfermedad no puede de la enfermedad y el

pueden medirse directa- medirse directamente riesgo relativo se mi-

mente. Den directamente

El riesgo relativo de la El riesgo relativo de la Se pueden estudiar

Exposición puede esti- exposición puede estimarse múltiples resultados

marse mediante razón mediante razón de momios finales (enfermeda-

de momios des) para cada una

de las exposiciones

Los no casos incluyen Controles seleccionados Los individuos

individuos sin la enfer- por el investigador para control no seleccio-

medad en el momento que sean semejantes a nados evolucionan

de un único examen los casos en forma natural

poblacional

26

Estadísticas Aplicadas a Ciencias de la Salud

Medidas de Medidas de Frecuencia deFrecuencia deenfermedadenfermedad

Medidas de Medidas de AsociaciónAsociación(de efecto)(de efecto)

Medidas de Medidas de ImpactoImpactoPotencialPotencial

Incidencia Prevalencia Medidas deDiferenciaAbsoluta

Medidas deDiferenciaRelativa o de Razón

(Riesgo Relativo)

MEDICIONES USADAS EN EPIDEMIOLOGIAMEDICIONES USADAS EN EPIDEMIOLOGIA

28

Impacto de relacionar la exposición sobre los expuestos

Impacto de Relacionar la exposición

en la población

• Incidencia Acumulada• Proporción de Incidencia

• Puntual• Periodo • Diferencia

de riesgo• Exceso de riesgo• Riesgos Atribuible

• Razón de Riesgo• Razón de Incidencia Acumulada

• Razón de tasas• Razón de Tasa de Incidencia

• Densidad de Incidencia• Tasa de Incidencia • Número

necesario a tratar

• Riesgo Atribuible• Exceso de Riesgo

• Riesgo Atribuible Poblacional

• Riesgo Atribuible Porcentual• Fracción Etiológica Porcentual

• Riesgo Atribuible Poblacional Porcentual• Fracción Atribuible Poblacional

• Odds Ratio• OR prevalencia

• Odds de Prevalencia

Medidas de frecuencia: Prevalencia

Número de casos existentes de una enfermedad.

Estima la carga de la enfermedadUsada en enfermedades crónicas o aquellas

de larga duraciónPeriodo de prevalencia: Una proporción

definida como:N° de casos existentes en una periodo de tiempos

especifico

Población en riesgo en el mismo periodo

Punto de prevalencia: Igual que el periodo, sólo que es en un punto en el tiempo

Medidas de frecuencia: Incidencia

Número de nuevos casos de una enfermedad en un periodo de tiempo específico.

Usada en enfermedades infecciosas o aquellas de corta duración.

Incidencia acumulada: Una proporción definida como: riesgo de enfermedad en una población. Una medida del riesgo para una población.

N° de nuevos casos en una población definida en un periodo de tiempo específico

Población en riesgo

Tasa de Ataque: Incidencia acumulada para un período corto de tiempo.

Tasa de densidad de incidencia: Definida como:N° de nuevos casos en una población definida en un periodo de tiempo

Total de tiempo que cada persona fue seguida u observada, sumado para todas las personas en la población de interés

Medidas de asociación

Útiles para evaluar la existencia de una relación entre la exposición a un factor de riesgo específico y el estatus de enfermedad.

Riesgo relativo (Razón de riesgo) (RR): Razón de tasas de ataque en grupos expuestos y no expuestos.◦ RR = 1 tasa igual en ambos grupos◦ RR>1 el expuesto es nás posible que enferme

◦ RR<1 el no expuesto es más posible que enferme

Medidas de asociación

Odds Ratio: Es el cociente entre la probabilidad de que un evento suceda y la probabilidad de que no suceda.

OR=1 si no hay asociación entre la presencia del factor y el evento.

OR>1 si la asociación es positiva, es decir si la presencia del factor se asocia a mayor ocurrencia del evento.

OR<1 si la asociación es negativa.

32

Medidas de asociación usadas en estudios de casos y controles

Razón de momios (Razón de Productos Cruzados, Odds Ratio) cuando las tasas de enfermedad no están disponibles. La razón de los momios u Odds Ratio de la exposición entre casos y controles.

Si la enfermedad es rara, la RM será similar al RR (si RM>1 indica que la relación de la enfermedad a la exposición es improbable que sea por azar).

Medidas de asociación usadas en Medidas de asociación usadas en estudios cohorteestudios cohorte

Diferencia de riesgo - diferencia en las tasas de ataque de los grupos expuestos y no expuestos se calcula para determinar si es significativamente diferente de cero ( no efecto).

Razón de riesgos - La razón de dos tasas de densidad de incidencia. Útiles cuando la información de tiempo-persona está disponible. Interpretación casi igual a RR.

Modelos estadísticos para evaluar relaciones

Regresión logística: Cuando resultados específicos por estratos no pueden ser explicados con una medida resumida simple. Se usa cuando el análisis estratificado deja a los datos muy dispersos.

En estudios de casos y controles, o transversales, la estimación de máxima probabilidad no tiene significado y no deberá ser usada. Razón de momios es la medida estadística más común del modelo de regresión logística.

Modelos estadísticos para para evaluar relaciones

Análisis de sobrevida - procedimiento de modelaje más popular en epidemiología. Usado para modelar el tiempo hasta que se presente un evento.

Análisis de tablas vitales - un procedimiento que produce un resumen de la experiencia de mortalidad en una población.

Vigilancia

Método usado para predecir eventos futuros. De importancia para monitoreo de epidemias o cambios en el proceso de enfermedad. El monitoreo permite rápida respuesta de salud pública a cambios en las tasas esperadas de enfermedad. Útil en la planificación de prevención de enfermedades.

Modelos matemáticos: Usados para patrones de datos recolectados en el tiempo. (datos de series de tiempo).

Una vez que los método de modelaje apropiados son determinados para trazar observaciones existentes, pueden ser usados para vigilar futuros valores de las series.

Vigilancia

Metodología de Box-Jenkings: orma univariable para modelaje de datos de series temporales. Incluye modelos que son también conocidos como modelos autoregresivos de promedio cambiante (ARIMA)

Estos modelos son utilizados para series mostrando estacionalidad (común en salud pública).

Gracias!

Ccw Bioestadistica Y EpidemiologíA

Economy & Finance

Transcript of Ccw Bioestadistica Y EpidemiologíA