01,.+&0+2)/*#0.).revista.asomigua.org/wp-content/uploads/2018/07/re... ·...

5
REVISTA DE MEDICINA INTERNA DE GUATEMALA ASOCIACIÓN DE MEDICINA INTERNA DE GUATEMALA REVISTA DE MEDICINA INTERNA DE GUATEMALA ASOCIACIÓN DE MEDICINA INTERNA DE GUATEMALA Pag. 37 Introducción a las pruebas de hipótesis André Chocó Introducción Las pruebas de hipótesis junto a los intervalos de confianza constituyen dos enfoques fundamentales de la inferencia estadística, es decir a ese proceso de estudiar muestras y usar la información obtenida en estas y obtener conclusiones acerca de la población (Blair & Taylor, 2008). El proceso de inferencia estadística a partir de las pruebas de hipótesis se basa en hacer suposiciones respecto a características o fenómenos de interés en una población (o varias poblaciones) y tomando una muestra representativa de datos de esa población (muestra aleatoria), de manera que estos datos muestrales sirvan para contrastar la validez de nuestra hipótesis (Celis & Labradda, 2014; Daniel, 2002). Las hipótesis formuladas suponen la elección entre dos opciones, una opción llamada nula y la otra llamada alterna; a la luz de un estadístico calculado a partir de los datos recolectados en una muestra aleatoria, se elegirá una de ambas opciones (Newbold, Carlson, & Thorne, 2008). Proceso de evaluación de hipótesis estadísticas Los estadísticos calculados a partir de muestras aleatorias tienen una distribución en el muestreo con cierta variación aleatoria (Newbold et al., 2008). La decisión, entre las dos opciones de una hipótesis se tomará siguiendo un proceso que se describe a continuación. Primero, partimos del supuesto que una de las dos opciones se mantendrá a menos que existan pruebas contundentes contra ella, esta es la llama- da hipótesis nula, y es la opción que se refiere a la igualdad (la no diferencia), el no efecto, la no aso- ciación. La otra hipótesis es llamada hipótesis al- ternativa, y, por tanto, es la hipótesis de diferencia, de efecto, de asociación. Dado que, en conjunto, la hipótesis nula y la alterna cubren todas las posibi- lidades, es razonable pensar que una de ambas de- claraciones debe ser verdadera (Celis & Labradda, 2014; Pagano & Gauvreau, 2001). Cuando se aporta suficiente evidencia en contra de la hipótesis nula, esta se rechaza, y por ende se acepta la hipótesis alternativa; si no hay suficiente evidencia para rechazar la hipótesis nula, entonces esta se acepta; sin embargo el rechazo o aceptación de una hipótesis nula, no es absoluto, la Estadísti- ca no es una ciencia exacta, sino una basada en la variabilidad y no se trata en realidad de determi- nar cuál de ambas hipótesis es la correcta, ya que siempre hay la posibilidad de cometer un error, sino determinar si hay suficiente evidencia a fa- vor o en contra de la hipótesis nula. Como puede razonarse a partir de lo expuesto anteriormente, podríamos rechazar una hipótesis nula verdadera erróneamente, o la podemos aceptar erróneamen- te, estos son los llamados error tipo I y error tipo II, respectivamente (o errores alfa y beta) (Daniel, 2002; Newbold et al., 2008). Cuadro I. Tipos de errores que se pueden cometer al realizar inferencias estadísticas Modificado de Celis & Labrada, 2014.

Transcript of 01,.+&0+2)/*#0.).revista.asomigua.org/wp-content/uploads/2018/07/re... ·...

Page 1: 01,.+&0+2)/*#0.).revista.asomigua.org/wp-content/uploads/2018/07/re... · !"#$%&'()"(*")$+$,'($,&"!,'()"(-.'&"*'/'('%0+$'+$1,()"(*")$+$,'($,&"!,'()"(-.'&"*'/'

REVISTA DE MEDICINA INTERNA DE GUATEMALA ASOCIACIÓN DE MEDICINA INTERNA DE GUATEMALAREVISTA DE MEDICINA INTERNA DE GUATEMALA ASOCIACIÓN DE MEDICINA INTERNA DE GUATEMALA

Pag. 37

Introducción a las pruebas de hipótesis

André Chocó

Introducción

Las pruebas de hipótesis junto a los intervalos de confianza constituyen dos enfoques fundamentales de la inferencia estadística, es decir a ese proceso de estudiar muestras y usar la información obtenida en estas y obtener conclusiones acerca de la población (Blair & Taylor, 2008).

El proceso de inferencia estadística a partir de las pruebas de hipótesis se basa en hacer suposiciones respecto a características o fenómenos de interés en una población (o varias poblaciones) y tomando una muestra representativa de datos de esa población (muestra aleatoria), de manera que estos datos muestrales sirvan para contrastar la validez de nuestra hipótesis (Celis & Labradda, 2014; Daniel, 2002).

Las hipótesis formuladas suponen la elección entre dos opciones, una opción llamada nula y la otra llamada alterna; a la luz de un estadístico calculado a partir de los datos recolectados en una muestra aleatoria, se elegirá una de ambas opciones (Newbold, Carlson, & Thorne, 2008).

Proceso de evaluación de hipótesis estadísticas

Los estadísticos calculados a partir de muestras aleatorias tienen una distribución en el muestreo con cierta variación aleatoria (Newbold et al., 2008). La decisión, entre las dos opciones de una hipótesis se tomará siguiendo un proceso que se describe a continuación.

Primero, partimos del supuesto que una de las dos opciones se mantendrá a menos que existan pruebas contundentes contra ella, esta es la llama-da hipótesis nula, y es la opción que se refiere a la igualdad (la no diferencia), el no efecto, la no aso-ciación. La otra hipótesis es llamada hipótesis al-ternativa, y, por tanto, es la hipótesis de diferencia, de efecto, de asociación. Dado que, en conjunto, la hipótesis nula y la alterna cubren todas las posibi-lidades, es razonable pensar que una de ambas de-claraciones debe ser verdadera (Celis & Labradda, 2014; Pagano & Gauvreau, 2001).Cuando se aporta suficiente evidencia en contra de la hipótesis nula, esta se rechaza, y por ende se acepta la hipótesis alternativa; si no hay suficiente evidencia para rechazar la hipótesis nula, entonces esta se acepta; sin embargo el rechazo o aceptación de una hipótesis nula, no es absoluto, la Estadísti-

ca no es una ciencia exacta, sino una basada en la variabilidad y no se trata en realidad de determi-nar cuál de ambas hipótesis es la correcta, ya que siempre hay la posibilidad de cometer un error, sino determinar si hay suficiente evidencia a fa-vor o en contra de la hipótesis nula. Como puede razonarse a partir de lo expuesto anteriormente, podríamos rechazar una hipótesis nula verdadera erróneamente, o la podemos aceptar erróneamen-te, estos son los llamados error tipo I y error tipo II, respectivamente (o errores alfa y beta) (Daniel, 2002; Newbold et al., 2008).Cuadro I.Tipos de errores que se pueden cometer al realizar inferencias estadísticas

Modificado de Celis & Labrada, 2014.

Page 2: 01,.+&0+2)/*#0.).revista.asomigua.org/wp-content/uploads/2018/07/re... · !"#$%&'()"(*")$+$,'($,&"!,'()"(-.'&"*'/'('%0+$'+$1,()"(*")$+$,'($,&"!,'()"(-.'&"*'/'

REVISTA DE MEDICINA INTERNA DE GUATEMALA ASOCIACIÓN DE MEDICINA INTERNA DE GUATEMALA

Pag. 38

El proceso de evaluación de estadísticas culmina con la determinación de un valor de la probabili-dad de rechazar equivocadamente una hipótesis nula verdadera, lo cual se conoce como valor p o p value (Glantz, 2006).

El primer ejemplo nos permitirá entender el error tipo I y tipo II:

Ejemplo 1. Se ha estudiado que el uso de plaguici-das está relacionado con el desarrollo de leucemia. La hipótesis nula para evaluar esta posible asocia-ción es la siguiente:

Hipótesis nula (Ho): La frecuencia con que se pre-sentan casos de leucemia no varía entre personas que han estado expuestos a plaguicidas y entre quienes no han estado expuestos.

Un error tipo I implicaría aceptar que la leucemia y la exposición a plaguicidas SÍ están expuestos cuando en realidad no están relacionados.

Un error tipo II implicaría aceptar que la leucemia y la exposición a plaguicidas No están relaciona-dos cuando en realidad sí están relacionados.Hipótesis de una y dos colas

Ejemplo 2. Los niveles de plomo en agua potable no deben sobrepasar las 15 partes por billón. Si se realiza una toma de muestras de agua potable de una comunidad se puede plantear las siguientes hipótesis para con el fin de realizar inferencia es-tadística a partir de las muestras. Hipótesis nula: Los niveles de plomo son iguales a 15 ppb.Hipótesis alternativa: Los niveles de plomo son diferentes de 15 ppb.

Las hipótesis anteriores son llamadas hipótesis de dos colas, porque la hipótesis alternativa muestra solo un resultado de diferencia, que podría ser una diferencia mayor a cero o menor a cero. De hecho, para este ejemplo, sería más útil plantear una hipótesis de una cola. Las hipótesis de una cola son unidireccionales y se establecen relacio-

nes como “mayor que” o “menor que” (Pagano & Gauvreau, 2001). Sin embargo, las hipótesis nulas siempre van a ser de igualdad, por tanto, las hi-pótesis que deberían plantearse para el ejemplo 2 serían las siguientes:

Ho: Los niveles de plomo son menores o iguales a 15 ppb.

y la hipótesis alternativa:

Ha: Los niveles de plomo son mayores que 15 ppb.

La significancia y la potencia

El error tipo I se conoce también como significan-cia (α), o sea, la probabilidad de rechazar una hi-pótesis nula que es verdadera. Para una α dada, se dice que una prueba estadística es más poten-te que otra si su valor de 1-α (potencia) es mayor que el de la otra para todos los valores que corres-ponden a un parámetro dado (Celis & Labradda, 2014).

Selección del nivel de significancia

El nivel de significancia define un valor de proba-bilidad que ayudará a rechazar la hipótesis nula, aunque las poblaciones de donde se tomen las muestras sean iguales entre sí. Dado que cuando se realiza el rechazo de un hipótesis nula, las di-ferencias podrían ser reales, o deberse al azar, se establece un nivel de error permisible, un nivel de riesgo a tomar al concluir a través del resultado de una prueba estadística: no podemos aceptar que cualquier diferencia observada entre las muestras sea evidencia de que las poblaciones estudiadas son diferentes, pero tampoco que todas las dife-rencias observadas se deban al azar (Celis & La-bradda, 2014; Henquin, 2013).

La probabilidad de cometer un error tipo I o tipo II está determinada por dos aspectos: la diferencia entre las poblaciones en estudio y el tamaño de la muestra.

Page 3: 01,.+&0+2)/*#0.).revista.asomigua.org/wp-content/uploads/2018/07/re... · !"#$%&'()"(*")$+$,'($,&"!,'()"(-.'&"*'/'('%0+$'+$1,()"(*")$+$,'($,&"!,'()"(-.'&"*'/'

REVISTA DE MEDICINA INTERNA DE GUATEMALA ASOCIACIÓN DE MEDICINA INTERNA DE GUATEMALAREVISTA DE MEDICINA INTERNA DE GUATEMALA ASOCIACIÓN DE MEDICINA INTERNA DE GUATEMALA

Pag. 39

Durante el proceso de inferencia estadística se de-sea que la probabilidad de cometer un error tipo I o tipo II sea pequeña; por otro lado, los errores alfa y beta se relacionan de manera que cuando dismi-nuye uno es probable que aumente el otro. Dada esta relación, se minimizará la probabilidad de cometer el error tipo I, que generalmente se con-sidera el de mayor trascendencia, fijando el valor de significancia en 0.05, aunque esta es una simple convención y pueden usarse otros valores como 0.1 o 0.01, por ejemplo. El valor de significancia debe ser más pequeño a medida que las conse-cuencias de cometer error tipo I se consideren más graves. (Celis & Labradda, 2014; Glantz, 2006)

Por otra parte, al desconocer la probabilidad de cometer un error tipo II, tampoco podemos afir-mar con certeza que el no rechazo de una hipótesis nula implica que las muestras estudiadas proce-den de poblaciones iguales; solo concluimos que no se encontraron diferencias significativas (Argi-mon Pallas & Jiménez Villa, 2000; Celis & Labrad-da, 2014).

Supuestos de las pruebas de hipótesis

Ya se dijo que la aplicación de las pruebas de hi-pótesis se basa en el conocimiento de las distri-buciones de probabilidad y su aplicación a las distribuciones muestrales, pero este proceso está condicionado por el hecho que deben asumirse algunos supuestos matemáticos. Dentro de estas suposiciones se encuentra la distribución de pro-babilidad que exhiben los datos recolectados y el tamaño de muestra, entre otros. Existen procedi-mientos que no requieren de la existencia de su-posiciones, los llamados métodos de distribución libre, y aquellos que se basan en distribuciones no normales, llamados métodos no paramétricos (Celis & Labradda, 2014; Siegel, 1970).

Selección del estadístico pertinente

En la definición de las hipótesis estadísticas, como se ha visto en los ejemplos anteriores, hay que ha-cer referencia al parámetro que se desea evaluar, y obtener información de los datos muestrales a

través de sus estadísticos correspondientes, por ejemplo, una prueba de hipótesis para la media poblacional utiliza información a partir de la me-dia muestral (Celis & Labradda, 2014).

Especificación del estadístico de prueba y conside-ración de su distribución

Líneas arriba insistíamos en que la base de una prueba de hipótesis es un ejercicio de cálculo de probabilidades. Para calcular estas probabilida-des, utilizamos un estadístico de prueba, que es una función de las mediciones muestrales en el cual se fundamenta la decisión que se tomará. Dependiendo de la naturaleza de los datos, la dis-tribución de probabilidad, el conocimiento que se tenga de los parámetros, y del tamaño muestral se elegirá el estadístico de prueba correspondiente (Celis & Labradda, 2014; Mendenhall, Scheaffer, & Wackerly, 1986). Un ejemplo es el estadístico de z, que se aplica a variables cuantitativas que se distribuyen de forma normal, cuando su tamaño muestral es mayor a 30 unidades:

z = (estimación puntual - parámetro) / error es-tándar

Sin embargo existen otros estadísticos de prueba que corresponden a las distribuciones t (t de Stu-dent), α2 (chi-cuadrada) y F (distribución F) (Celis & Labradda, 2014; Daniel, 2002).

Especificación de las regiones de rechazo y acep-tación:

La región de rechazo especifica qué valores del estadístico de prueba permitirán el rechazo de la hipótesis nula. La definición de la hipótesis nula y el nivel de significancia está relacionada con la definición de las regiones de rechazo y aceptación.La región de rechazo es el complemento de la re-gión de aceptación y en este punto, la distribución de la zona de rechazo depende de si la hipótesis planteada es de una o dos colas.Las regiones de aceptación y rechazo se delimitan mediante un valor crítico o punto de una recta

Page 4: 01,.+&0+2)/*#0.).revista.asomigua.org/wp-content/uploads/2018/07/re... · !"#$%&'()"(*")$+$,'($,&"!,'()"(-.'&"*'/'('%0+$'+$1,()"(*")$+$,'($,&"!,'()"(-.'&"*'/'

REVISTA DE MEDICINA INTERNA DE GUATEMALA ASOCIACIÓN DE MEDICINA INTERNA DE GUATEMALA

Pag. 40

numérica donde ambas regiones se separan (Blair & Taylor, 2008; Celis & Labradda, 2014; Pagano & Gauvreau, 2001).

Decisión estadística

Se procede a calcular el estadístico pertinente y el estadístico de prueba, se compara el valor calcula-do mediante el estadístico de prueba con el valor crítico de la prueba de hipótesis. Cuando el valor calculado mediante el estadístico de prueba se en-cuentra en la región de aceptación, aceptamos la hipótesis nula, pero, si se encuentra en la región de rechazo, la rechazamos (Celis & Labradda, 2014; Daniel, 2002).

Conclusión

Al dar la conclusión debemos tomar en cuenta los aspectos tratados antes, sobre la posibilidad de co-meter errores tipo I o II, el desconocimiento que se tiene en general del error tipo II, y la no considera-ción de las conclusiones estadísticas como conclu-siones absolutas (Argimon Pallas & Jiménez Villa, 2000; Celis & Labradda, 2014).

Ejemplo 3. Se desea comparar la efectividad de la administración de dos tipos de técnicas anestési-cas. Uno del primero análisis consiste en evaluar la comparabilidad de los grupos, es decir pregun-tarnos si las características de los pacientes de cada grupo son similares, por ejemplo, el sexo y la edad. Al compararse los resultados de edad pro-medio entre el grupo que recibió un bloqueo espi-nal (97 pacientes) y el grupo que recibió bloqueo poplíteo (103 pacientes) se observa los siguiente:

Ahora plantearemos las hipótesis estadísticas:

Ho: La media poblacional de la edad entre los pa-

cientes que recibieron bloqueo espinal y bloqueo poplíteo no varía significativamente.

Ha: La media poblacional de la edad entre los pa-cientes que recibieron bloqueo espinal y bloqueo poplíteo varía significativamente.

La prueba que se realiza para comparar los valo-res de una variable cuantitativa entre dos grupos es la prueba de T de Student de muestras inde-pendientes, es decir si se desea evaluar la relación entre una variable cuantitativa y una variable di-cotómica puede usarse la prueba de T de Student, siempre que se cumplan determinados supuestos. Dentro de estos supuestos está que los grupos sean equilibrados, es decir de igual tamaño o de tamaños similares, y que los datos se distribuyan de forma normal en ambos grupos (Barton & Peat, 2014).

El resultado en el software estadístico R, muestra lo siguiente:

t = 0.6144, df = 198, p-value = 0.5397

El valor p indica que no hay suficiente evidencia para rechazar la hipótesis nula, por tanto, se con-cluye que no hay una diferencia significativa entre la media de edad entre el grupo que recibió blo-queo espinal y el grupo que recibió bloqueo po-plíteo. Concluimos en términos generales que los grupos son equivalentes en edad.

Por otra parte, puede utilizarse el estadístico T cal-culado usando una tabla de la distribución de la prueba de T.

Page 5: 01,.+&0+2)/*#0.).revista.asomigua.org/wp-content/uploads/2018/07/re... · !"#$%&'()"(*")$+$,'($,&"!,'()"(-.'&"*'/'('%0+$'+$1,()"(*")$+$,'($,&"!,'()"(-.'&"*'/'

REVISTA DE MEDICINA INTERNA DE GUATEMALA ASOCIACIÓN DE MEDICINA INTERNA DE GUATEMALAREVISTA DE MEDICINA INTERNA DE GUATEMALA ASOCIACIÓN DE MEDICINA INTERNA DE GUATEMALA

Pag. 41

Figura 1.Extracto de una tabla de la distribución de T de Student

Celis & Labrada, 2014

Para nuestro ejemplo, buscamos el valor crítico de T en la intersección entre el nivel de signifi-cancia y los grados de libertad (198 en este caso), como no existe el valor de 198 grados de libertad en la tabla se usa uno cercano, por ejemplo 180 o 200, ambos plantean un mismo valor crítico. El valor crítico limita a la región de aceptación de la hipótesis nula, en nuestro ejemplo t = 0.6144, se encuentra dentro de la zona de aceptación de la hipótesis nula, por tanto, se concluye que no hay diferencia estadísticamente significativa.

Referencias

Argimon Pallas, J., & Jiménez Villa, J. (2000). Métodos de investiga-ción clínica y epidemiológica (3rd ed.). Madrid: Elsevier.

Barton, B., & Peat, J. (2014). Medical Statistics: A Guide to SPSS, data analysis and critical appraisal (2nd ed.). United Kingdom: BMJ Books.

Blair, C., & Taylor, R. (2008). Bioestadística. México: Pearson Edu-cación, S.A.

Celis, A., & Labradda, V. (2014). Bioestadística (3rd ed.). Ciudad de México: El Manual Moderno.

Daniel, W. (2002). Bioestadistica: base para el análisis de las cien-cias de la salud. México, D.F.: Editorial Limusa.

Glantz, S. (2006). Bioestadística (6th ed.). México, D.F.: Mc Graw Hill.

Henquin, R. (2013). Epidemiología y Estadística para principiantes. Buenos Aires: Corpus.

Mendenhall, W., Scheaffer, R., & Wackerly, D. (1986). Estadística matemática con aplicaciones. Ciudad de México: Grupo Editorial Iberoamérica.

Newbold, P., Carlson, W., & Thorne, B. (2008). Estadística para ad-ministración y economía. Madrid: Pearson Educación, S.A.

Pagano, M., & Gauvreau, K. (2001). Fundamentos de Bioestadistica (2nd ed.). México, D.F.: Thompson Learning.

Siegel, S. (1970). Estadística no paramétrica: aplicada a las ciencias de la conducta. México, D.F.: Editorial Trillas.