Un Modelo de Regresión Hospital Gral
-
Upload
rafaelsalazar -
Category
Documents
-
view
220 -
download
0
description
Transcript of Un Modelo de Regresión Hospital Gral
Maestría en Estadística Aplicada Asignatura: ANALISIS DE REGRESIÓN LINEAL
AUTOR DEL ANALISIS: Jose M.
MODELO DE REGRESIÓN PARA LA
EVALUACIÓN DEL HOSPITAL GENERAL DE
ACAPULCO
1. INTRODUCCIÓN
1.1 DEFINICIÓN DEL PROBLEMA DE INVESTIGACION
En muchas ocasiones se ha especulado entre la sociedad sobre la calidad de los
servicios que ofrece el Hospital General del puerto de Acapulco, pero esto
también es propio decirlo sobre la calidad de otros hospitales; en vista de que no
hay una medida o norma a la vista sobre qué hospital es mejor con respecto a su
infraestructura, su personal profesional o calidad humana, se pretende tener una
exploración con base en métodos estadísticos para obtener respuestas objetivas,
fundamentadas en recursos técnicos, más que empíricos o solo de oídos. Con todo
esto se pretende valorar el servicio profesional que recibe un paciente con
respecto a la relación humana con el personal médico que integre la atención
completa de un paciente.
1.2 OBJETIVOS
i. Obtener un modelo de regresión para evaluar la atención medica recibida en el
hospital general de Acapulco.
ii. Identificar las características más representativas del modelo obtenido.
2. MARCO TEÓRICO
Mencionamos en primera parte que la Secretaria de Salud (SS) aplica un sistema
conocido como “Sistema Nacional de Indicadores de Calidad en Salud (INDICAS)”,
que fue creado en el año 2003, durante la cruzada nacional por la calidad de los
servicios de Salud con la función de reporte así como de evaluación y monitoreo de la
calidad de atención.
Este Sistema actualmente se encuentra estructurado en tres grandes categorías: calidad
técnica, calidad interpersonal y gestión de la calidad. Destacan entre los principales
indicadores para los diferentes niveles de atención médica aquellos enfocados en la
Maestría en Estadística Aplicada Asignatura: ANALISIS DE REGRESIÓN LINEAL
AUTOR DEL ANALISIS: Jose M.
medición del trato digno, la organización de los servicios de salud, la atención médica
efectiva y la calidad en los servicios de enfermería. También cabe mencionar que la SS
fue reconocido este año 2014 por El Consejo Nacional de Evaluación de la Política de
Desarrollo Social CONEVAL, por el desarrollo de este sistema.
Durante el último cuatrimestre se cuenta con un reporte de 11,288 establecimientos de
atención a la salud del Sistema Nacional de Salud en todos los niveles en las 31
entidades federativas y el Distrito Federal.
La Secretaría de Salud instrumenta mecanismos dirigidos a homologar la calidad
técnica e interpersonal de los servicios de salud en el país, incluyendo mejoras al
sistema INDICAS que permitan evaluar los procesos de atención médica y su
efectividad, mejorar la calidad de la información y evitar el auto-reporte de las
unidades, incrementar la oportunidad y el número de unidades que reportan al
INDICAS e incentivar a los establecimientos e instituciones a que utilicen de manera
estratégica la información del INDICAS a favor de la mejora de la calidad de la
atención al interior de cada una de ellas.
Pero todo lo anterior es de manejo de política interna, ya que al revisar la página web
oficial del Hospital General de Acapulco, no se encuentra información al respecto de los
resultados de la aplicación del sistema INDICAS; lo que podemos ver en la página web
es todo lo concerniente a, manuales de operación de cada área de trabajo, normas,
soporte, información concerniente a los servicios con los que cuenta el Hospital General
de Acapulco, su misión, visión y objetivos como institución de salud.
A continuación una imagen del portal del hospital general de Acapulco.
PORTAL DEL HOSPITAL GENERAL DE ACAPULCO
En esta página lo único relacionado a una encuesta como tal, es únicamente una
opinión acerca del portal del HOSPITAL GENERAL
Maestría en Estadística Aplicada Asignatura: ANALISIS DE REGRESIÓN LINEAL
AUTOR DEL ANALISIS: Jose M.
3. METODOLOGÍA
Se pretende evaluar de manera integral la percepción sobre los servicios que ofrece el
Hospital general de Acapulco a los pacientes que son atendidos en sus instalaciones. Se
diseñó un cuestionario en el cual se concentraron datos generales de los pacientes, el
tipo de servicio que demandaron y la opinión sobre distintas afirmaciones mediante una
escala tipo Likert de acuerdo o aprobación. La estructura del cuestionario es como se
indica a continuación, considerando las variables con sus respectivos códigos.
Los códigos de las etiquetas son los siguientes:
Etiqueta Contenido Tipo
S Sexo Cualitativa (h-m)
E Edad Cuantitativa
DI Días de ingreso Cuantitativa
C Cirugía Cualitativa (Sí o No)
D 1:Medicina interna
2:Traumatología
3:Urología
4:Oftalmología
P1 Estado de las habitaciones Likert
P2 Comida Likert
P3 Atención del personal no sanitario Likert
P4 Atención del personal auxiliar sanitario Likert
P5 Atención del personal de enfermería Likert
P6 Atención del personal médico Likert
P7 Información recibida Likert
P8 Solución del problema Cualitativa (Sí o No)
VG Valoración general Cuantitativa (0-10)
Maestría en Estadística Aplicada Asignatura: ANALISIS DE REGRESIÓN LINEAL
AUTOR DEL ANALISIS: Jose M.
1 Totalmente en desacuerdo
2 En desacuerdo
3 Ni de acuerdo ni en desacuerdo
4 De acuerdo
5 Totalmente de acuerdo
La siguiente expresión es el Modelo de Regresión Múltiple
pp xxy ...110
La cual, es la ecuación que describe cómo está relacionada la variable dependiente y con
las variables independientes x1,x2,…,xp, además el corresponde al término del error
que corresponde a la variabilidad en y que no puede atribuirse o explicarse al efecto
lineal de las p variables independientes.
Con los estadísticos muestrales b1, b2,…, bp que se usan como estimadores puntuales de
los parámetros p ,...,, 10 se emplea una muestra aleatoria simple, ya con los
estadísticos muestrales se obtiene la siguiente ecuación de regresión múltiple estimada.
ppxbxbby ...110
Donde
pbbb .,..,, 10 Son las estimaciones de p .,..,, 10
y = valor estimado de la variable independiente
Supuestos del modelo de regresión múltiple
Supuesto 1. El término del error es una variable aleatoria distribuida normalmente.
Supuesto 2. Para cada valor de y las varianzas son iguales (homocedasticidad).
Supuesto 3. Los términos del error son independientes uno del otro.
Supuesto 4. El supuesto de linealidad: las medias de los valores y quedan en una recta.
Maestría en Estadística Aplicada Asignatura: ANALISIS DE REGRESIÓN LINEAL
AUTOR DEL ANALISIS: Jose M.
Supuesto 5. El número de observaciones n, excede al número de variables
independientes k en por lo menos 2.
Supuesto 6. Hay k+1 parámetros por estimar, los coeficientes para las variables
más el intercepto.
Ahora hablando de nuestros objetivos de investigación, tenemos 7 variables
independientes y una variable de respuesta; esto significa que en nuestro modelo habrá
k+1=7+1 parámetros por estimar
Las variables desde P1 hasta P7 están tomadas con la escala Likert de 1 a 5, y la
variable de respuesta VG es una variable cuantitativa de 0 a 10.
El coeficiente de determinación múltiple
El coeficiente de determinación múltiple indica una medida de la bondad de ajuste de
la ecuación de regresión múltiple estimada, y se determina con la siguiente expresión.
SCT
SCRR 2
Donde
SCR= Suma de cuadrados debido a la regresión = 2)(
yi
y
SCT= Suma de cuadrados total =
2)( yyi
Coeficiente de determinación múltiple ajustado
1
1)1(1 22
kn
nRRa
Donde n es el tamaño de muestra y k es el número de variables
Error estándar de la estimación
Este estadístico se utiliza como una medida de bondad de ajuste, mide los grados de
dispersión de los valores yi alrededor del plano de regresión.
Maestría en Estadística Aplicada Asignatura: ANALISIS DE REGRESIÓN LINEAL
AUTOR DEL ANALISIS: Jose M.
1
)( 2
kn
yySe
ii
Donde
SCE= Suma de cuadrados de los errores = 2)(
ii yy
n-k-1 es el número de grados de libertad.
k es el número de variables independientes.
ANOVA
Este es un procedimiento para probar si alguna de las variables independientes tiene una
relación con la variable dependiente, es decir si una variable independiente xi no tiene
relación alguna con la variable dependiente (y), su coeficiente debe ser cero.
El procedimiento ANOVA prueba la siguiente hipótesis nula de que todos los
coeficientes son iguales a cero contra la alternativa de que por lo menos algún 0i .
kiunmenosloPorH
H
i
k
,...,2,1,0:
0...:
1
3210
Si la hipótesis nula no se llega a rechazar entonces significaría que no existe relación
lineal entre las variables aleatorias independientes xi y la variable de respuesta y; pero si
la hipótesis nula se rechaza, en consecuencia se aceptaría la alternativa y significaría
que por lo menos alguna variable independiente tiene relación lineal con y.
A continuación se presenta el formato general de la tabla ANOVA.
Fuente de variación Suma de cuadrados
Grados de libertad
Cuadrado medio VALOR F
Entre muestras (tratamiento)
Dentro de las muestras (error)
Variación total
SCR
SCE
SCT
K
n-k-1
n-1
k
SCR
1 kn
SCE
CME
CMRF
Maestría en Estadística Aplicada Asignatura: ANALISIS DE REGRESIÓN LINEAL
AUTOR DEL ANALISIS: Jose M.
Prueba t de significancia
Ahora probaremos cada coeficiente de manera individual para saber cuáles son
significantes. La hipótesis nula significa que la primera variable no contribuye con
poder explicativo para el modelo de regresión. De esta manera tenemos que para
cualquier parámetro i .
0:
0:
1
0
i
i
H
H
El estadístico de prueba es
bi
i
S
bt , donde biS = error estándar del coeficiente de regresión
bi= coeficiente de regresión estimado
La regla de rechazo es
Método del valor crítico
Si 01,
2
Hrechazarttkn
Método del valor p
Si valor p rechazo H0
Multicolinealidad
La multicolinealidad se da cuando las variables no son independientes, hablando en un
sentido diferente de que trabajamos con variables independientes; ya que hablamos de
independencia entre las variables, cuando hay una alta correlación entre las variables
esto puede acarrear problemas al modelo de regresión en el sentido de que los
coeficientes i pueden ser erróneos. Ahora haremos uso del Coeficiente de correlación
muestral, para determinar el grado de multicolinealidad que hay.
Entonces la siguiente expresión es para obtener r
Maestría en Estadística Aplicada Asignatura: ANALISIS DE REGRESIÓN LINEAL
AUTOR DEL ANALISIS: Jose M.
SCT
SCRr
El consejo para utilizar el Coeficiente de correlación es el siguiente, si el coeficiente es
mayor que 0.7 o menor a -0.7, la experiencia dicta que existe un problema serio de
multicolinealidad en las variables del modelo.
4. RESULTADOS Y DISCUSIÓN
Para obtener la Ecuación de Regresión Múltiple Estimada nos apoyamos con el software
estadístico MINITAB
Tenemos los siguientes resultados
Análisis de regresión: VG vs. P1, P2, P3, P4, P5, P6, P7 La ecuación de regresión es VG = - 0.396 + 0.128 P1 + 0.404 P2 + 0.123 P3 + 0.444 P4 + 0.597 P5 + 0.210 P6 + 0.150 P7
Predictor Coef Coef. de EE T P
Constante -0.3960 0.3014 -1.31 0.192
P1 0.1282 0.1140 1.12 0.264
P2 0.4043 0.1303 3.10 0.003
P3 0.12328 0.08836 1.40 0.166
P4 0.4442 0.1220 3.64 0.000
P5 0.5969 0.1180 5.06 0.000
P6 0.21010 0.07366 2.85 0.005
P7 0.15049 0.09657 1.56 0.123
S = 0.479986 R-cuad. = 92.2% R-cuad.(ajustado) = 91.6%
PRESS = 25.9991 R-cuad.(pred) = 90.48%
Análisis de varianza
Fuente GL SC MC F P
Regresión 7 251.804 35.972 156.14 0.000
Error residual 92 21.196 0.230
Total 99 273.000
Maestría en Estadística Aplicada Asignatura: ANALISIS DE REGRESIÓN LINEAL
AUTOR DEL ANALISIS: Jose M. Estadístico de Durbin-Watson = 2.13154
Con ayuda del Minitab vemos que los coeficientes estimados son:
b0: -0.3960 b3: 0.12328 b6: 0.21010
b1: 0.1282 b4: 0.4442 b7: 0.15049
b2: 0.4043 b5: 0.5969
Ecuación de regresión estimada
VG = - 0.396 + 0.128 P1 + 0.404 P2 + 0.123 P3 + 0.444 P4 + 0.597 P5 + 0.210 P6 + 0.150 P7
El coeficiente de determinación múltiple
Este coeficiente resulta
%2.92273
804.2512 SCT
SCRR
Lo cual significa que la variabilidad de VG (valoración general), es explicada en un
92.2% mediante los cambios en las variables independientes P1, P2,…, P7, por medio
de la ecuación de regresión estimada.
En términos generales, esta cantidad indica que proporción de la variación total en la
respuesta Y se explica con el modelo ajustado.
Coeficiente de determinación múltiple ajustado
Tenemos que el ajustado resulta en:
%6.9117100
1100)922.1(1
2
Ra
Esto es, ajustar el coeficiente con el número de variables, con el objetivo de evitar
sobre estimar el poder explicativo del modelo estimado.
Error estándar de la estimación
Maestría en Estadística Aplicada Asignatura: ANALISIS DE REGRESIÓN LINEAL
AUTOR DEL ANALISIS: Jose M.
Con el valor del cuadro siguiente obtenemos el error estándar de la estimación (valor en
negrita)
Análisis de varianza
Fuente GL SC MC F P
Regresión 7 251.804 35.972 156.14 0.000
Error residual 92 21.196 0.230 Total 99 273.000
Del error estándar de la estimación obtenemos:
4799.092
196.21
17100
196.21
1
)( 2
kn
yySe
ii
Entre menos dispersión se presente en los valores yi, más pequeño será Se y como
consecuencia más preciso (y confiable) será el modelo en su predicción y pronóstico.
En el cuadro de Minitab presentado arriba el error estándar de estimación se denota por
S=0.479986
ANOVA
Se presenta ahora la tabla ANOVA obtenida con MINITAB. Análisis de varianza
Fuente GL SC MC F P
Regresión 7 251.804 35.972 156.14 0.000
Error residual 92 21.196 0.230
Total 99 273.000
La prueba que utiliza las hipótesis descritas anteriormente se le denomina prueba F.
Para obtener la prueba F, los grados de libertad son 7 Y 92.
14.156230.0
972.35
1
CME
CMR
knSCE
kSCR
F
El denominador proporciona un estimador insesgado de 2 , la varianza de los
errores.
Y probando la hipótesis al nivel de significancia del 5%, se tiene el valor F de tablas
92,7,05.0F 2.09
Maestría en Estadística Aplicada Asignatura: ANALISIS DE REGRESIÓN LINEAL
AUTOR DEL ANALISIS: Jose M.
La Regla de rechazo es
Rechazar H0 si valor p ≤ ∝
Rechazar H0 si FF
Al tener un valor p ≤ ∝ se rechaza la hipótesis nula, y podemos decir que existe por
lo menos algún 0i .
Prueba t de significancia
Los valores para el error del coeficiente de regresión los tomamos del siguiente
cuadro (valores en azul) y realizamos la prueba t.
Predictor Coef Coef. de EE T P
Constante -0.3960 0.3014 -1.31 0.192
P1 0.1282 0.1140 1.12 0.264
P2 0.4043 0.1303 3.10 0.003
P3 0.12328 0.08836 1.40 0.166
P4 0.4442 0.1220 3.64 0.000
P5 0.5969 0.1180 5.06 0.000
P6 0.21010 0.07366 2.85 0.005
P7 0.15049 0.09657 1.56 0.123
Entonces
Con 05.0
Prueba para
p1 p2 p3 p4
0:
0:
11
10
H
H
0:
0:
21
20
H
H
0:
0:
31
30
H
H
0:
0:
41
40
H
H
bi
i
S
bt
bi
i
S
bt
bi
i
S
bt
bi
i
S
bt
12.11140.0
1282.0t 1.3
1303.0
4043.0t 39.1
08836.0
12328.0t 64.3
1220.0
4442.0t
99.192,
2
t 99.192,
2
t 99.192,
2
t 99.192,
2
t
No rechazo H0 Rechazo H0 No rechazo H0 Rechazo H0
Maestría en Estadística Aplicada Asignatura: ANALISIS DE REGRESIÓN LINEAL
AUTOR DEL ANALISIS: Jose M.
No acepto H1 Acepto H1 No acepto H1 Acepto H1
p5 p6 p7
0:
0:
51
50
H
H
0:
0:
61
60
H
H
0:
0:
71
70
H
H
bi
i
S
bt
bi
i
S
bt
bi
i
S
bt
05.51180.0
5969.0t 85.2
07366.0
2101.0t 55.1
09657.0
15049.0t
99.192,
2
t 99.192,
2
t 99.192,
2
t
Rechazo H0 Rechazo H0 No rechazo H0
Acepto H1 Acepto H1 No acepto H1
Por lo tanto eliminamos las variables p1, p3 y p7, ya que no son útiles para
integrarlas al modelo. Significa que de las variables siguientes: el Estado de las
habitaciones, Atención del personal no sanitario, e Información recibida no son
relevantes para el modelo.
P1 Estado de las habitaciones Likert
P2 Comida Likert
P3 Atención del personal no sanitario Likert
Maestría en Estadística Aplicada Asignatura: ANALISIS DE REGRESIÓN LINEAL
AUTOR DEL ANALISIS: Jose M.
P4 Atención del personal auxiliar sanitario Likert
P5 Atención del personal de enfermería Likert
P6 Atención del personal médico Likert
P7 Información recibida Likert
El nuevo modelo queda:
VG = - 0.396 + 0.404 P2 + 0.444 P4 + 0.597 P5 + 0.210 P6
Multicolinealidad
Obtenemos
96.273
804.251r
Lo cual indica un problema muy serio de multicolinealidad, ya que al obtener un
valor de r mayor que 0.7 indica una relación lineal alta entre las variables del
modelo.