Un Modelo de Regresión Hospital Gral

Maestría en Estadística Aplicada Asignatura: ANALISIS DE REGRESIÓN LINEAL

AUTOR DEL ANALISIS: Jose M.

MODELO DE REGRESIÓN PARA LA

EVALUACIÓN DEL HOSPITAL GENERAL DE

ACAPULCO

1. INTRODUCCIÓN

1.1 DEFINICIÓN DEL PROBLEMA DE INVESTIGACION

En muchas ocasiones se ha especulado entre la sociedad sobre la calidad de los

servicios que ofrece el Hospital General del puerto de Acapulco, pero esto

también es propio decirlo sobre la calidad de otros hospitales; en vista de que no

hay una medida o norma a la vista sobre qué hospital es mejor con respecto a su

infraestructura, su personal profesional o calidad humana, se pretende tener una

exploración con base en métodos estadísticos para obtener respuestas objetivas,

fundamentadas en recursos técnicos, más que empíricos o solo de oídos. Con todo

esto se pretende valorar el servicio profesional que recibe un paciente con

respecto a la relación humana con el personal médico que integre la atención

completa de un paciente.

1.2 OBJETIVOS

i. Obtener un modelo de regresión para evaluar la atención medica recibida en el

hospital general de Acapulco.

ii. Identificar las características más representativas del modelo obtenido.

2. MARCO TEÓRICO

Mencionamos en primera parte que la Secretaria de Salud (SS) aplica un sistema

conocido como “Sistema Nacional de Indicadores de Calidad en Salud (INDICAS)”,

que fue creado en el año 2003, durante la cruzada nacional por la calidad de los

servicios de Salud con la función de reporte así como de evaluación y monitoreo de la

calidad de atención.

Este Sistema actualmente se encuentra estructurado en tres grandes categorías: calidad

técnica, calidad interpersonal y gestión de la calidad. Destacan entre los principales

indicadores para los diferentes niveles de atención médica aquellos enfocados en la



medición del trato digno, la organización de los servicios de salud, la atención médica

efectiva y la calidad en los servicios de enfermería. También cabe mencionar que la SS

fue reconocido este año 2014 por El Consejo Nacional de Evaluación de la Política de

Desarrollo Social CONEVAL, por el desarrollo de este sistema.

Durante el último cuatrimestre se cuenta con un reporte de 11,288 establecimientos de

atención a la salud del Sistema Nacional de Salud en todos los niveles en las 31

entidades federativas y el Distrito Federal.

La Secretaría de Salud instrumenta mecanismos dirigidos a homologar la calidad

técnica e interpersonal de los servicios de salud en el país, incluyendo mejoras al

sistema INDICAS que permitan evaluar los procesos de atención médica y su

efectividad, mejorar la calidad de la información y evitar el auto-reporte de las

unidades, incrementar la oportunidad y el número de unidades que reportan al

INDICAS e incentivar a los establecimientos e instituciones a que utilicen de manera

estratégica la información del INDICAS a favor de la mejora de la calidad de la

atención al interior de cada una de ellas.

Pero todo lo anterior es de manejo de política interna, ya que al revisar la página web

oficial del Hospital General de Acapulco, no se encuentra información al respecto de los

resultados de la aplicación del sistema INDICAS; lo que podemos ver en la página web

es todo lo concerniente a, manuales de operación de cada área de trabajo, normas,

soporte, información concerniente a los servicios con los que cuenta el Hospital General

de Acapulco, su misión, visión y objetivos como institución de salud.

A continuación una imagen del portal del hospital general de Acapulco.

PORTAL DEL HOSPITAL GENERAL DE ACAPULCO

En esta página lo único relacionado a una encuesta como tal, es únicamente una

opinión acerca del portal del HOSPITAL GENERAL



3. METODOLOGÍA

Se pretende evaluar de manera integral la percepción sobre los servicios que ofrece el

Hospital general de Acapulco a los pacientes que son atendidos en sus instalaciones. Se

diseñó un cuestionario en el cual se concentraron datos generales de los pacientes, el

tipo de servicio que demandaron y la opinión sobre distintas afirmaciones mediante una

escala tipo Likert de acuerdo o aprobación. La estructura del cuestionario es como se

indica a continuación, considerando las variables con sus respectivos códigos.

Los códigos de las etiquetas son los siguientes:

Etiqueta Contenido Tipo

S Sexo Cualitativa (h-m)

E Edad Cuantitativa

DI Días de ingreso Cuantitativa

C Cirugía Cualitativa (Sí o No)

D 1:Medicina interna

2:Traumatología

3:Urología

4:Oftalmología

P1 Estado de las habitaciones Likert

P2 Comida Likert

P3 Atención del personal no sanitario Likert

P4 Atención del personal auxiliar sanitario Likert

P5 Atención del personal de enfermería Likert

P6 Atención del personal médico Likert

P7 Información recibida Likert

P8 Solución del problema Cualitativa (Sí o No)

VG Valoración general Cuantitativa (0-10)



1 Totalmente en desacuerdo

2 En desacuerdo

3 Ni de acuerdo ni en desacuerdo

4 De acuerdo

5 Totalmente de acuerdo

La siguiente expresión es el Modelo de Regresión Múltiple

pp xxy ...110

La cual, es la ecuación que describe cómo está relacionada la variable dependiente y con

las variables independientes x1,x2,…,xp, además el corresponde al término del error

que corresponde a la variabilidad en y que no puede atribuirse o explicarse al efecto

lineal de las p variables independientes.

Con los estadísticos muestrales b1, b2,…, bp que se usan como estimadores puntuales de

los parámetros p ,...,, 10 se emplea una muestra aleatoria simple, ya con los

estadísticos muestrales se obtiene la siguiente ecuación de regresión múltiple estimada.

ppxbxbby ...110

Donde

pbbb .,..,, 10 Son las estimaciones de p .,..,, 10

y = valor estimado de la variable independiente

Supuestos del modelo de regresión múltiple

Supuesto 1. El término del error es una variable aleatoria distribuida normalmente.

Supuesto 2. Para cada valor de y las varianzas son iguales (homocedasticidad).

Supuesto 3. Los términos del error son independientes uno del otro.

Supuesto 4. El supuesto de linealidad: las medias de los valores y quedan en una recta.



Supuesto 5. El número de observaciones n, excede al número de variables

independientes k en por lo menos 2.

Supuesto 6. Hay k+1 parámetros por estimar, los coeficientes para las variables

más el intercepto.

Ahora hablando de nuestros objetivos de investigación, tenemos 7 variables

independientes y una variable de respuesta; esto significa que en nuestro modelo habrá

k+1=7+1 parámetros por estimar

Las variables desde P1 hasta P7 están tomadas con la escala Likert de 1 a 5, y la

variable de respuesta VG es una variable cuantitativa de 0 a 10.

El coeficiente de determinación múltiple

El coeficiente de determinación múltiple indica una medida de la bondad de ajuste de

la ecuación de regresión múltiple estimada, y se determina con la siguiente expresión.

SCT

SCRR 2

Donde

SCR= Suma de cuadrados debido a la regresión = 2)(

yi

y

SCT= Suma de cuadrados total =

2)( yyi

Coeficiente de determinación múltiple ajustado

1

1)1(1 22

kn

nRRa

Donde n es el tamaño de muestra y k es el número de variables

Error estándar de la estimación

Este estadístico se utiliza como una medida de bondad de ajuste, mide los grados de

dispersión de los valores yi alrededor del plano de regresión.



1

)( 2

kn

yySe

ii

Donde

SCE= Suma de cuadrados de los errores = 2)(

ii yy

n-k-1 es el número de grados de libertad.

k es el número de variables independientes.

ANOVA

Este es un procedimiento para probar si alguna de las variables independientes tiene una

relación con la variable dependiente, es decir si una variable independiente xi no tiene

relación alguna con la variable dependiente (y), su coeficiente debe ser cero.

El procedimiento ANOVA prueba la siguiente hipótesis nula de que todos los

coeficientes son iguales a cero contra la alternativa de que por lo menos algún 0i .

kiunmenosloPorH

H

i

k

,...,2,1,0:

0...:

1

3210

Si la hipótesis nula no se llega a rechazar entonces significaría que no existe relación

lineal entre las variables aleatorias independientes xi y la variable de respuesta y; pero si

la hipótesis nula se rechaza, en consecuencia se aceptaría la alternativa y significaría

que por lo menos alguna variable independiente tiene relación lineal con y.

A continuación se presenta el formato general de la tabla ANOVA.

Fuente de variación Suma de cuadrados

Grados de libertad

Cuadrado medio VALOR F

Entre muestras (tratamiento)

Dentro de las muestras (error)

Variación total

SCR

SCE

SCT

K

n-k-1

n-1

k

SCR

1 kn

SCE

CME

CMRF



Prueba t de significancia

Ahora probaremos cada coeficiente de manera individual para saber cuáles son

significantes. La hipótesis nula significa que la primera variable no contribuye con

poder explicativo para el modelo de regresión. De esta manera tenemos que para

cualquier parámetro i .

0:

0:

1

0

i

i

H

H

El estadístico de prueba es

bi

i

S

bt , donde biS = error estándar del coeficiente de regresión

bi= coeficiente de regresión estimado

La regla de rechazo es

Método del valor crítico

Si 01,

2

Hrechazarttkn

Método del valor p

Si valor p rechazo H0

Multicolinealidad

La multicolinealidad se da cuando las variables no son independientes, hablando en un

sentido diferente de que trabajamos con variables independientes; ya que hablamos de

independencia entre las variables, cuando hay una alta correlación entre las variables

esto puede acarrear problemas al modelo de regresión en el sentido de que los

coeficientes i pueden ser erróneos. Ahora haremos uso del Coeficiente de correlación

muestral, para determinar el grado de multicolinealidad que hay.

Entonces la siguiente expresión es para obtener r



SCT

SCRr

El consejo para utilizar el Coeficiente de correlación es el siguiente, si el coeficiente es

mayor que 0.7 o menor a -0.7, la experiencia dicta que existe un problema serio de

multicolinealidad en las variables del modelo.

4. RESULTADOS Y DISCUSIÓN

Para obtener la Ecuación de Regresión Múltiple Estimada nos apoyamos con el software

estadístico MINITAB

Tenemos los siguientes resultados

Análisis de regresión: VG vs. P1, P2, P3, P4, P5, P6, P7 La ecuación de regresión es VG = - 0.396 + 0.128 P1 + 0.404 P2 + 0.123 P3 + 0.444 P4 + 0.597 P5 + 0.210 P6 + 0.150 P7

Predictor Coef Coef. de EE T P

Constante -0.3960 0.3014 -1.31 0.192

P1 0.1282 0.1140 1.12 0.264

P2 0.4043 0.1303 3.10 0.003

P3 0.12328 0.08836 1.40 0.166

P4 0.4442 0.1220 3.64 0.000

P5 0.5969 0.1180 5.06 0.000

P6 0.21010 0.07366 2.85 0.005

P7 0.15049 0.09657 1.56 0.123

S = 0.479986 R-cuad. = 92.2% R-cuad.(ajustado) = 91.6%

PRESS = 25.9991 R-cuad.(pred) = 90.48%

Análisis de varianza

Fuente GL SC MC F P

Regresión 7 251.804 35.972 156.14 0.000

Error residual 92 21.196 0.230

Total 99 273.000


AUTOR DEL ANALISIS: Jose M. Estadístico de Durbin-Watson = 2.13154

Con ayuda del Minitab vemos que los coeficientes estimados son:

b0: -0.3960 b3: 0.12328 b6: 0.21010

b1: 0.1282 b4: 0.4442 b7: 0.15049

b2: 0.4043 b5: 0.5969

Ecuación de regresión estimada

VG = - 0.396 + 0.128 P1 + 0.404 P2 + 0.123 P3 + 0.444 P4 + 0.597 P5 + 0.210 P6 + 0.150 P7

El coeficiente de determinación múltiple

Este coeficiente resulta

%2.92273

804.2512 SCT

SCRR

Lo cual significa que la variabilidad de VG (valoración general), es explicada en un

92.2% mediante los cambios en las variables independientes P1, P2,…, P7, por medio

de la ecuación de regresión estimada.

En términos generales, esta cantidad indica que proporción de la variación total en la

respuesta Y se explica con el modelo ajustado.

Coeficiente de determinación múltiple ajustado

Tenemos que el ajustado resulta en:

%6.9117100

1100)922.1(1

2

Ra

Esto es, ajustar el coeficiente con el número de variables, con el objetivo de evitar

sobre estimar el poder explicativo del modelo estimado.

Error estándar de la estimación



Con el valor del cuadro siguiente obtenemos el error estándar de la estimación (valor en

negrita)

Análisis de varianza

Fuente GL SC MC F P

Regresión 7 251.804 35.972 156.14 0.000

Error residual 92 21.196 0.230 Total 99 273.000

Del error estándar de la estimación obtenemos:

4799.092

196.21

17100

196.21

1

)( 2

kn

yySe

ii

Entre menos dispersión se presente en los valores yi, más pequeño será Se y como

consecuencia más preciso (y confiable) será el modelo en su predicción y pronóstico.

En el cuadro de Minitab presentado arriba el error estándar de estimación se denota por

S=0.479986

ANOVA

Se presenta ahora la tabla ANOVA obtenida con MINITAB. Análisis de varianza

Fuente GL SC MC F P

Regresión 7 251.804 35.972 156.14 0.000

Error residual 92 21.196 0.230

Total 99 273.000

La prueba que utiliza las hipótesis descritas anteriormente se le denomina prueba F.

Para obtener la prueba F, los grados de libertad son 7 Y 92.

14.156230.0

972.35

1

CME

CMR

knSCE

kSCR

F

El denominador proporciona un estimador insesgado de 2 , la varianza de los

errores.

Y probando la hipótesis al nivel de significancia del 5%, se tiene el valor F de tablas

92,7,05.0F 2.09



La Regla de rechazo es

Rechazar H0 si valor p ≤ ∝

Rechazar H0 si FF

Al tener un valor p ≤ ∝ se rechaza la hipótesis nula, y podemos decir que existe por

lo menos algún 0i .

Prueba t de significancia

Los valores para el error del coeficiente de regresión los tomamos del siguiente

cuadro (valores en azul) y realizamos la prueba t.

Predictor Coef Coef. de EE T P

Constante -0.3960 0.3014 -1.31 0.192

P1 0.1282 0.1140 1.12 0.264

P2 0.4043 0.1303 3.10 0.003

P3 0.12328 0.08836 1.40 0.166

P4 0.4442 0.1220 3.64 0.000

P5 0.5969 0.1180 5.06 0.000

P6 0.21010 0.07366 2.85 0.005

P7 0.15049 0.09657 1.56 0.123

Entonces

Con 05.0

Prueba para

p1 p2 p3 p4

0:

0:

11

10

H

H

0:

0:

21

20

H

H

0:

0:

31

30

H

H

0:

0:

41

40

H

H

bi

i

S

bt

bi

i

S

bt

bi

i

S

bt

bi

i

S

bt

12.11140.0

1282.0t 1.3

1303.0

4043.0t 39.1

08836.0

12328.0t 64.3

1220.0

4442.0t

99.192,

2

t 99.192,

2

t 99.192,

2

t 99.192,

2

t

No rechazo H0 Rechazo H0 No rechazo H0 Rechazo H0



No acepto H1 Acepto H1 No acepto H1 Acepto H1

p5 p6 p7

0:

0:

51

50

H

H

0:

0:

61

60

H

H

0:

0:

71

70

H

H

bi

i

S

bt

bi

i

S

bt

bi

i

S

bt

05.51180.0

5969.0t 85.2

07366.0

2101.0t 55.1

09657.0

15049.0t

99.192,

2

t 99.192,

2

t 99.192,

2

t

Rechazo H0 Rechazo H0 No rechazo H0

Acepto H1 Acepto H1 No acepto H1

Por lo tanto eliminamos las variables p1, p3 y p7, ya que no son útiles para

integrarlas al modelo. Significa que de las variables siguientes: el Estado de las

habitaciones, Atención del personal no sanitario, e Información recibida no son

relevantes para el modelo.

P1 Estado de las habitaciones Likert

P2 Comida Likert

P3 Atención del personal no sanitario Likert



P4 Atención del personal auxiliar sanitario Likert

P5 Atención del personal de enfermería Likert

P6 Atención del personal médico Likert

P7 Información recibida Likert

El nuevo modelo queda:

VG = - 0.396 + 0.404 P2 + 0.444 P4 + 0.597 P5 + 0.210 P6

Multicolinealidad

Obtenemos

96.273

804.251r

Lo cual indica un problema muy serio de multicolinealidad, ya que al obtener un

valor de r mayor que 0.7 indica una relación lineal alta entre las variables del

modelo.

Un Modelo de Regresión Hospital Gral

Documents

Transcript of Un Modelo de Regresión Hospital Gral