Aplicación Logit/Probit Multinomial

6
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR Facultad de Economía Modelos Aplicados al Medio Ambiente “Aplicación de Multinomial Logit-Probit: La Pobreza en el Ecuador” Leonardo Ochoa R. mayo de 2013

description

Aplicación Logit/Probit Multinomial

Transcript of Aplicación Logit/Probit Multinomial

Page 1: Aplicación Logit/Probit Multinomial

PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR

Facultad de Economía

Modelos Aplicados al Medio Ambiente

“Aplicación de Multinomial Logit-Probit: La Pobreza en el Ecuador”

Leonardo Ochoa R.

mayo de 2013

Page 2: Aplicación Logit/Probit Multinomial

1. Introducción

La pobreza es una situación o forma de vida que surge como producto de la imposibilidad de acceso o carencia de los recursos para satisfacer las necesidades físicas y psíquicas básicas humanas que inciden en un desgaste del nivel y calidad de vida de las personas, tales como la alimentación, la vivienda, la educación, la asistencia sanitaria o el acceso al agua potable. También se suelen considerar la falta de medios para poder acceder a tales recursos, como el desempleo, la falta de ingresos o un nivel bajo de los mismos. También puede ser el resultado de procesos de exclusión social, segregación social o marginación.

En el presente trabajo una vez clasificada la condición de pobreza, se realizará regresiones de la pobreza (como variable categórica ordinal) con los métodos Multinomial Probit y Logit para variables ordinales. En primer lugar se presenta una breve reseña del marco teórico, a continuación la fuente de los datos, después la descripción de las variables utilizadas y la construcción del modelo, y finalmente resultados y conclusiones.

2. Marco Teórico

2.1 Pobreza y pobreza extrema por Ingreso1

Número de personas pobres expresado como porcentaje del total de la población en un determinado año.

Se define como "pobres" a aquellas personas que pertenecen a hogares cuyo ingreso per cápita, en un período determinado, es inferior al valor de la línea de pobreza. La línea de pobreza es el equivalente monetario del costo de una canasta básica de bienes y servicios.

Para calcular la incidencia de pobreza, se compara, el ingreso total per-cápita con la línea de pobreza y los individuos cuyo ingreso total per-cápita es menor a la línea de pobreza, y son considerados pobres. Finalmente calculamos la proporción de pobres frente al total de lapoblación calculada mediante la base expandida. El mismo procedimiento seguimos para pobrezaextrema.

2.2 Modelos de Probabilidad

Dado que el uso de una función de distribución garantiza que el resultado de la estimación esté acotado entre 0 y 1, en principio las posibles alternativas son varias, siendo las más habituales la

1 Tomado de Sistema Integrado de Indicadores Sociales del Ecuador e INEC (S/F). Disponible en la web: http://www.inec.gob.ec/inec/index.php?option=com_remository&Itemid=420&func=startdown&id=936&lang=es

Page 3: Aplicación Logit/Probit Multinomial

función de distribución logística, que ha dado lugar al modelo Logit, y la función de distribución de la normal tipificada, que ha dado lugar al modelo Probit. Tanto los modelos Logit como los Probit relacionan, por tanto, la variable endógena Yi con las variables explicativas Xki a través de una función de distribución.

Los modelos logit y probit se interpretan en términos probabilísticos, es decir, sirve para medir la probabilidad de que ocurra el acontecimiento objeto de estudio (Yi=1). En cuanto a la interpretación de los parámetros estimados en un modelo Logit, el signo de los mismos indica la dirección en que se mueve la probabilidad cuando aumenta la variable explicativa correspondiente, sin embargo, la cuantía del parámetro no coincide con la magnitud de la variación en la probabilidad.

No obstante los modelos logit y probit solamente sirven para variables dependientes dicotómicas.

2.3 Modelos Logit-Probit Multinomiales

Los modelos Multinomiales utilizan el método de Máxima Verosimilitud para estimar las probabilidades asociadas a cada elección, dadas las características particulares de los individuos o los atributos de las elecciones resumidas en los regresores.

Se utilizará el comando ologit y oprobit, ya que para este modelo, la variable dependiente categórica es ordinal.

En logit o probit multinomial ordenado, una puntuación subyacente se calcula como una función lineal de las variables independientes y un conjunto de puntos de corte. La probabilidad de observar resultado i corresponde a la probabilidad de que la función lineal estimada, además de error aleatorio, está dentro de la gama de los puntos de corte estimados para el resultado

Pr = = Pr ( < + +⋯+ + ≤ )uj se asume está distribuido logísticamente para el caso logit, y distribuido normalmente para el caso probit. En cualquiera de los casos, se estima los coeficientes b1, b2, …, bk junto con los puntos de corte k1, k2, …,kK-1, donde k es el número de posibles resultados. k0 se toma como -∞, y kK se toma como +∞. Todo esto es una generalización directa del modelo logit/probit de dos resultados ordinarios.

Page 4: Aplicación Logit/Probit Multinomial

3. Fuentes de Datos

Encuesta Urbana de Empleo, Desempleo y Subempleo (ENEMDU).- Tiene cobertura nacional, el levantamiento de información se realizó en el área urbana. Del ámbito de estudio se excluye la región insular. La encuesta está dirigida a los hogares y las personas que en ellos residen, establecidos en las viviendas particulares.

La muestra utilizada proviene de la ENEMDU provisto para el cuarto trimestre del 2012. Se cuenta con 73.686 registros, si consideramos con el factor de expansión se estima una población de 14’682.556.

4. Modelo

Variable Dependiente

Pobreza.- Variable categórica ordinal calculado por ingreso.

Modelo:

( = ) = + + + + + + + +Donde

Yi = i Probabilidad de ser pobre extremo (i = 1), pobre (i = 2), no pobre (i = 3).

b0 Constante

X1 Sexo

X1 Sexo del Jefe de Hogar (1=mujer)

X3 Edad

X4 Edad2

X5 Años de Escolaridad

X6 Presencia de niños menores a 3 años

X7 Presencia de adultos mayores a 65 años

X8 Tamaño del Hogar (número de individuos)

Page 5: Aplicación Logit/Probit Multinomial

5. Resultados

A continuación se presenta la tabla de resultados de las regresiones logit y probit multinomial para variable dependiente ordinal:

Marginal fixed effects after ologit Marginal fixed effects after oprobit

yi = 1 yi = 2 yi = 3 yi = 1 yi = 2 yi = 3

Sexo (mujer = 1) 0.013431* 0.0198131* -0.0296451* 0.0146422* 0.0166052* -0.0268327*

(0.00392) (0.00555) (0.00851) (0.00446) (0.00478) (0.00804)

Sexo del je (mujer = 1) (omitida)

Edad -0.0022491* -0.0033941* 0.0049829* -0.0021819* -0.0025591* 0.0040174*

(0.00053) (0.00082) (0.00119) (0.00061) (0.00073) (0.00114)

Edad2 0.0000188* 0.0000284* -0.0000418* 0.0000184* 0.0000216* -0.0000339*

(0.00001) (0.00001) (0.00001) (0.00001) (0.00001) (0.00001)

Años de Escolaridad -0.0034857* -0.0052603* 0.0077226* -0.0038799* -0.0045507* 0.007144*

(0.00089) (0.00552) (0.00195) (0.00103) (0.00118) (0.00187)

Presencia de Niños 0.0142771* 0.0210288* -0.0315014* 0.0168551* 0.019016 -0.0308581*

(0.00383) (0.00552) (0.0084) (0.00439) (0.00481) (0.008)

Presencia de Viejos 0.003614 0.005424 -0.0080019 0.0051007 0.0059177 -0.0093804

(0.00483) (0.00721) (0.01068) (0.00549) (0.0063) (0.01008)

Tamaño del Hogar 0.0121053* -0.0268191* -0.0268191 0.0136984 0.0160668* -0.0252228*

(0.00085) (0.00188) (0.00188) (0.00096) (0.00117) (0.0018)

R2 0.0698 0.0673

N 17931 17931

*p<0.05

Nota: Corregido por provincia

Errores estándar robustos entre paréntesis

Las variables son significativas salvo la presencia de adultos mayores. La variable “sexo del jefe de hogar” fue omitida.

Se observa que ser mujer aumenta las probabilidades de ser pobreo y pobre extremo en 1% y 2% respectivamente, y disminuye las probabilidades de no ser pobre en aproximadamente 3%. El efecto de la variable de edad no alcanza el 1%.. Los años de escolaridad tienen una relación inversa con la probabilidad de ser pobre y pobre extremo, es decir a mayor nivel de escolaridad aumentan las probabilidades de no ser pobre aunque no alcanzan el punto porcentual. Tener niños menores de 3 años o adultos mayores a 65 años en el hogar aumenta la probabilidad de ser pobre y pobre extremo.

Page 6: Aplicación Logit/Probit Multinomial

Los coeficientes obtenidos con logit y probit multinomial son mayormente equivalentes.

6. Conclusiones

∑ El modelo está correctamente específicado ya que solo una de las variables independientes fue omitida y una más no fue significativa.

∑ Según se pudo observar, los métodos probit y logit multinovial arrojaron resultados significativos para las variables independientes y muy similares entre si.

∑ De acuerdo a lo observado, ser mujer aumenta las probabilidades de ser pobre y pobre extremo. Los años de escolaridad tienen una relación inversa con la probabilidad de ser pobre. Tener niños menores de 3 años aumenta la probabilidad de ser pobre. El número de miembros de la familia tiene una relación directa con la probabilidad de pobreza, pero indirecta con pobreza extrema.

∑ El modelo construido da bajos valores para los coeficientes de las variables explicativas, por lo que ninguna de las variables independientes parece tener una sensibilidad especialmente alta.

∑ Puede existir problemas de endogeneidad por variable omitida como el ingreso, la cual no se incluyo porque explica perfectamente la situación de pobreza. De existir endogeneidad, los coeficientes no serán consistentes ni insesgados. Además por la naturaleza del modelo multinomial se esperaría problemas de endogeneidad.

∑ Otra variable omitida que podría dar problemas de endogeneidad es la presencia de asalariados en el hogar.