LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder...

32
1 LA PARTICIPACIÓN DE LOS JÓVENES BOLIVIANOS EN LA EDUCACIÓN UNIVERSITARIA BOLIVIANA UN ANÁLISIS MULTICAUSAL DE ELECCIÓN DISCRETABenigno Caballero Claure Universidad Técnica de Oruro Y Rolando Caballero Martínez Universidad Nacional Autónoma de México Agosto del 2013 Resumen: El estudio analiza los efectos de las variables socioeconómicas como la edad, género, estado civil, pobreza, región geográfica, característica socio-cultural en el acceso de los jóvenes bolivianos en la educación universitaria de Bolivia. Como se puede observar el enfoque es ecléctico y se considera que existen varios factores que podrían influir en el acceso a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección discreta (Modelo lineal de probabilidad, Gompit y/o Valor Extremo, Logit y Probit), además el análisis de sensitividad y especificidad. Este metodología es interesante, ya que la variable explicada nos da a conocer la probabilidad de que ocurra un evento o no, en nuestro caso, la probabilidad de participar o no en la educación de pregrado en Bolivia. El estudio, utiliza una base de datos de la encuesta de hogares levantado por el INE-BOLIVIA para los años 2002 y 2009, que permite armar un mix de modelos de elección discreta, el cual muestra los efectos de los regresores sobre la variable explicada en un momento dado del tiempo. Los resultados de nuestro trabajo demuestran, que todos los factores socioeconómicos mencionados contribuyen en distinto grado a determinar la participación en la educación universitaria de pregrado en Bolivia y a partir de los resultados se da a conocer las conclusiones finales de nuestro proyecto de investigación. CLASIFICACIÓN JEL: I25, C25, A22 Palabras clave: Educación Universitaria, Modelos de Elección Discreta Correos electrónicos de los autores: [email protected] ; [email protected] y [email protected]

Transcript of LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder...

Page 1: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección

1

LLAA PPAARRTTIICCIIPPAACCIIÓÓNN DDEE LLOOSS JJÓÓVVEENNEESS BBOOLLIIVVIIAANNOOSS

EENN LLAA EEDDUUCCAACCIIÓÓNN UUNNIIVVEERRSSIITTAARRIIAA BBOOLLIIVVIIAANNAA

““UUNN AANNÁÁLLIISSIISS MMUULLTTIICCAAUUSSAALL DDEE EELLEECCCCIIÓÓNN DDIISSCCRREETTAA””

Benigno Caballero Claure

Universidad Técnica de Oruro

Y

Rolando Caballero Martínez

Universidad Nacional Autónoma de México

Agosto del 2013 Resumen: El estudio analiza los efectos de las variables socioeconómicas como la edad,

género, estado civil, pobreza, región geográfica, característica socio-cultural en el acceso de los

jóvenes bolivianos en la educación universitaria de Bolivia. Como se puede observar el

enfoque es ecléctico y se considera que existen varios factores que podrían influir en el acceso

a la educación universitaria. Para poder analizar estos efectos se emplea como metodología

econométrica, los modelos de elección discreta (Modelo lineal de probabilidad, Gompit y/o

Valor Extremo, Logit y Probit), además el análisis de sensitividad y especificidad. Este

metodología es interesante, ya que la variable explicada nos da a conocer la probabilidad de

que ocurra un evento o no, en nuestro caso, la probabilidad de participar o no en la educación

de pregrado en Bolivia. El estudio, utiliza una base de datos de la encuesta de hogares

levantado por el INE-BOLIVIA para los años 2002 y 2009, que permite armar un mix de

modelos de elección discreta, el cual muestra los efectos de los regresores sobre la variable

explicada en un momento dado del tiempo. Los resultados de nuestro trabajo demuestran, que

todos los factores socioeconómicos mencionados contribuyen en distinto grado a determinar la

participación en la educación universitaria de pregrado en Bolivia y a partir de los resultados se

da a conocer las conclusiones finales de nuestro proyecto de investigación.

CLASIFICACIÓN JEL: I25, C25, A22

Palabras clave: Educación Universitaria, Modelos de Elección Discreta

Correos electrónicos de los autores: [email protected] ;

[email protected] y [email protected]

Page 2: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección

2

1. INTRODUCCIÓN

Los orígenes de la Economía de la Educación y los diferentes enfoques, se originan

en Adam Smith y Alfred Marshall y en los mismos autores la educación figuraba como

forma fundamental de inversión en capital humano, no fue sino hasta los ’60 cuando

la ciencia económica comenzó a formalizar modelos concretos acerca del impacto de

la educación en la productividad, los ingresos laborales, y el crecimiento de los

países.

El punto de partida formal lo dieron los estudios e investigaciones de Schultz

(1961), Denison (1962) y Becker (1962) en sus teorías del capital humano y la función

de producción en educación.

Desde esa época hasta nuestros días, el desarrollo de la Economía de la

Educación ha pasado por distintos periodos. Asimismo la llamada teoría del capital

humano no puede ser reducida a una teoría única, constituye en sí misma un parte de

la teoría neoclásica. El desarrollo teórico del concepto de capital humano ha derivado

en la ampliación de su campo de comprensión combinando elementos de la

economía del trabajo, de la economía del bienestar, de las finanzas públicas, de la

economía industrial, entre otras ramas de la economía. Por lo que se abrió una

división propia denominada economía de la educación, encargada de aplicar el

análisis económico a las disciplinas educativas.

La investigación en esta área ha tomado fuerza en los últimos años, ya que la

educación ha pasado a ocupar un lugar destacado en la discusión pública en la

mayoría de los países, y especialmente, debido a la potencial vinculación entre

educación y desarrollo económico.

Entre los temas más estudiados figuran la teoría del capital humano; la relación

entre insumos y resultados educacionales a través de una función de producción; y la

relación entre educación, ingresos y crecimiento económico. Como también así, el

uso de mecanismos de mercados para financiar sistemas de provisión de servicios

educativos han sido objeto de estudio y una importante contribución a la Economía de

la Educación a países desarrollados.

Por lo tanto la educación en las últimas décadas parece ser la esperanza de un

País mejor y más justo, reflexionar sobre la igualdad de oportunidades y equidad es

importante.

Para Bolivia, son contados los trabajos que han abordado el tema de la

economía de la educación desde un punto de vista empírico, en especial sobre la

Page 3: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección

3

participación en la actividad universitaria, por lo mismo el análisis empírico para el

caso de Bolivia es reducido, de ahí que sea necesario plantear como problema de

investigación el estudio de los factores cuantitativos y cualitativos que podrían influir

en el acceso a la educación de pregrado en Bolivia, todo ello basándonos en la idea

de la educación es el factor de crecimiento más lento, pero a la vez el más poderoso,

para nuestro estudio realizaríamos un análisis comparativo para dos años en

específico 2002 y 20091.

Por tanto, en este trabajo nosotros nos planteamos como objeto de estudio

analizar y discernir los posibles efectos de las variables socioeconómicas como la

edad, género, estado civil, pobreza, región geográfica (rural y/o urbana),

característica socio-cultural en el acceso de los jóvenes bolivianos en la educación

universitaria de Bolivia. Como se puede observar el enfoque es ecléctico y se

considera que existen varios factores que podrían influir en el acceso a la educación

universitaria. De tal forma que, una vez que se realiza la estimación de los modelos

de elección discreta, se analiza también, por un lado, el análisis de sensitividad y

especificidad de nuestros modelos de elección discreta estimados y por el otro, la

asociación y la significancia de cada uno de las variables explicativas.

La pregunta de investigación que nos formulamos es la siguiente:

Tomando en cuenta que la mayoría de los países en vías de desarrollo son

países cuya masa poblacional son mayoritariamente jóvenes y que Bolivia no es una

excepción y al mismo tiempo que Bolivia en distintos periodos de su vida, ha pasado

por distintas etapas, desde el punto de vista: económico, social, cultural, género y

climatológico, todos estos factores nos impulsan a realizar un estudio de la afluencia y

oportunidad que tienen los jóvenes bolivianos de acceder a la educación universitaria.

Por lo tanto la formulación de problema de investigación sería:

1. ¿Cuál es el papel de los factores socioeconómicos, como: el entorno personal

familiar, la situación civil de una persona, la diferencia de género, el factor

económico y geográfico, en el acceso de los jóvenes bolivianos al sistema

universitario boliviano? y ¿Estos factores socioeconómicos junto a otras

variables han tendido a reducir o ampliar el número de matriculados y/o

inscritos en la educación universitaria en Bolivia?

1 Se toma en cuenta un estudio comparativo entre los años 2002 y 2009, debido a múltiples razones, la primera se

debe a que la base de datos sociales de la página web del INE-BOLIVIA, solo se encuentra colgada la Encuesta de Hogares hasta el 2009, bases de datos del 2010, …,2012 en adelante no estaban disponibles hasta mayo del 2013, que es la fecha que se culminó el presente trabajo de investigación, véase: http://www.ine.gob.bo/

Page 4: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección

4

2. Las hipótesis de trabajo correlacionados a las preguntas previas son las

siguientes:

Las variables socioeconómicas mencionadas y el buena coyuntura económica

que ha favorecido a Bolivia en los últimos años, contribuyen en distinto grado a

determinar la participación en la educación universitaria de pregrado en Bolivia y al

mismo tiempo desembocar en un aumento del número de matriculados y/o inscritos

en el sistema universitario en Bolivia2.

El artículo está estructurado de la siguiente manera. En la primera sección se

dio una breve introducción del tema, así como la formulación del planteamiento del

problema y su posible hipótesis. En la segunda sección se describe de manera

sucinta y breve el marco teórico y la metodología econométrica a aplicar a nuestro

estudio. La tercera sección se da a conocer la descripción y características básicas

de nuestra base de datos. La cuarta sección se desarrolla y analiza en detalle los

hallazgos empíricos de nuestras estimaciones econométricas. Finalmente, en la

última sección se muestran las conclusiones finales de nuestros resultados.

Por último el trabajo intenta organizar, de la manera más sistemica, sintética y

clara posible la relación necesaria referidas a la diferenciación que existe en la vida

universitaria. Ser universitario que es cosa distinta a estar o pasar por la universidad.

Ser universitario es una actitud existencial caracterizada por la búsqueda de la

verdad, la formación integral, la síntesis de saberes y el servicio a la sociedad.

2. Marco Teórico y Metodología Econométrica

2.1 Capital Humano

Si bien los clásicos subrayaron la influencia que la educación y el saber en general

tienen en la producción y en el bienestar de la sociedad, no llegaron a proponer un

verdadero marco teórico del capital humano. Son en realidad los economistas

neoclásicos los que realmente contemplaron la formación de los hombres como una

inversión en capital humano y pusieron las bases del análisis moderno de la

educación. En su obra The Nature of Capital and Income, publicada en el año 1906,

Fisher (1867-1947) elabora una teoría del capital en la que lo define como un stock

de recursos que genera flujos de rentas futuras, lo que permite considerar como

inversión tanto a la formación de los hombres, como a los bienes duraderos que

2 Para este análisis tiene que ver mucho la mayor asignación presupuestaria a las universidades públicas en

Bolivia en los últimos años, el mismo explicado por la transferencia de ingresos del Estado Plurinacional de Bolivia a las universidades, que en parte se debe a la mayor venta y a buenos precios del gas boliviano a los principales socios comerciales que tiene Bolivia.

Page 5: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección

5

entran en un proceso productivo. Sin embargo, esta concepción novedosa quedó

durante mucho tiempo en un segundo plano.

Apoyándose en la aportación de Fisher, es en realidad Schultz quien, en la 73.ª

reunión anual de la American Economic Association (Saint Louis, diciembre de 1960),

marcará el despegue de la economía de la educación con su conferencia titulada

Investment in Human Capital (Schultz, 1961), en la que populariza el concepto de

capital humano. Para Schultz, los conocimientos y las cualificaciones se pueden

asimilar a un capital, y la constitución de este capital es el resultado de una inversión

deliberada por parte de los individuos. En base a esta concepción, explica que el

crecimiento del producto nacional de los países es el resultado de esta inversión, de

la misma manera que el crecimiento del nivel de salarios de los individuos está ligado

al aumento de su inversión en capital humano.

A partir de entonces, hay una repentina proliferación de publicaciones

relacionadas con el valor económico de la educación. Así, Becker, Premio Nobel de

Economía en 1992, en su libro Human Capital (Becker, 1964), desarrolla la teoría de

la inversión en capital humano y señala el efecto de tal inversión sobre las ganancias,

el empleo y las actividades de consumo. Becker y Chiswick (1966) y Mincer (1974)

formularon luego el modelo matemático que relaciona las ganancias en el mercado de

trabajo con las inversiones en capital humano, mientras que Ben-Porath (1967)

elaboró el modelo de producción de capital humano a lo largo del ciclo de vida. Estas

aportaciones dieron lugar a numerosos trabajos empíricos que intentaron medir el

efecto de la educación y de la experiencia profesional sobre los salarios, y eso en

unos contextos económicos muy variados; así Belzil y Hansen (2002) enumeran

cerca de doscientos trabajos que se dedicaron a evaluar el rendimiento de las

inversiones educativas. En paralelo a estos trabajos, Psacharopoulos (1973)

contribuyó a popularizar el concepto de tasa de rendimiento interno de la educación y

su utilización para determinar el montante de las inversiones que tienen que realizar

los países en el sector educativo.

A lo largo de los últimos treinta años, numerosas innovaciones metodológicas

se han introducido en la estimación de la función de ganancias y en la evaluación del

impacto de la educación sobre las rentas. Estas mejoras, que han sido posible

gracias a la disponibilidad de fuentes de información más detalladas y al desarrollo de

ciertas técnicas econométricas, se proponen incorporar las capacidades innatas de

los sujetos en la estimación empírica del proceso de generación de rentas,

Page 6: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección

6

basándose en muestras de gemelos monocigóticos (ver por ejemplo Ashenfelter y

Krueger, 1994), tomar en cuenta el carácter endógeno de la educación (ver por

ejemplo Card, 2000) y corregir el sesgo de selección que se produce al considerar

únicamente a los individuos ocupados.

2.2 TEORIAS ALTERNATIVAS AL CAPITAL HUMANO

Desde sus orígenes, no faltaron las críticas al cuerpo teórico sobre el que descansa la

teoría del capital humano. Estas críticas, que en su mayoría provienen de la escuela

no ortodoxa norteamericana, han suscitado vivos debates entre los economistas,

dando lugar a teorías alternativas como la del filtro y la de la segmentación.

Elaboradas por autores como Arrow (1973), Doeringer y Piore (1971), Spence (1973)

o Thurow (1975), estas teorías cuestionan los propios fundamentos de la teoría del

capital humano, al negar que la inversión educativa contribuya a incrementar la

productividad mercantil de los individuos. Aunque estas nuevas corrientes de

pensamiento han renovado el análisis de los efectos externos de la educación tales

como los concibe la teoría del capital humano, todavía hoy la contrastación empírica

de estas teorías alternativas no dejan de plantear problemas.

La hipótesis del filtro (ver Arrow, 1973; Spence, 1973) se apoya en los

fundamentos de la teoría de la información. Para aquella, la educación no tiene como

finalidad el aumentar la productividad de las personas, tal como lo supone la teoría

del capital humano, sino que la finalidad del sistema educativo se resume en filtrar a

los individuos más aptos y en dar información a los empleadores acerca de las

cualidades de sus futuros trabajadores. La literatura económica ofrece varios

ejemplos de verificación empírica de la teoría del filtro frente a la del capital humano,

pero las pruebas de los que se dispone en la actualidad son bastante contradictorias.

En este campo, destaca sin duda el trabajo pionero de Layard y Psacharopoulos

(1974), que compara la rentabilidad de los años de estudios según estén certificados

o no por un título académico. Otros intentan averiguar la validez de la hipótesis del

filtro, confrontando a un grupo de trabajadores que necesitan ser filtrados por el

sistema educativo con otros que no lo requieren tanto. Basándose en este principio,

Wolpin (1977) sugiere comparar el rendimiento y el nivel de educación de los

asalariados, con el de los empresarios. Sus resultados para el caso de Estados

Unidos le conducen a refutar la hipótesis del filtro. Sin embargo, adoptando un

enfoque similar en el mismo contexto geográfico Cohn, Kicker y Oliveira (1987) llegan

a la conclusión inversa, al igual que Clark (2000) a partir de datos rusos.

Page 7: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección

7

2.3 EDUCACIÓN Y CRECIMIENTO ECONOMICO

El fuerte crecimiento económico que se produjo después de la segunda guerra

mundial en la mayoría de los países occidentales, y el aumento sin precedentes de la

demanda de educación que le acompañó, originó el interés de los economistas de la

educación por el análisis de los determinantes del crecimiento. Ya en los años 60,

economistas como Schultz (1961) y Denison (1962) se interesaron por el tema e

intentaron evaluar el aporte de la educación al crecimiento económico. Siguiendo un

enfoque contable, y estimando el nivel de educación de la población activa a través

del número de años de estudios ponderado por el diferencial de salarios que

corresponde a cada nivel de educación, Denison atribuye al aumento del nivel de

formación de la población activa que se produjo entre 1929 y 1973, en Estados

Unidos, entre el 15% y el 11% del crecimiento de la economía norteamericana.

Midiendo el stock de capital humano en base a las tasas de rendimiento de los

diversos niveles de enseñanza, Schultz obtiene resultados sensiblemente diferentes,

ya que estima que el 20-40% del crecimiento económico que se produjo en Estados

Unidos entre 1929 y 1956 se puede imputar al aumento de la inversión educativa

entre estas dos fechas. Nadiri (1972) y Psacharopoulos (1972) resumen las

evaluaciones que se hicieron en esta época en una serie de países desarrollados y

no desarrollados, según ambos métodos de estimación.

Los nuevos planteamientos de las teorías del crecimiento económico,

originados por Solow (1956), contribuyeron a renovar los enfoques empíricos

planteados años antes. Así, treinta y cinco años después de la publicación de ese

artículo, Mankiw, Romer y Weil (1992) proponen una versión ampliada del modelo

inicial de Solow, que incorpora junto a los dos factores clásicos, trabajo y capital

físico, un tercer factor acumulable similar al capital físico que es el capital humano. Su

modelo predice que el nivel de producción o de riqueza per capita de un país es tanto

mayor cuanto sus tasas de acumulación de capital físico y humano son grandes,

cuanto su tasa de crecimiento demográfico es pequeña, y cuanto el progreso técnico

es importante. A partir de tres muestras de países observados en el período 1960-

1985, muestran que un incremento del 10% en la tasa de inversión en capital humano

respecto al PIB induce a un aumento del producto por trabajador en torno al 7%, y en

caso de doblarse dicha inversión se incrementaría en casi el 70% dicho producto.

Paralelamente, numerosos autores se interesaron por la contrastación de la

hipótesis de convergencia de las economías, y trataron de revelar los factores que

Page 8: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección

8

explican el proceso de acercamiento del nivel de vida de los países. Dentro de estas

investigaciones, las aportaciones de Barro (1991) merecen sin duda alguna especial

atención. Basándose en una muestra de corte transversal de 98 países observados

durante el período 1960-1985, constata que a nivel de riqueza dado, los países que

invirtieron más en educación primaria y secundaria han experimentado unas tasas de

crecimiento mayores que los demás. Sus resultados muestran también que la calidad

de la enseñanza primaria, medida a través de la relación alumnos/docente, afecta de

manera positiva y significativa a la tasa de crecimiento de los países; sin embargo, la

calidad de la educación secundaria no parece ejercer un efecto determinante.

2.4 MODELO DE ELECCIÓN DISCRETA

En los modelos de elección binaria se supone que los individuos se enfrentan con una

elección entre dos alternativas y que la elección depende de características

identificables. En esta situación, la variable endógena puede tomar dos valores: Yi =

{1,0}, y se pretende explicar la elección hecha por el decisor como función de unas

variables que le caracterizan y que se denota por xi, un vector de dimensión k.

El propósito de un modelo de elección cualitativa es determinar la probabilidad

de que un individuo con un conjunto determinado de atributos hará una elección en

lugar de la alternativa. De manera más general, lo que se pretende es encontrar una

relación entre un conjunto de atributos que describen a un individuo y la probabilidad

de que el individuo hará la elección determinada.

En este trabajo, se considera las variables exógenas a variables

socioeconómicas. El primer trabajo teórico que fue desarrollado para estudiar

modelos con variables dicotómicas se planteó como una extensión del Modelo lineal

general, y dio paso al Modelo Lineal de probabilidad (MLP).

2.4.1 MODELO LINEAL DE PROBABILIDAD

Consideremos el siguiente modelo:

iti

xi

Y

Modelo de este tipo de ecuaciones en donde la variable independiente es dicotómica

y es función de las variables explicativas xi se denomina: Modelo lineal de

probabilidad.

La distribución de la muestra en este tipo de modelos se caracteriza por

mostrar una nube de puntos de tal forma que las observaciones muéstrales se dividen

en dos subgrupos. Uno de los cuales es el formado por las observaciones en las que

Page 9: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección

9

ocurrió el hecho objetivo de estudio, es decir cuando Yi=1, y el otro, por los puntos

muéstrales en los que no ocurrió, es decir, Yi=0.

El modelo lineal de probabilidad, se puede interpretar en términos

probabilísticos, en el sentido de que un valor concreto de la recta de regresión mide la

probabilidad de que ocurra el hecho objetivo de estudio. Es decir, iY^

se puede

considerar como la estimación de la probabilidad de que ocurra el hecho objetivo de

estudio Yi=1 siguiendo el siguiente criterio: Valores próximos a cero se corresponde

con una baja probabilidad de ocurrencia del hecho estudiado (menor cuanto más

próximos a cero); mientras que a valores próximos a uno se les asigna una

probabilidad elevada de ocurrencia (mayor cuanto más próximos a uno).

Por otro lado, se tiene que:

iii

iiii

y

i

y

ii

PxYE

PPPYE

pPyf

ti

xi

xi

YE

ii

)(

:que tenemos(2)con (1) comparando

(2) )(1)1(0)(

1.0y Para

)1()(

donde

),Ber(P Y

:es i

Y deón distribuci La.0i

Y que de

adprobabilid la es i

P-1y 1i

Y que de adprobabilid la es i

P que tienese Además

.0)i

E( que supone se que ya

(1) )/(

i

1

ii

Entonces la esperanza condicional de Pi puede interpretarse como la probabilidad

condicional de Yi. A continuación se demuestra un teorema.

Teorema. 1)(0 i

YP

Demostración: Por axioma de la probabilidad se tiene que )(0i

YP además,

1)( tantolopor ,)(0

:que tenemosaxiomapor vezotra ),(1)(

:entonces

1)()(

iy

iYP

iy

iYP

iy

iYP

iy

iYP

iy

iYP

iy

iYP

Esto nos indica que el valor esperado condicional de Yi dado xi tendría que estar

entre 0 y 1, es decir:

Page 10: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección

10

1)(0 i

xi

YE

Dado el modelo 1 ¿Porque no utilizar el método estándar de mínimos

cuadrados ordinarios (MCO)? Veamos algunas características del modelo lineal de

probabilidad:

Ventajas:

1) Simplicidad. Es fácil estimar por el Método de Mínimos Cuadrados Ordinarios

2) Interpretación: Los coeficientes estimados se interpretan como el efecto marginal

en la probabilidad de ocurrencia del evento.

Desventajas:

1) Podemos tener valores estimados en la variable dependiente, mayores que 1 y

menores que 0, lo que contradice la interpretación como una probabilidad,

1)(0 i

xi

YE .

2) Los errores pueden ser relativamente grandes si la relación no es lineal, y sobre

todo en la parte media de la distribución de las variables independientes.

3) Heterocedasticidad de los errores.

4) No normalidad de las perturbaciones.

5) Un valor cuestionable del R2 como medida de bondad de ajuste del modelo, ya que

el mismo tiene un valor limitado en modelos de respuesta dicotómica.

2.4.2 MODELO LOGIT Y PROBIT

Dadas las dificultades asociadas con el modelo lineal de probabilidad, es natural

transformar el modelo original de tal forma que las predicciones caigan en el intervalo

[0,1]. Es decir, para asegurar que P caiga entre 0 y 1, se requiere una función

monótona positiva que mapee el predictor lineal txxx 22110

al intervalo

[0,1]. Entonces debería adoptarse un modelo bajo el cual los valores de P i estén

restringidos al intervalo [0,1]. Una forma muy conveniente de restringir la forma

funcional es la siguiente:

txF

iiP )(

En donde F (⋅) es una función de distribución acumulada (FDA). La cual es una

función diferenciable monótona creciente con dominio ℜ y rango [0,1].

Page 11: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección

11

El modelo no lineal sería el siguiente:

.)(

con

i

txFxYE

itxF

iY

ii

Algunas características de la función

txF :

1. Obviamente se trata de una función no lineal, pero una muy particular, en el sentido

de que las variables exógenas afectan la variable endógena a través de un índice

lineal ti

x , que luego es transformado por la función F(⋅) de manera tal que los

valores de la misma sean consistentes con los de una probabilidad.

2. ¿Cómo elegir la función F(⋅)?

La función de distribución acumulada de cualquier variable aleatoria continua tiene la

propiedad de F(⋅).

Primeramente, si se elige a F(⋅) como la distribución uniforme acumulada entonces

obtenemos la construcción del modelo de probabilidad lineal.

Aunque son posibles varias alternativas de la FDA, sólo se considerarán dos: la

normal y la logística.

El modelo de probabilidad probit se asocia con la función de distribución

normal acumulada.

1

dZ

1

1

lineal.logit modelo el produce se (.) logisticaón distribuci la Usando

.)(1

:que tienese Además

N(0,1).zdecir es estándar, normal variablela es z donde

2

2

21

i

ti

xe

ti

xe

ti

xe

ti

x

xtxi

ti

x z

eti

xi

t

La gráfica 1 muestra las gráficas de las distribuciones normal y logística.

Page 12: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección

12

Gráfica 1 (Distribución acumulada normal y logística)

Elaboración propia de los autores

Las diferencias básicas entre estas dos funciones con forma de “S” invertida, residen

en el comportamiento de las colas, esto es, para valores próximos a 0 o a 1, tal como

puede apreciarse en la gráfica 1.

Dada la similitud existente entre las curvas de la normal acumulada y de la

acumulada logística, los resultados estimados por ambos modelos no difieren mucho

entre sí, ya que puede apreciarse en la gráfica 1 que discrepan, únicamente en la

rapidez con que las curvas se aproximan a los valores extremos y por lo tanto la

función logística es más achatada que la normal, al alcanzar esta última más

rápidamente los valores extremos, 0 y 1.

A pesar de su similitud, existen dos razones prácticas que aventajan al modelo

Logit:

1. Simplicidad: la ecuación de la FDA logística es muy simple, mientras que la

FDA normal involucra una integral que no es fácil de evaluar.

2. Interpretabilidad: Una interpretación más sencilla del parámetro estimado es la

que se obtiene a través de la linealización del modelo.

ti

x

ti

xe

ti

xe

ti

xe

ti

xe

ti

xe

ti

xe

i

i

ln

1

11ln

1

11

11

1

ln1

ln

Al cociente entre la probabilidad de que ocurra un hecho frente a la probabilidad de

que no suceda, se le denomina “odds ratio y/o riesgo”. Su interpretación es la

preferencia de la opción 1 frente a la opción 0, es decir, el número de veces que es

más probable que ocurra un fenómeno frente a que no ocurra.

Odss-ratio y/o riesgo = ln (πi / 1 - πi)

Page 13: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección

13

Dada un variable aleatoria, caracterizada por unos parámetros, y dada una muestra

poblacional, se consideran estimadores Máximo-Verosímiles de los parámetros de

una población determinada, aquellos valores de los parámetros que generarían con

mayor probabilidad la muestra observada. Es decir, los estimadores Máximo-

Verosímiles son aquellos valores para los cuales la función de densidad conjunta (o

función de verosimilitud) alcanza un máximo.

2.4.2.1 ESTIMACIÓN DE PARAMETROS EN EL PROBIT

En el caso del modelo Probit, la función de verosimilitud es:

iY

ti

xi

Yti

xn

iL

11

1

Aquí puede apreciarse que, para cada individuo i, el termino correspondiente

en la función de verosimilitud es, simplemente, t

i

t

i xx -1 o , dependiendo de qué

Yi=1 o Yi=0. Por tanto, considerando el logaritmo de la verosimilitud se tiene que:

0 1

ementeequivalent o,

0 1

)1(

Lln

:que tienen se , vector al respectocon derivadas Calculando

1ln)1(

1

lnln

1

´

11

i

t

it

i

t

i

t

iin

i

t

i

t

i

t

i

t

in

i

iit

i

t

in

i

i

xxfxx

xY

xxfdonde

x

xfYx

x

xfY

ti

xi

Yti

xn

ii

YL

El cual se trata de un sistema de k- ecuaciones no lineales.

2.4.2.2 ESTIMACIÓN DE PARAMETROS EN EL LOGIT

Suponiendo que las observaciones son independientes, la función de densidad

conjunta de las variables dicotómicas Yi queda como:

Page 14: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección

14

n

i

xt

ii

n

i

xn

i

t

ii

ti

ti

exY

eLnxYL

o

ni

ti

xe

ni

ti

xi

Y

eti

xF

iY

ti

xF

iY

L

1

11

1ln

1ln

:mismo lo es que lo ,

11

1

10

1

01

lnln

,

,1Zln

: tienese 1xk, filaun vector ,por Z Denotando

1

1

t

1

t

ti

ti

ti

x

n

i

x

i

n

i

x

n

i

t

ii

e

ex

ZL

y

eLnL

xY

El cual se trata de un sistema de k-ecuaciones no lineales por lo que es

necesario aplicar un método iterativo o algoritmo de optimización que permita la

convergencia de los estimadores3.

3. DESCRIPCIÓN DE LA BASE DE DATOS

3.1 MECOVI Y ENCUESTA DE HOGARES BOLIVIA

Bolivia ingresa como país miembro del “Programa para el Mejoramiento de las

Encuestas y Medición de Condiciones de Vida en América Latina y el Caribe”

(MECOVI) en mayo de 1999, a partir del mes de junio se da inicio al trabajo de

preparación de la primera Encuesta de Hogares (EH). En noviembre del mismo año

se llevó a cabo la primera recolección de datos en el país en el marco del Programa

MECOVI4.

Esta experiencia de encuesta multitemática y de mayor alcance le permitió al

INE, llevar a cabo encuestas de hogares cada año, optimizando los procesos de

validación y consistencia de información.

Entre los años 2003 y 2004 se ejecutó la Encuesta Continua de Hogares con

características similares a una encuesta de Presupuestos Familiares, conservándose

3 Usualmente los softwares lo resuelven por el método de máximo verosimilitud, aunque existe otro tipo de

algoritmos que permita resolver la convergencia de las estimaciones. 4 Tomado del Documento Metodológico de la Encuesta de Hogares del INE-BOLIVIA 2009.

Page 15: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección

15

los tradicionales contenidos de la encuesta, haciendo énfasis en la temática de

ingresos y gastos del hogar.

Para los años 2005 y 2007 se retomó la modalidad de encuestas puntuales de

hogares, con la ejecución de la Encuesta de Hogares, que mantuvo como temática de

exploración a las condiciones de vida de la población boliviana, a través de la

aplicación del cuestionario multitemático que permite la investigación de las

características generales, salud, educación, empleo, ingresos, gastos, vivienda e

ingresos del productor agropecuario independiente.

La Encuesta de Hogares 2008, retomó en la sección de Salud las

enfermedades diarreicas agudas y las Infecciones respiratorias agudas. Se

incorporaron preguntas nuevas en relación al Nivel de Instrucción y Ocupación de los

padres ausentes, impacto de políticas como las Chispitas Nutricionales, Vacuna

contra el Rotavirus, el Desayuno Escolar y la Renta Dignidad. En la sección de

Ingresos no Laborales, se incorporan las remesas para ver el impacto

socioeconómico en la población y finalmente en la sección de Gastos el módulo de

Turismo, para cuantificar los gastos efectuados por los viajes que realizan los

miembros del hogar fuera de su lugar habitual de residencia.

La Encuesta de Hogares 2009, es una investigación por muestreo efectuada a

hogares particulares que mantuvo la metodología de exploración a las condiciones

de vida de la población boliviana, a través de la aplicación de un cuestionario

multitemático que permite investigar: las características generales sociodemográficas,

salud, educación, empleo, ingresos y gastos de los miembros del hogar, y las

características de la vivienda y servicios básicos de los hogares, para la generación

de indicadores de pobreza, que permita la (formulación, evaluación, seguimiento de

políticas y el diseño de programas de acción en el área social), que contribuyan en

última instancia a mejorar las condiciones de bienestar de los hogares y reducir la

pobreza en el país.

3.1.1 OBJETIVOS

Tanto el Mecovi como la Encuesta de Hogares tienen objetivos muy parecidos, por lo

mismo, el objetivo general del programa es generar de forma adecuada información

sobre las condiciones de vida de la población, en términos de alcance, cobertura,

confiabilidad, y sobre todo, relevancia para fines de políticas dirigidas hacia la

reducción de la pobreza y el aumento de la equidad social.

Específicamente el programa busca:

Page 16: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección

16

Fortalecer los sistemas de encuestas de hogares, para generar una mejor y más

completa información sobre el estado de la pobreza y las condiciones de vida, y

así apoyar a la formulación de políticas en el sector social.

Capacitar a los técnicos nacionales para mantener y operar los nuevos sistemas.

Brindar asistencia y capacitar al personal sectorial en el análisis de las encuestas

para el diseño, monitoreo y evaluación del impacto de políticas dirigidas hacia la

reducción de la pobreza.

Ahora focalizándonos en nuestro trabajo de investigación, lo que realizamos es

tomar la base de datos completa del MECOVI 2002 y la ENCUESTA DE HOGARES

20095, procesamos los datos en Excel y Stata versión 12 y finalmente procedemos a

seleccionar las variables socioeconómicas de nuestro interés de estudio6. Al mismo

tiempo para lograr un mejor análisis de nuestros resultados econométricos,

desarrollamos programas que nos permitan clasificar mejor las variables de estudio7.

4. RESULTADOS EMPIRICOS

4.1 MODELOS A APLICAR

El Modelo que se aplicara en el presente trabajo de investigación son modelos de

elección discreta:

Modelo lineal de probabilidad con y sin corrección de heterocedasticidad

Modelo Gompit o de valor extremo

Modelo Logit

- Efectos marginales.

- Analisis de sensitividad.

- Análisis de especificidad.

Modelo Probit

- Efectos marginales.

- Análisis de sensitividad.

- Análisis de especificidad.

5 Se realiza un estudio comparativo entre los años 2002 y 2009, la razón de ello se debe a que la página web del

INE-BOLIVIA solo tienen publicado la encuesta de hogares hasta el año 2009, y por lo tanto en la misma no se encuentra bases de datos de encuesta de hogares para los años posteriores (2010,…, 2012, etc.). 6 Variables como: edad, ingreso del hogar per cápita de familia, incidencia de pobreza, estado civil, etc.

7 Por ejemplo para la variable de estudio “indaprendio (1=No Indigena y 0=Indígena)”, se ejecutó un programa que

permita solo clasificar a los “no indígenas” solo a aquellas personas cuya lengua que aprendieron a hablar es el castellano y/o idioma extranjero, mientras los considerados “indígenas” eran personas cuya lengua que aprendieron a hablar fuese un idioma nativo (aimara, quechua, guaraní,etc.), no se tomó en cuenta a los que no pueden hablar, el análisis es análogo, por ejemplo para la variable explicada (universitario y no universitario) y también para el estado civil.

Page 17: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección

17

4.2 RESULTADOS DEL MODELO PARA EL 2002

Cuadro 1 (Modelos de elección discreta 2002)

Variables8

Modelo 1 Modelo Lineal Probabilidad

Modelo 2 Logit

Efectos Marginales

Modelo 3 Probit

Efectos Marginales

Modelo 4 Logistico

Odds-Ratio

Modelo 5

Gompit

Valor

Extremo

PO

-0.066

[-4.70]***

-0.035

(-105.77)***

-0.047

(-116.58)***

0.496

(-130.89)***

-0.347

(-6.977)*** YHOGPCF

0.004 [3.30]***

0.001 (85.55)***

0.00013 (85.83)***

1.000 (90.98)***

0.0001 (3.831)***

INDAPRENDIO

-0.046

[-4.95]***

-0.038

(-105.61)***

-0.049

(-126.18)*** 0.413

(-104.83)***

-0.384

(-6.331)*** SOLTERO

0.171

[14.49]***

0.094

(201.20)***

0.115

(253.14)***

7.571

(274.73)***

0.829

(14.938)***

EDAD

0.007 [5.11]***

0.003 (101.14)***

0.004 (109.31)***

1.068 (113.19)***

0.032 (5.016)***

SEXO

-0.014

[1.27] -0.005

(23.45)***

-0.006

(22.77)*** 0.916

(23.59)***

- 0.075

(1.756)* URB_RUR

-0.103

[-13.62]***

-0.127

(-262.50)*** -0.139

(-262.29)***

0.069

(-171.57)***

-0.723

(-11.672)*** Constante

0.021

[0,51]

-1.163

(-5,685)***

Valor Predicho por Modelo 13.52% 10.88% 10.56% 12.54%

R2 0,15 (Pseudo R2)

0,23

(Pseudo R2)

0.23

0.23

McFadden (R2) 0.23 0.23 0.23

Maximum Likelihood (R2)

(heterocedast.)

0.17 0.17

McKelvey & Zavoina (R2) 0.55 0.51

Conteo (R2) 0.87 0.86

Cragg & Uhler (R2) 0.31 0.31

Efron (R2) 0.18 0.17

Correcta Clasificación (R2) 86.43% 86.54%

AIC 0.531 0.605 0.605 0.545

BIC -44550.53 -2.718e+07 -2.718e+07 0.554

Log likelihood Full Model -1456.372 -592213.147 -591556.617 -592213.15 -1495.394

Numero de Observaciones 5517 1957798 1957798 1957798 5517

Numero de Iteraciones 6 5 5

[Wald chi2(7)] (significancia

conjunta de variables]

200372.50 207218.80 200372.50

Pvalue: [Wald chi2(7)] 0.000 0.000 0.000

F( 7, 5509) (significancia

conjunta de variables]

81.54 903.752

Pvalue: F( 7, 5509) 0.0000 0.0000

(***, **, *): Significativo al 1% de significancia (99% de confianza), 5% de significancia (95% de confianza) y 10% de significancia (90% de confianza, [ ] = estadístico “t”, ( ) = estadístico “z”

Elaboración propia de los autores

8 Variable explicada: licenciatura=> 1:universitario y 0=no universitario

* Variables explicativas: sigue así=> Soltero=> 1:soltero y 0:no soltero; Indaprendio=> 1:No indígena y 0:indígena * Incidencia de pobreza (p0)=> 1:pobre y 0:no pobre * Urb_rur (zona donde vive)=> 1:rural y 0:urbana; Sexo (genero)=> 1:mujer y 0:hombre Por ejemplo, la variable de estudio “indaprendio (1=No Indígena y 0=Indígena)”, se ejecutó un programa que permita solo clasificar a los “no indígenas” solo a aquellas personas cuya lengua que aprendieron a hablar es el castellano y/o idioma extranjero, mientras los considerados “indígenas” eran personas cuya lengua que aprendieron a hablar fuese un idioma nativo (aimara, quechua, guaraní, etc.), no se tomó en cuenta a los que no pueden hablar, el análisis es análogo se hicieron para las demás variables, tanto para la base de 2002 y 2009.

Page 18: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección

18

Podemos advertir que el Logit (modelo 2) y Probit (modelo 3) maximizan la función de

verosimilitud en la sexta y quinta iteración respectivamente. Por otro lado el predicho

de la variable explicada dicótoma para el año 2002 (probabilidad de ser universitario 1

y 0 lo contrario) indica que el 13.52% de nuestra base de datos participo en la

actividad universitaria de estudios de pregrado para el modelo lineal de probabilidad,

un 10.88% para el modelo logit, un 10.56% para el modelo probit respectivamente9 y

12.54% para el modelo gompit.

En los cinco modelos (modelo lineal de probabilidad, logit, probit, Odss-ratio y

gompit) del cuadro 1, es claro a simple vista que si las personas son solteras, de

mayor edad, de género masculino, con mayor ingreso del hogar per cápita de familia,

no pobres, que provienen fundamentalmente del área urbana tienen mayores

posibilidades de participar en la actividad universitaria para el año 2002. Sin embargo,

queda una duda respecto a un parámetro. Nos referimos a la variable indaprendio

(indígena y no indígena) ya que la misma estaría en una posición contradictoria con

respecto a la zona de donde proviene la persona (área rural y/o urbana).

Ahora con relación a los efectos marginales, el común denominador de los

cinco modelos de las variables explicadas más significativas (modelos 1, 2, 3, 4 y 5,

del cuadro 1) estuviera dado por dos variables: soltero y zona de donde proviene

(urbana o rural). Ambas variables para los cinco modelos, nos afirmarían de manera

general que existe mayor posibilidad para una persona soltera y que provenga de la

zona urbana tenga mayores posibilidades de participar en la educación de pregrado

en Bolivia. Por ejemplo, con respecto a la variable soltero el efecto marginal del

modelo logit y probit nos diría que las personas solteras tienen 9,5% y 11.5% más de

probabilidad de participar en la actividad universitaria que los no solteros10.

También es importante el efecto negativo de que la persona provenga del área

rural (urb_rur), reduciendo en promedio para ambos modelos (logit y probit) 13,3% la

probabilidad de participar en la actividad universitaria. Asimismo, los incrementos en

la edad y el ingreso del hogar per cápita de familia (modelos 2 y 3, cuadro 1),

aumentan alrededor de 0.4 y 0.01 puntos porcentuales la probabilidad de éxito.

9 El valor predicho del modelo logit de 10.88% implicaría un total de matriculados para el 2002 de 215358

alumnos, mientras que para el probit la estimación estaría alrededor de 205569 alumnos, que en ambos modelos (logit y probit, modelos 2 y 3 del cuadro 1) pronostican y simulan casi de manera exacta los resultados reales, ello debido a que según las estadísticas de la CEUB (Comité Ejecutivo de la Universidad de Bolivia) el número de matriculados en el año 2002 fue de 218830 alumnos, véase para este dato: http://www.ceub.edu.bo/index.php?option=com_content&view=article&id=104&Itemid=132, ello nos diría que el error que se cometió en el pronóstico del modelo logit y probit (modelos 2 y 3, cuadro 1) es de 0.015% y 0.061% respectivamente, que en ambos casos son errores muy pequeños, “DYEP”. 10

Por no solteros entiéndase personas casadas o que viven en concubinato, que de por si implica mayores

responsabilidades.

Page 19: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección

19

Ahora con respecto al ratio de odds y/o riesgo11 (cociente de probabilidades del

modelo 4, cuadro 1) por ejemplo, se tendría un valor mayor a la unidad para las

variables: soltero y edad, ello implica que las personas solteras y de mayor edad

tienen mayor probabilidad de éxito de la ocurrencia del evento (ser universitarios de

pregrado). Asimismo el ingreso del hogar percápita de familia, tiene un valor igual a la

unidad (ratio de odss y/o riesgo), ello significa que la probabilidad de que ocurra la

alternativa 1 (participar en la educación de pregrado) es la misma que la de que no

ocurra.

En síntesis, se puede advertir que las estimaciones de los Odds-Ratio (riesgo)

se complementan con las interpretaciones de los efectos marginales y en ninguno de

los casos se contradicen.

Gráfico 2 Relación entre el valor observado de la variable dependiente del modelo 1 y 3 (cuadro 1), el

valor predicho de la variable dependiente, y el ingreso del hogar per cápita de familia

Elaboración propia de los autores

Tomando todo las variables explicativas constante (evaluados en algún valor)

excepto la variable ingreso del hogar per cápita de familia (yhogpcf) podemos graficar

la relación estimada entre la variable dependiente binaria que toma valor 1 si la

persona ha participado en la vida universitaria de pregrado y el ingreso del hogar per

cápita de familia. Por ejemplo, tomemos la edad en 25, una persona soltera, hombre,

que proviene del área urbana, no indígena y no pobre. El gráfico 2 (izquierda)

muestra la relación entre el valor observado de la variable dependiente, el valor

predicho de la variable dependiente, y el ingreso del hogar per cápita de familia

(yhogpcf). Mientras el gráfico 2 (derecha) nos muestra la probabilidad predicha por el

probit, siguiendo la misma analogía

11

El interés de esta medida adquiere sentido cuando se comparan las ventajas para distintos valores de la variable explicativa, calculándose el cociente entre odds. Así, si se compara la situación de la observación “i” con la de la observación “j” (que suele ser la de referencia), el cociente entre odds mide cuanto es más probable que se de la alternativa 1 en “i” que en “j”

Page 20: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección

20

Gráfico 3 [Predicción estática modelo 1, cuadro 1 (izquierda) y

Prueba de normalidad Chi-Cuadrado (derecha)]

Elaboración propia de los autores

Porcentaje de aciertos por los modelos no lineales de probabilidad (logit y probit): análisis de sensitividad y especificidad

Cuadro 2 (Análisis de Sensitividad y Especificidad con un umbral de 0.5 )

-------- True -------- (Modelo Logit)

Clasificación D ~D Total

+ 10043 11025 21068

- 254597 1682133 1936730

Total 264640 1693158 1957798

-------- True -------- (Modelo Probit)

Clasificación D ~D Total

+ 9760 8646 18406

- 254880 1684512 1939392

Total 470053 1693158 1957798

Clasificado + Si el predicho Pr(D) >= 0.5 Verdad D definido como licenciatura != 0

LOGIT

Sensitividad

Especificidad

Valor predicho positivo

Valor predicho negativo

LOGIT

Pr( +| D)

Pr( -|~D)

Pr( D| +)

Pr(~D| -)

LOGIT

3.79%

99.35%

47.67%

86.85%

PROBIT

Sensitividad

Especificidad

Valor predicho positivo

Valor predicho negativo

PROBIT

Pr( +| D)

Pr( -|~D)

Pr( D| +)

Pr(~D| -)

PROBIT

3.69%

99.49%

53.03%

86.86%

Logit: Clasificación correcta (R2) 86.43%

Probit: Clasificación correcta (R2) 86.54%

Elaboración propia de los autores

Tanto el análisis de sensitividad y de especificidad nos dan a conocer la clasificación

correcta de que las personas en un rango de edad de 17 y 30 años participen o no de

la actividad universitaria. Asimismo el coeficiente de determinación de conteo en

ambos modelos es elevado, alcanzando un 86.43% en el modelo logit y un 86.54% en

Page 21: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección

21

el probit, que en ambos casos se basan en el cálculo de las predicciones correctas

hechas por el modelo.

La interpretación seria que en un 86.43% y 86.54% las variaciones de la

variable explicada dicotoma vienen explicadas por variaciones de las variables

explicativas y en un 13.57% y 13.46% por el termino de error ecuacional que su vez

este anida a variables periféricas que no han sido incluidas por razones de falta de

información y parsimonia.

Gráfico 4 (Característica operativa del receptor: Logit)

Gráfico 5 (Característica operativa del receptor: Probit)

Elaboración propia de los autores

En los gráficos 4 y 5 de las características operativas del receptor, tanto del modelo

logit y probit, podemos advertir que los resultados gráficos son congruentes y se

complementan con los resultados obtenidos en el análisis de sensitividad y

especificidad del cuadro 2.

Page 22: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección

22

4.3 RESULTADOS DEL MODELO PARA EL 2009

Cuadro 312

(Modelos de elección discreta 2009) Variables

Modelo 6 Modelo Lineal Probabilidad13

Modelo 7 Logit

Efectos Marginales

Modelo 8 Probit

Efectos Marginales

Modelo 9 Logistico

Odds-Ratio

Modelo 10

Gompit

Valor

Extremo

PO

-0. 085

[-5.53]***

-0. 063

(-157.61)***

-0.074

(-166.41)***

0.498

(-158.37)***

-0.341

(-5.653)*** YHOGPCF

8.31e-04 [0.91]

2.03e-04 (13.87)***

2.66e-04 (18.14)***

1.000 (13.90)***

0.0002 (1.748)*

INDAPRENDIO

0. 094

[7.28]***

0.121

(283.13)***

0.130

(298.43)*** 6.205

(177.37)***

0.663

(7.491)*** SOLTERO

0. 259

[16.05]***

0.170

(341.44)***

0.194

(395.54)***

7.372

(387.57)***

0.978

(15.131)***

EDAD

0. 026

[14.10]***

0.018

(335.50)***

0.022

(374.70)***

1.215

(401.32)***

0.113

(14.276)***

SEXO

0. 035 [2.46]***

0.022

(62.59)***

0.025 (61.29)***

1.269 (62.78)***

0.098

(1.956)** URB_RUR

-0.123

[-9.10]***

-0.163

(-241.32)*** -0.174

(-253.61)***

0.177

(-216.94)***

-0.707

(-10.196)*** Constante

-0.523

[-8.13]***

-3.613

(-13,65)***

Valor Predicho por Modelo 20.01% 13.55% 13.37% 17.54%

R2 0,20 (Pseudo R2): 0,23 (Pseudo R2): 0.24 0.24

McFadden (R2) 0.24 0.24 0.24

Maximum Likelihood (R2)

(heterocedast.)

0.21 0.21

McKelvey & Zavoina (R2) 0.51 0.50

Conteo (R2) 0.82 0.82

Cragg & Uhler (R2) 0.34 0.34

Efron (R2) 0.23 0.23

Correcta Clasificación (R2) 81.69% 81.70%

AIC 0.793 0.761 0.761 0.755

BIC -25335.42 -3.268e+07 -3.268e+07 0.741

Log likelihood Full Model -1360.92 -894108.078 -892781.321 -894108.08 -1271.275

Numero de Observaciones 3452 2349387 2349387 2349387 3452

Numero de Iteraciones 5 5 6

[Wald chi2(7)] (significancia

conjunta de variables]

329216.30 348939.06 329216.30

Pvalue: [Wald chi2(7)] 0.000 0.000 0.000

F( 7, 3444) (significancia

conjunta de variables]

98.48 101.397

Pvalue: F( 7, 5509) 0.0000 0.0000

(***, **, *): Significativo al 1% de significancia (99% de confianza), 5% de significancia (95% de confianza) y 10% de significancia (90% de confianza, [ ] = estadístico “t”, ( ) = estadístico “z”

Elaboración propia de los autores

12

Los modelos Logit, Probit y Odss-ratio (riesgo) del cuadro 1 y 3 (modelos 2, 3, 4, 7, 8 y 9) se los estimo con el

denominado FACTOR DE EXPANSIÓN, mientras los modelos lineales de probabilidad y el modelo Gompit (valor extremo) sin factor expansión. Sin embargo, para todos los modelos se estimó modelos de elección discreta restringidos por edad (17 a 30 años de edad). 13

Las pruebas de heterocedasticidad y normalidad de los modelos 1 (cuadro 1) y modelo 6 (cuadro 3) se encuentran en el Anexo 1 (cuadro A1 y gráfico A1)

Page 23: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección

23

Podemos advertir que el Logit (modelo 7) y Probit (modelo 8) maximizan la función de

verosimilitud en la quinta iteración respectivamente. Por otro lado el predicho de la

variable explicada dicótoma para el año 2009 (probabilidad de ser universitario 1 y 0

lo contrario) indica que el 20.01% de nuestra base de datos participo en la actividad

universitaria de estudios de pregrado para el modelo lineal de probabilidad, un

13.55% para el modelo logit, un 13.37% para el modelo probit respectivamente14 y un

17.54% para el modelo gompit.

En los cinco modelos (modelo lineal de probabilidad, logit, probit, odds-ratio y

gompit) del cuadro 3, es claro a simple vista que si las personas son solteras, de

mayor edad, no indígenas, con mayor ingreso del hogar per cápita de familia, no

pobres, que provienen fundamentalmente del área urbana tienen mayores

posibilidades de participar en la actividad universitaria para el año 2009. Sin embargo,

queda una duda respecto a un parámetro, la variable sexo, ya que la misma nos

afirmaría que las mujeres tuvieran más posibilidades de participar en la actividad

universitaria en el año 200915.

Ahora con relación a los efectos marginales, el común denominador de los

cinco modelos de las variables explicadas más significativas (modelos 6, 7, 8, 9 y 10,

del cuadro 3) estuviera dado por tres variables: soltero, edad y zona de donde

proviene (urbana o rural). Las tres variables para los cinco modelos, nos afirmarían de

manera general que existe mayor posibilidad para una persona soltera, con mayor

edad y que provenga de la zona urbana tenga mayores posibilidades de participar en

la educación de pregrado en Bolivia. Por ejemplo, con respecto a la variable soltero el

efecto marginal del modelo logit y probit nos diría que las personas solteras tienen

17% y 19.4% más de probabilidad de participar en la actividad universitaria que los no

solteros, el mismo tratamiento, tanto para la variable edad y la zona de donde

provenga (urbana o rural: urb_rur). Asimismo, los incrementos en el ingreso del hogar

per cápita de familia aumentan en promedio en los dos modelos (modelos 7 y 8,

cuadro 3) alrededor de 0.03 puntos porcentuales la probabilidad de éxito

14

El valor predicho del modelo logit de 13.55% implicaría un total de matriculados para el 2009 de 318342 alumnos, mientras que para el probit la estimación estaría alrededor de 314113 alumnos, que en ambos modelos (logit y probit, modelos 7 y 8 del cuadro 3) pronostican y simulan casi de manera exacta los resultados reales, ello debido a que según las estadísticas de la CEUB (Comité Ejecutivo de la Universidad de Bolivia) el número de matriculados en el año 2009 fue de 331392 alumnos, véase para este dato: http://www.ceub.edu.bo/index.php?option=com_content&view=article&id=104&Itemid=132, ello nos diría que el error que se cometió en el pronóstico del modelo logit y probit (modelos 7 y 8, cuadro 3) es de 0.039% y 0.052% respectivamente, que en ambos casos son errores muy pequeños, “DYEP”. 15

En los modelos (1,2,…,5) del cuadro 1, es congruente que los modelos afirman que los hombres tienen mayores posibilidades de acceder a la educación de pregrado en Bolivia en el 2002, lo cual es congruente con las estadísticas de la CEUB-BOLIVIA (http://www.ceub.edu.bo) para el año 2002. Sin embargo, este resultado del género para el 2009 cambia en favor de las mujeres.

Page 24: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección

24

Gráfico 6 Relación entre el valor observado de la variable dependiente del modelo 6 y 8 (cuadro 3),

el valor predicho de la variable dependiente, y el ingreso del hogar per cápita de familia

Elaboración propia de los autores

Tomando todo las variables explicativas constante (evaluados en algún valor) excepto

la variable ingreso del hogar per cápita de familia (yhogpcf) podemos graficar la

relación estimada entre la variable dependiente binaria que toma valor 1 si la persona

ha participado en la vida universitaria de pregrado y el ingreso del hogar per cápita de

familia. Por ejemplo, tomemos la edad en 25, una persona soltera, hombre, que

proviene del área urbana, no indígena y no pobre. El gráfico 6 (izquierda) muestra la

relación entre el valor observado de la variable dependiente, el valor predicho de la

variable dependiente, y el ingreso del hogar per cápita de familia (yhogpcf). Mientras

el gráfico 6 (derecha) nos muestra la probabilidad predicha por el probit, siguiendo la

misma analogía.

Gráfico 7 [Predicción estática modelo 6, cuadro 3 (izquierda) y

Prueba de normalidad Chi-Cuadrado (derecha)]

Elaboración propia de los autores

El gráfico 7 nos muestra la predicción estática con intervalos de confianza al 95% y la

prueba de normalidad de chi-cuadrado para el modelo lineal de probabilidad (modelo

6, cuadro 3), la misma nos indica que no se cumple la normalidad de los errores del

modelo 6, el análisis es análogo del gráfico 3 para el modelo 1 (cuadro 1).

Page 25: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección

25

Porcentaje de aciertos por los modelos no lineales de probabilidad (logit y probit): análisis de sensitividad y especificidad

Cuadro 4 (Análisis de Sensitividad y Especificidad con un umbral de 0.5 ) -------- True -------- (Modelo Logit)

Clasificación D ~D Total

+ 143957 104043 248000

- 326096 1775291 2101387

Total 470053 1879334 2349387

-------- True -------- (Modelo Probit)

Clasificación D ~D Total

+ 136491 96414 232905

- 333562 1782920 2116482

Total 470053 1879334 2349387

Clasificado + Si el predicho Pr(D) >=0 .5 Verdad D definido como licenciatura != 0 LOGIT

Sensitividad

Especificidad

Valor predicho positivo

Valor predicho negativo

LOGIT

Pr( +| D)

Pr( -|~D)

Pr( D| +)

Pr(~D| -)

LOGIT

30.63%

94.46%

58.05%

84.48%

PROBIT

Sensitividad

Especificidad

Valor predicho positivo

Valor predicho negativo

PROBIT

Pr( +| D)

Pr( -|~D)

Pr( D| +)

Pr(~D| -)

PROBIT

29.04%

94.87%

58.60%

84.24%

Logit: Clasificación correcta (R2) 81.69%

Probit: Clasificación correcta (R2) 81.70%

Elaboración propia de los autores

El coeficiente de determinación de conteo en ambos modelos es elevado,

alcanzando un 81.69% en el modelo logit y un 81.70% en el probit, que en ambos

casos se basan en el cálculo de las predicciones correctas hechas por el modelo. La

interpretación seria que en un 81.69% y 81.70%16 las variaciones de la variable

explicada dicotoma vienen explicadas por variaciones de las variables explicativas y

en un 18.31% y 18.30% por el termino de error ecuacional que su vez este anida a

variables periféricas que no han sido incluidas por razones de falta de información y

parsimonia.

16

Evidentemente, al tratarse de modelos no lineales carece de sentido plantear la bondad del ajuste en los términos que definen el coeficiente de determinación (R

2). Existen criterios alternativos que, en cierto modo,

siguen la misma idea (R2 de conteo, McFadden, McKelvey y Zavoina, Efron, etc. ). Sin embargo, todas estas

medidas deben interpretarse con cierta cautela, su validez como criterios de selección del modelo es ciertamente limitada.

Page 26: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección

26

Gráfico 817

(Característica operativa del receptor: Logit)

Gráfico 9 (Característica operativa del receptor: Probit)

Elaboración propia de los autores

Los gráficos 8 y 9 de las características operativas del receptor18, tanto del

modelo logit y probit, podemos advertir que los resultados gráficos son congruentes y

se complementan con los resultados obtenidos en el análisis de sensitividad y

especificidad del cuadro 4.

5. CONCLUSIONES

Este trabajo ha intentado caracterizar los factores que podrían influir en el acceso a

la educación de pregrado en Bolivia, para el mismo se utilizó variables que dicta la

teoría económica y al mismo tiempo se añadieron otras variables explicativas, que

creemos podrían influir en la variable explicada. Para tal efecto estimamos distintos

modelos de elección discreta, así como análisis de sensitividad y especificidad para

conocer la proporción de predicciones correctas por nuestros modelos.

De manera general para los dos años en comparación 2002 y 2009, según

nuestras estimaciones, es claro a simple vista que si las personas son solteras, de

17

El análisis grafico de sensitividad y especificidad de los gráficos (3, 4, 6 y 7) se basan en estimaciones de la

muestra estudiada, una estimación para todas las observaciones se encuentra en los gráficos A3 y A4 del Anexo 1. 18

Las estimaciones con mínimos cuadrados ponderados, para corregir el problema de heterocedasticidad que se

da en los modelos lineales de probabilidad (modelos 1 y 6, cuadros 1 y 3), se encuentran en el cuadro A2 del Anexo 1.

Page 27: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección

27

mayor edad, con mayor ingreso del hogar per cápita de familia, no pobres y que

provienen fundamentalmente del área urbana tienen mayores posibilidades de

participar en la actividad universitaria. Al mismo tiempo, nuestros modelos indican

también, que la proporción de matriculados en el sistema universitario habría

aumentado de 215358 alumnos (2002) a 318342 alumnos para el 2009 según las

estimaciones del modelo logístico19, cuando la CEUB, en sus datos estadísticos

registra un aumento de 218830 alumnos (2002) a 331392 alumnos para el 2009. En

ambas situaciones, nuestras estimaciones y los datos estadísticos de la CEUB son

bastante parecidas.

Por otro lado, el aumento de la base de matriculados en un 66.03% en el

periodo 2002 al 2009, podría deberse a varios factores, entre ellas: la política

gubernamental del actual gobierno, bajo el lema de mayor y mejor educación para

todos, que la misma se vio reflejada en incrementos presupuestarios del gobierno

nacional al sistema universitario en los últimos años que provienen fundamentalmente

del ingreso de la venta de gas y sus derivados a nuestros principales socios

comerciales. Asimismo, hay que reconocer también el mayor interés que han

mostrado estudiantes de zonas no urbanas de participar en la educación superior,

que la misma se vio complementada y apoyada, con la apertura y descentralización

de universidades de las principales urbes, a zonas conurbadas y/o zonas rurales,

como ejemplo: la apertura de universidades en la ciudad del Alto, siglo XX, etc.

Si bien ha existido un aumento en la base de matriculados en el sistema

universitario durante el periodo en estudio, sería importante responder, que

proporción de los alumnos matriculados, efectivamente termina la carrera profesional

y al mismo tiempo que proporción de los mismos ejerce laboralmente la carrera

profesional que ha estudiado, esta última pregunta es importante, debido a la

informalidad que caracteriza a Bolivia y a toda la región latinoamericana.

Para finalizar los dos modelos (Logit y Probit) son muy parecidos que no

permite un alto grado de discriminación, la única diferencia es desde el punto de vista

gráfico, ya que la curva logistica tiene colas mucho más planas con relación a la

probit (curva probit se acerca mucho más rápido a los ejes asintóticos), por lo tanto su

elección estar en función a dos aspectos:

- Conveniencia matemática.

19

Se realiza un análisis análogo para las estimaciones del modelo Probit de los dos años en estudio

Page 28: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección

28

- Discriminación basada en medidas de bondad de ajuste (R2) y

utilización de estadísticos que reflejen la significancia de la variables

explicativas (Estadístico z)

Por último, nuestros modelos cumplen con los siguientes requisitos:

Principio de Parsimonia: Explicar mucho con poco (Milton Friedman)

Bondad del Ajuste: La cual se ve reflejada en los enfoques de discriminación que

tiene por objetivo seleccionar aquel modelo que cumpla con algunos criterios de la

bondad del ajuste en nuestro caso el Rseudo de Daniel Macfadden y el coeficiente

de determinación de conteo.

Consistencia Teórica: En los modelos de elección discreta los coeficientes de

regresión son estadísticamente significativos, reflejados en los estadísticos {T y Z

> 2} con signos esperados a priori de acuerdo con la evidencia empírica

internacional.

BIBLIOGRAFÍA

Ashenfelter, O. y Krueger, A. (1994): «Estimating the returns schooling using a nex sample of twins». American Economic Review, 84, pp. 1157-1173. Arrow, K. (1973). “Higher education as a filter” en Journal of Public Economics, núm. 2, pp. 193-216.

Barro, R. J. (1991): «Economic Growth in a Cross-Section of Countries». Quarterly Journal of Economics, 106 (2), pp. 407-443. Becker, G. S. (1964). Human capital, Nueva York: Columbia University Press. __________

(1975). Human capital: a theoretical and empirical analysis whit special reference to education, Nueva York: Columbia University Press.

Caballero, Benigno (2003). “Manual de Econometría”, Universidad Técnica de Oruro. Card, D. (2000): «Estimating the returns to schooling: progress on some persistent problems». NBER Working Paper, 7769: National Bureau of Economic Research. Cambridge, MA. Cohn, E., Kicker, B. y Oliveira, M. (1987): «Further Evidence on the Screening Hypotesis». Economic Letters, 25, pp. 289-294. Denison, E. F. (1962): The Sources of Economic Growth in the US and the Alternatives Before Us. The Brookings Institute. Washington, DC. Dixit, A. K. (1990). Optimization in economic theory, RU: Oxford University Press. Freeman, R. B. (1976). The over-educated american, Nueva York: Academic Press.

Page 29: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección

29

Heckman, J. J. (1976). “A life cycle modern of earnings, learning and consumption” en Journal of Political Economy, núm. 84, S11-S44.

Huffman, W. E. (1981). “Black-white human capital differences: impact on agricultural

productivity in the US south” en American Economic Review, núm.71, pp. 94-107.

Layard, P. R. G. y Psacharopoulos, G. (1974). “The screening hypothesis and

thereturns to education” en Journal of Political Economy, núm. 82, pp. 985-98.

Mankiw, N. G., Romer, D. y Weil, D. N. (1992): «A Contribution to the Empirics of Economic Growth». Quarterly Journal of Economics, 107 (2), pp. 407-437. Mincer, J. (1974). Schooling, experience and earnings, Nueva York: National Bureaufor Economic Research.

Pontryagin, L. S., Boltyanskii, V. G., Gamkrelidze, R. V. y Mischenko, E. F. (1962).The mathematical theory of optimal processes, Nueva York: Wiley.

Psacharopoulos, G. (1973). Returns to education, Amsterdam: Elsevier. __________

(1975). Earnings and education in OECD countries, París: OCDE. __________

(1981). “Returns to education: an updated international comparison” en Comparative Education, núm. 17, pp. 321-41.

Solow, R. M. (1956): «A Contribution to the Theory of Economic Growth». Quaterly Journal of Economics, 70 (February), pp. 65-94. Schultz, T. (1961). “Investment in human capital” en American Economic Review,núm. 51, pp. 1-17.

Spence, M. (1973). “Job market signalling” en Quarterly Journal of Economics, núm.

8, pp. 355-74.

Wilson, R. A. (1987). “The determinants of the earnings of professional engineersin Great Britain in 1981” en Applied Economics, núm. 19, pp. 983-94. Sitios Webs: Instituto Nacional de Estadística (INE-BOLIVIA): Base de datos de encuesta de hogares 2002 y 2009. Banco Central de Bolivia (BCB): Base de datos y estadísticas. Comité Ejecutivo de la Universidad de Bolivia (CEUB): Base de datos y estadísticas. Unidad de Análisis de Políticas Sociales y Económicas (UDAPE): Base de datos y estadísticas. Libros: GUJARATI DAMODAR, Econometría. 2007

MADALA. Econometria, 1996.

Page 30: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección

30

GREENE WILLIAM, Econometría, 2005

http://www.ine.gov.bo/mecovi/index.htm

ANEXO 1

Cuadro A1 Pruebas de heterocedasticidad al modelo lineal de probabilidad sin errores

estándar robustos

Breusch-Pagan / Cook-Weisberg test for heteroskedasticity Ho: Constant variance

Variables: fitted values of licenciatura Resultado 2002 Resultado 2009

chi2(1) = 1920.61 chi2(1) = 733.63 Prob > chi2 = 0.0000 Prob > chi2 = 0.0000

Las pruebas de heterocedasticidad nos afirman que los modelos lineales de probabilidad (sin errores estándar robustos) sufren de heterocedasticidad, tal como lo señala la teoría econométrica.

Gráfica A1 Pruebas de normalidad al modelo lineal de probabilidad sin errores

estándar robustos, y sin factor de expansión (2002 izquierda y 2009 derecha)

0

200

400

600

800

1000

-0.5 -0.0 0.5 1.0

Series: Residuals

Sample 1 5526

Observations 5517

Mean 3.18e-17

Median -0.067561

Maximum 1.027269

Minimum -0.697842

Std. Dev. 0.294105

Skewness 1.897771

Kurtosis 5.722084

Jarque-Bera 5014.928

Probability 0.000000

0

100

200

300

400

-0.5 0.0 0.5 1.0

Series: Residuals

Sample 1 3582

Observations 3452

Mean 2.94e-17

Median -0.111520

Maximum 1.024280

Minimum -0.843007

Std. Dev. 0.353166

Skewness 1.033361

Kurtosis 3.025159

Jarque-Bera 614.4526

Probability 0.000000

Elaboración propia de los autores

Podemos advertir como señala la teoría econométrica que el modelo lineal de probabilidad no cumple los supuestos de heterocedasticidad y normalidad de los errores, puntos 3 y 4 de la página 10.

Gráfica A2 Valor actual y pronosticado por el modelo lineal de probabilidad sin errores

estándar robustos, y sin factor de expansión (2002 izquierda y 2009 derecha)

-0.8

-0.4

0.0

0.4

0.8

1.2

-0.4

0.0

0.4

0.8

1.2

1000 2000 3000 4000 5000

Residual Actual Fitted

-1.0

-0.5

0.0

0.5

1.0

1.5

-0.4

0.0

0.4

0.8

1.2

500 1000 1500 2000 2500 3000 3506

Residual Actual Fitted

Elaboración propia de los autores

Page 31: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección

31

Cuadro A2 Corrigiendo el problema de heterocedasticidad del modelo lineal de probabilidad con mínimos

cuadrados ponderados restringidos por edad (17 a 30 años), y sin factor de expansión

Mínimos cuadrados ponderados 2002

Elaboración propia de los autores

Mínimos cuadrados ponderados 2009

Elaboración propia de los autores

Se puede advertir que las estimaciones de mínimos cuadrados ponderados para los años 2002 y 2009, tienen los mismos signos encontrados en los modelos de elección discreta estimados (cuadros 1 y 3) y en ningún caso se contradicen

Gráfico A3 Análisis de sensitividad y especificidad para todas las observaciones

Modelo Probit (Año 2002)

Elaboración propia de los autores

Page 32: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección

32

Gráfico A4 Análisis de sensitividad y especificidad para todas las observaciones

Modelo Logit (Año 2009)

Elaboración propia de los autores