LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder...
Transcript of LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder...
![Page 1: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección](https://reader031.fdocuments.net/reader031/viewer/2022022714/5c4e6dad93f3c34c550c6d0c/html5/thumbnails/1.jpg)
1
LLAA PPAARRTTIICCIIPPAACCIIÓÓNN DDEE LLOOSS JJÓÓVVEENNEESS BBOOLLIIVVIIAANNOOSS
EENN LLAA EEDDUUCCAACCIIÓÓNN UUNNIIVVEERRSSIITTAARRIIAA BBOOLLIIVVIIAANNAA
““UUNN AANNÁÁLLIISSIISS MMUULLTTIICCAAUUSSAALL DDEE EELLEECCCCIIÓÓNN DDIISSCCRREETTAA””
Benigno Caballero Claure
Universidad Técnica de Oruro
Y
Rolando Caballero Martínez
Universidad Nacional Autónoma de México
Agosto del 2013 Resumen: El estudio analiza los efectos de las variables socioeconómicas como la edad,
género, estado civil, pobreza, región geográfica, característica socio-cultural en el acceso de los
jóvenes bolivianos en la educación universitaria de Bolivia. Como se puede observar el
enfoque es ecléctico y se considera que existen varios factores que podrían influir en el acceso
a la educación universitaria. Para poder analizar estos efectos se emplea como metodología
econométrica, los modelos de elección discreta (Modelo lineal de probabilidad, Gompit y/o
Valor Extremo, Logit y Probit), además el análisis de sensitividad y especificidad. Este
metodología es interesante, ya que la variable explicada nos da a conocer la probabilidad de
que ocurra un evento o no, en nuestro caso, la probabilidad de participar o no en la educación
de pregrado en Bolivia. El estudio, utiliza una base de datos de la encuesta de hogares
levantado por el INE-BOLIVIA para los años 2002 y 2009, que permite armar un mix de
modelos de elección discreta, el cual muestra los efectos de los regresores sobre la variable
explicada en un momento dado del tiempo. Los resultados de nuestro trabajo demuestran, que
todos los factores socioeconómicos mencionados contribuyen en distinto grado a determinar la
participación en la educación universitaria de pregrado en Bolivia y a partir de los resultados se
da a conocer las conclusiones finales de nuestro proyecto de investigación.
CLASIFICACIÓN JEL: I25, C25, A22
Palabras clave: Educación Universitaria, Modelos de Elección Discreta
Correos electrónicos de los autores: [email protected] ;
![Page 2: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección](https://reader031.fdocuments.net/reader031/viewer/2022022714/5c4e6dad93f3c34c550c6d0c/html5/thumbnails/2.jpg)
2
1. INTRODUCCIÓN
Los orígenes de la Economía de la Educación y los diferentes enfoques, se originan
en Adam Smith y Alfred Marshall y en los mismos autores la educación figuraba como
forma fundamental de inversión en capital humano, no fue sino hasta los ’60 cuando
la ciencia económica comenzó a formalizar modelos concretos acerca del impacto de
la educación en la productividad, los ingresos laborales, y el crecimiento de los
países.
El punto de partida formal lo dieron los estudios e investigaciones de Schultz
(1961), Denison (1962) y Becker (1962) en sus teorías del capital humano y la función
de producción en educación.
Desde esa época hasta nuestros días, el desarrollo de la Economía de la
Educación ha pasado por distintos periodos. Asimismo la llamada teoría del capital
humano no puede ser reducida a una teoría única, constituye en sí misma un parte de
la teoría neoclásica. El desarrollo teórico del concepto de capital humano ha derivado
en la ampliación de su campo de comprensión combinando elementos de la
economía del trabajo, de la economía del bienestar, de las finanzas públicas, de la
economía industrial, entre otras ramas de la economía. Por lo que se abrió una
división propia denominada economía de la educación, encargada de aplicar el
análisis económico a las disciplinas educativas.
La investigación en esta área ha tomado fuerza en los últimos años, ya que la
educación ha pasado a ocupar un lugar destacado en la discusión pública en la
mayoría de los países, y especialmente, debido a la potencial vinculación entre
educación y desarrollo económico.
Entre los temas más estudiados figuran la teoría del capital humano; la relación
entre insumos y resultados educacionales a través de una función de producción; y la
relación entre educación, ingresos y crecimiento económico. Como también así, el
uso de mecanismos de mercados para financiar sistemas de provisión de servicios
educativos han sido objeto de estudio y una importante contribución a la Economía de
la Educación a países desarrollados.
Por lo tanto la educación en las últimas décadas parece ser la esperanza de un
País mejor y más justo, reflexionar sobre la igualdad de oportunidades y equidad es
importante.
Para Bolivia, son contados los trabajos que han abordado el tema de la
economía de la educación desde un punto de vista empírico, en especial sobre la
![Page 3: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección](https://reader031.fdocuments.net/reader031/viewer/2022022714/5c4e6dad93f3c34c550c6d0c/html5/thumbnails/3.jpg)
3
participación en la actividad universitaria, por lo mismo el análisis empírico para el
caso de Bolivia es reducido, de ahí que sea necesario plantear como problema de
investigación el estudio de los factores cuantitativos y cualitativos que podrían influir
en el acceso a la educación de pregrado en Bolivia, todo ello basándonos en la idea
de la educación es el factor de crecimiento más lento, pero a la vez el más poderoso,
para nuestro estudio realizaríamos un análisis comparativo para dos años en
específico 2002 y 20091.
Por tanto, en este trabajo nosotros nos planteamos como objeto de estudio
analizar y discernir los posibles efectos de las variables socioeconómicas como la
edad, género, estado civil, pobreza, región geográfica (rural y/o urbana),
característica socio-cultural en el acceso de los jóvenes bolivianos en la educación
universitaria de Bolivia. Como se puede observar el enfoque es ecléctico y se
considera que existen varios factores que podrían influir en el acceso a la educación
universitaria. De tal forma que, una vez que se realiza la estimación de los modelos
de elección discreta, se analiza también, por un lado, el análisis de sensitividad y
especificidad de nuestros modelos de elección discreta estimados y por el otro, la
asociación y la significancia de cada uno de las variables explicativas.
La pregunta de investigación que nos formulamos es la siguiente:
Tomando en cuenta que la mayoría de los países en vías de desarrollo son
países cuya masa poblacional son mayoritariamente jóvenes y que Bolivia no es una
excepción y al mismo tiempo que Bolivia en distintos periodos de su vida, ha pasado
por distintas etapas, desde el punto de vista: económico, social, cultural, género y
climatológico, todos estos factores nos impulsan a realizar un estudio de la afluencia y
oportunidad que tienen los jóvenes bolivianos de acceder a la educación universitaria.
Por lo tanto la formulación de problema de investigación sería:
1. ¿Cuál es el papel de los factores socioeconómicos, como: el entorno personal
familiar, la situación civil de una persona, la diferencia de género, el factor
económico y geográfico, en el acceso de los jóvenes bolivianos al sistema
universitario boliviano? y ¿Estos factores socioeconómicos junto a otras
variables han tendido a reducir o ampliar el número de matriculados y/o
inscritos en la educación universitaria en Bolivia?
1 Se toma en cuenta un estudio comparativo entre los años 2002 y 2009, debido a múltiples razones, la primera se
debe a que la base de datos sociales de la página web del INE-BOLIVIA, solo se encuentra colgada la Encuesta de Hogares hasta el 2009, bases de datos del 2010, …,2012 en adelante no estaban disponibles hasta mayo del 2013, que es la fecha que se culminó el presente trabajo de investigación, véase: http://www.ine.gob.bo/
![Page 4: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección](https://reader031.fdocuments.net/reader031/viewer/2022022714/5c4e6dad93f3c34c550c6d0c/html5/thumbnails/4.jpg)
4
2. Las hipótesis de trabajo correlacionados a las preguntas previas son las
siguientes:
Las variables socioeconómicas mencionadas y el buena coyuntura económica
que ha favorecido a Bolivia en los últimos años, contribuyen en distinto grado a
determinar la participación en la educación universitaria de pregrado en Bolivia y al
mismo tiempo desembocar en un aumento del número de matriculados y/o inscritos
en el sistema universitario en Bolivia2.
El artículo está estructurado de la siguiente manera. En la primera sección se
dio una breve introducción del tema, así como la formulación del planteamiento del
problema y su posible hipótesis. En la segunda sección se describe de manera
sucinta y breve el marco teórico y la metodología econométrica a aplicar a nuestro
estudio. La tercera sección se da a conocer la descripción y características básicas
de nuestra base de datos. La cuarta sección se desarrolla y analiza en detalle los
hallazgos empíricos de nuestras estimaciones econométricas. Finalmente, en la
última sección se muestran las conclusiones finales de nuestros resultados.
Por último el trabajo intenta organizar, de la manera más sistemica, sintética y
clara posible la relación necesaria referidas a la diferenciación que existe en la vida
universitaria. Ser universitario que es cosa distinta a estar o pasar por la universidad.
Ser universitario es una actitud existencial caracterizada por la búsqueda de la
verdad, la formación integral, la síntesis de saberes y el servicio a la sociedad.
2. Marco Teórico y Metodología Econométrica
2.1 Capital Humano
Si bien los clásicos subrayaron la influencia que la educación y el saber en general
tienen en la producción y en el bienestar de la sociedad, no llegaron a proponer un
verdadero marco teórico del capital humano. Son en realidad los economistas
neoclásicos los que realmente contemplaron la formación de los hombres como una
inversión en capital humano y pusieron las bases del análisis moderno de la
educación. En su obra The Nature of Capital and Income, publicada en el año 1906,
Fisher (1867-1947) elabora una teoría del capital en la que lo define como un stock
de recursos que genera flujos de rentas futuras, lo que permite considerar como
inversión tanto a la formación de los hombres, como a los bienes duraderos que
2 Para este análisis tiene que ver mucho la mayor asignación presupuestaria a las universidades públicas en
Bolivia en los últimos años, el mismo explicado por la transferencia de ingresos del Estado Plurinacional de Bolivia a las universidades, que en parte se debe a la mayor venta y a buenos precios del gas boliviano a los principales socios comerciales que tiene Bolivia.
![Page 5: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección](https://reader031.fdocuments.net/reader031/viewer/2022022714/5c4e6dad93f3c34c550c6d0c/html5/thumbnails/5.jpg)
5
entran en un proceso productivo. Sin embargo, esta concepción novedosa quedó
durante mucho tiempo en un segundo plano.
Apoyándose en la aportación de Fisher, es en realidad Schultz quien, en la 73.ª
reunión anual de la American Economic Association (Saint Louis, diciembre de 1960),
marcará el despegue de la economía de la educación con su conferencia titulada
Investment in Human Capital (Schultz, 1961), en la que populariza el concepto de
capital humano. Para Schultz, los conocimientos y las cualificaciones se pueden
asimilar a un capital, y la constitución de este capital es el resultado de una inversión
deliberada por parte de los individuos. En base a esta concepción, explica que el
crecimiento del producto nacional de los países es el resultado de esta inversión, de
la misma manera que el crecimiento del nivel de salarios de los individuos está ligado
al aumento de su inversión en capital humano.
A partir de entonces, hay una repentina proliferación de publicaciones
relacionadas con el valor económico de la educación. Así, Becker, Premio Nobel de
Economía en 1992, en su libro Human Capital (Becker, 1964), desarrolla la teoría de
la inversión en capital humano y señala el efecto de tal inversión sobre las ganancias,
el empleo y las actividades de consumo. Becker y Chiswick (1966) y Mincer (1974)
formularon luego el modelo matemático que relaciona las ganancias en el mercado de
trabajo con las inversiones en capital humano, mientras que Ben-Porath (1967)
elaboró el modelo de producción de capital humano a lo largo del ciclo de vida. Estas
aportaciones dieron lugar a numerosos trabajos empíricos que intentaron medir el
efecto de la educación y de la experiencia profesional sobre los salarios, y eso en
unos contextos económicos muy variados; así Belzil y Hansen (2002) enumeran
cerca de doscientos trabajos que se dedicaron a evaluar el rendimiento de las
inversiones educativas. En paralelo a estos trabajos, Psacharopoulos (1973)
contribuyó a popularizar el concepto de tasa de rendimiento interno de la educación y
su utilización para determinar el montante de las inversiones que tienen que realizar
los países en el sector educativo.
A lo largo de los últimos treinta años, numerosas innovaciones metodológicas
se han introducido en la estimación de la función de ganancias y en la evaluación del
impacto de la educación sobre las rentas. Estas mejoras, que han sido posible
gracias a la disponibilidad de fuentes de información más detalladas y al desarrollo de
ciertas técnicas econométricas, se proponen incorporar las capacidades innatas de
los sujetos en la estimación empírica del proceso de generación de rentas,
![Page 6: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección](https://reader031.fdocuments.net/reader031/viewer/2022022714/5c4e6dad93f3c34c550c6d0c/html5/thumbnails/6.jpg)
6
basándose en muestras de gemelos monocigóticos (ver por ejemplo Ashenfelter y
Krueger, 1994), tomar en cuenta el carácter endógeno de la educación (ver por
ejemplo Card, 2000) y corregir el sesgo de selección que se produce al considerar
únicamente a los individuos ocupados.
2.2 TEORIAS ALTERNATIVAS AL CAPITAL HUMANO
Desde sus orígenes, no faltaron las críticas al cuerpo teórico sobre el que descansa la
teoría del capital humano. Estas críticas, que en su mayoría provienen de la escuela
no ortodoxa norteamericana, han suscitado vivos debates entre los economistas,
dando lugar a teorías alternativas como la del filtro y la de la segmentación.
Elaboradas por autores como Arrow (1973), Doeringer y Piore (1971), Spence (1973)
o Thurow (1975), estas teorías cuestionan los propios fundamentos de la teoría del
capital humano, al negar que la inversión educativa contribuya a incrementar la
productividad mercantil de los individuos. Aunque estas nuevas corrientes de
pensamiento han renovado el análisis de los efectos externos de la educación tales
como los concibe la teoría del capital humano, todavía hoy la contrastación empírica
de estas teorías alternativas no dejan de plantear problemas.
La hipótesis del filtro (ver Arrow, 1973; Spence, 1973) se apoya en los
fundamentos de la teoría de la información. Para aquella, la educación no tiene como
finalidad el aumentar la productividad de las personas, tal como lo supone la teoría
del capital humano, sino que la finalidad del sistema educativo se resume en filtrar a
los individuos más aptos y en dar información a los empleadores acerca de las
cualidades de sus futuros trabajadores. La literatura económica ofrece varios
ejemplos de verificación empírica de la teoría del filtro frente a la del capital humano,
pero las pruebas de los que se dispone en la actualidad son bastante contradictorias.
En este campo, destaca sin duda el trabajo pionero de Layard y Psacharopoulos
(1974), que compara la rentabilidad de los años de estudios según estén certificados
o no por un título académico. Otros intentan averiguar la validez de la hipótesis del
filtro, confrontando a un grupo de trabajadores que necesitan ser filtrados por el
sistema educativo con otros que no lo requieren tanto. Basándose en este principio,
Wolpin (1977) sugiere comparar el rendimiento y el nivel de educación de los
asalariados, con el de los empresarios. Sus resultados para el caso de Estados
Unidos le conducen a refutar la hipótesis del filtro. Sin embargo, adoptando un
enfoque similar en el mismo contexto geográfico Cohn, Kicker y Oliveira (1987) llegan
a la conclusión inversa, al igual que Clark (2000) a partir de datos rusos.
![Page 7: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección](https://reader031.fdocuments.net/reader031/viewer/2022022714/5c4e6dad93f3c34c550c6d0c/html5/thumbnails/7.jpg)
7
2.3 EDUCACIÓN Y CRECIMIENTO ECONOMICO
El fuerte crecimiento económico que se produjo después de la segunda guerra
mundial en la mayoría de los países occidentales, y el aumento sin precedentes de la
demanda de educación que le acompañó, originó el interés de los economistas de la
educación por el análisis de los determinantes del crecimiento. Ya en los años 60,
economistas como Schultz (1961) y Denison (1962) se interesaron por el tema e
intentaron evaluar el aporte de la educación al crecimiento económico. Siguiendo un
enfoque contable, y estimando el nivel de educación de la población activa a través
del número de años de estudios ponderado por el diferencial de salarios que
corresponde a cada nivel de educación, Denison atribuye al aumento del nivel de
formación de la población activa que se produjo entre 1929 y 1973, en Estados
Unidos, entre el 15% y el 11% del crecimiento de la economía norteamericana.
Midiendo el stock de capital humano en base a las tasas de rendimiento de los
diversos niveles de enseñanza, Schultz obtiene resultados sensiblemente diferentes,
ya que estima que el 20-40% del crecimiento económico que se produjo en Estados
Unidos entre 1929 y 1956 se puede imputar al aumento de la inversión educativa
entre estas dos fechas. Nadiri (1972) y Psacharopoulos (1972) resumen las
evaluaciones que se hicieron en esta época en una serie de países desarrollados y
no desarrollados, según ambos métodos de estimación.
Los nuevos planteamientos de las teorías del crecimiento económico,
originados por Solow (1956), contribuyeron a renovar los enfoques empíricos
planteados años antes. Así, treinta y cinco años después de la publicación de ese
artículo, Mankiw, Romer y Weil (1992) proponen una versión ampliada del modelo
inicial de Solow, que incorpora junto a los dos factores clásicos, trabajo y capital
físico, un tercer factor acumulable similar al capital físico que es el capital humano. Su
modelo predice que el nivel de producción o de riqueza per capita de un país es tanto
mayor cuanto sus tasas de acumulación de capital físico y humano son grandes,
cuanto su tasa de crecimiento demográfico es pequeña, y cuanto el progreso técnico
es importante. A partir de tres muestras de países observados en el período 1960-
1985, muestran que un incremento del 10% en la tasa de inversión en capital humano
respecto al PIB induce a un aumento del producto por trabajador en torno al 7%, y en
caso de doblarse dicha inversión se incrementaría en casi el 70% dicho producto.
Paralelamente, numerosos autores se interesaron por la contrastación de la
hipótesis de convergencia de las economías, y trataron de revelar los factores que
![Page 8: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección](https://reader031.fdocuments.net/reader031/viewer/2022022714/5c4e6dad93f3c34c550c6d0c/html5/thumbnails/8.jpg)
8
explican el proceso de acercamiento del nivel de vida de los países. Dentro de estas
investigaciones, las aportaciones de Barro (1991) merecen sin duda alguna especial
atención. Basándose en una muestra de corte transversal de 98 países observados
durante el período 1960-1985, constata que a nivel de riqueza dado, los países que
invirtieron más en educación primaria y secundaria han experimentado unas tasas de
crecimiento mayores que los demás. Sus resultados muestran también que la calidad
de la enseñanza primaria, medida a través de la relación alumnos/docente, afecta de
manera positiva y significativa a la tasa de crecimiento de los países; sin embargo, la
calidad de la educación secundaria no parece ejercer un efecto determinante.
2.4 MODELO DE ELECCIÓN DISCRETA
En los modelos de elección binaria se supone que los individuos se enfrentan con una
elección entre dos alternativas y que la elección depende de características
identificables. En esta situación, la variable endógena puede tomar dos valores: Yi =
{1,0}, y se pretende explicar la elección hecha por el decisor como función de unas
variables que le caracterizan y que se denota por xi, un vector de dimensión k.
El propósito de un modelo de elección cualitativa es determinar la probabilidad
de que un individuo con un conjunto determinado de atributos hará una elección en
lugar de la alternativa. De manera más general, lo que se pretende es encontrar una
relación entre un conjunto de atributos que describen a un individuo y la probabilidad
de que el individuo hará la elección determinada.
En este trabajo, se considera las variables exógenas a variables
socioeconómicas. El primer trabajo teórico que fue desarrollado para estudiar
modelos con variables dicotómicas se planteó como una extensión del Modelo lineal
general, y dio paso al Modelo Lineal de probabilidad (MLP).
2.4.1 MODELO LINEAL DE PROBABILIDAD
Consideremos el siguiente modelo:
iti
xi
Y
Modelo de este tipo de ecuaciones en donde la variable independiente es dicotómica
y es función de las variables explicativas xi se denomina: Modelo lineal de
probabilidad.
La distribución de la muestra en este tipo de modelos se caracteriza por
mostrar una nube de puntos de tal forma que las observaciones muéstrales se dividen
en dos subgrupos. Uno de los cuales es el formado por las observaciones en las que
![Page 9: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección](https://reader031.fdocuments.net/reader031/viewer/2022022714/5c4e6dad93f3c34c550c6d0c/html5/thumbnails/9.jpg)
9
ocurrió el hecho objetivo de estudio, es decir cuando Yi=1, y el otro, por los puntos
muéstrales en los que no ocurrió, es decir, Yi=0.
El modelo lineal de probabilidad, se puede interpretar en términos
probabilísticos, en el sentido de que un valor concreto de la recta de regresión mide la
probabilidad de que ocurra el hecho objetivo de estudio. Es decir, iY^
se puede
considerar como la estimación de la probabilidad de que ocurra el hecho objetivo de
estudio Yi=1 siguiendo el siguiente criterio: Valores próximos a cero se corresponde
con una baja probabilidad de ocurrencia del hecho estudiado (menor cuanto más
próximos a cero); mientras que a valores próximos a uno se les asigna una
probabilidad elevada de ocurrencia (mayor cuanto más próximos a uno).
Por otro lado, se tiene que:
iii
iiii
y
i
y
ii
PxYE
PPPYE
pPyf
ti
xi
xi
YE
ii
)(
:que tenemos(2)con (1) comparando
(2) )(1)1(0)(
1.0y Para
)1()(
donde
),Ber(P Y
:es i
Y deón distribuci La.0i
Y que de
adprobabilid la es i
P-1y 1i
Y que de adprobabilid la es i
P que tienese Además
.0)i
E( que supone se que ya
(1) )/(
i
1
ii
Entonces la esperanza condicional de Pi puede interpretarse como la probabilidad
condicional de Yi. A continuación se demuestra un teorema.
Teorema. 1)(0 i
YP
Demostración: Por axioma de la probabilidad se tiene que )(0i
YP además,
1)( tantolopor ,)(0
:que tenemosaxiomapor vezotra ),(1)(
:entonces
1)()(
iy
iYP
iy
iYP
iy
iYP
iy
iYP
iy
iYP
iy
iYP
Esto nos indica que el valor esperado condicional de Yi dado xi tendría que estar
entre 0 y 1, es decir:
![Page 10: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección](https://reader031.fdocuments.net/reader031/viewer/2022022714/5c4e6dad93f3c34c550c6d0c/html5/thumbnails/10.jpg)
10
1)(0 i
xi
YE
Dado el modelo 1 ¿Porque no utilizar el método estándar de mínimos
cuadrados ordinarios (MCO)? Veamos algunas características del modelo lineal de
probabilidad:
Ventajas:
1) Simplicidad. Es fácil estimar por el Método de Mínimos Cuadrados Ordinarios
2) Interpretación: Los coeficientes estimados se interpretan como el efecto marginal
en la probabilidad de ocurrencia del evento.
Desventajas:
1) Podemos tener valores estimados en la variable dependiente, mayores que 1 y
menores que 0, lo que contradice la interpretación como una probabilidad,
1)(0 i
xi
YE .
2) Los errores pueden ser relativamente grandes si la relación no es lineal, y sobre
todo en la parte media de la distribución de las variables independientes.
3) Heterocedasticidad de los errores.
4) No normalidad de las perturbaciones.
5) Un valor cuestionable del R2 como medida de bondad de ajuste del modelo, ya que
el mismo tiene un valor limitado en modelos de respuesta dicotómica.
2.4.2 MODELO LOGIT Y PROBIT
Dadas las dificultades asociadas con el modelo lineal de probabilidad, es natural
transformar el modelo original de tal forma que las predicciones caigan en el intervalo
[0,1]. Es decir, para asegurar que P caiga entre 0 y 1, se requiere una función
monótona positiva que mapee el predictor lineal txxx 22110
al intervalo
[0,1]. Entonces debería adoptarse un modelo bajo el cual los valores de P i estén
restringidos al intervalo [0,1]. Una forma muy conveniente de restringir la forma
funcional es la siguiente:
txF
iiP )(
En donde F (⋅) es una función de distribución acumulada (FDA). La cual es una
función diferenciable monótona creciente con dominio ℜ y rango [0,1].
![Page 11: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección](https://reader031.fdocuments.net/reader031/viewer/2022022714/5c4e6dad93f3c34c550c6d0c/html5/thumbnails/11.jpg)
11
El modelo no lineal sería el siguiente:
.)(
con
i
txFxYE
itxF
iY
ii
Algunas características de la función
txF :
1. Obviamente se trata de una función no lineal, pero una muy particular, en el sentido
de que las variables exógenas afectan la variable endógena a través de un índice
lineal ti
x , que luego es transformado por la función F(⋅) de manera tal que los
valores de la misma sean consistentes con los de una probabilidad.
2. ¿Cómo elegir la función F(⋅)?
La función de distribución acumulada de cualquier variable aleatoria continua tiene la
propiedad de F(⋅).
Primeramente, si se elige a F(⋅) como la distribución uniforme acumulada entonces
obtenemos la construcción del modelo de probabilidad lineal.
Aunque son posibles varias alternativas de la FDA, sólo se considerarán dos: la
normal y la logística.
El modelo de probabilidad probit se asocia con la función de distribución
normal acumulada.
1
dZ
1
1
lineal.logit modelo el produce se (.) logisticaón distribuci la Usando
.)(1
:que tienese Además
N(0,1).zdecir es estándar, normal variablela es z donde
2
2
21
i
ti
xe
ti
xe
ti
xe
ti
x
xtxi
ti
x z
eti
xi
t
La gráfica 1 muestra las gráficas de las distribuciones normal y logística.
![Page 12: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección](https://reader031.fdocuments.net/reader031/viewer/2022022714/5c4e6dad93f3c34c550c6d0c/html5/thumbnails/12.jpg)
12
Gráfica 1 (Distribución acumulada normal y logística)
Elaboración propia de los autores
Las diferencias básicas entre estas dos funciones con forma de “S” invertida, residen
en el comportamiento de las colas, esto es, para valores próximos a 0 o a 1, tal como
puede apreciarse en la gráfica 1.
Dada la similitud existente entre las curvas de la normal acumulada y de la
acumulada logística, los resultados estimados por ambos modelos no difieren mucho
entre sí, ya que puede apreciarse en la gráfica 1 que discrepan, únicamente en la
rapidez con que las curvas se aproximan a los valores extremos y por lo tanto la
función logística es más achatada que la normal, al alcanzar esta última más
rápidamente los valores extremos, 0 y 1.
A pesar de su similitud, existen dos razones prácticas que aventajan al modelo
Logit:
1. Simplicidad: la ecuación de la FDA logística es muy simple, mientras que la
FDA normal involucra una integral que no es fácil de evaluar.
2. Interpretabilidad: Una interpretación más sencilla del parámetro estimado es la
que se obtiene a través de la linealización del modelo.
ti
x
ti
xe
ti
xe
ti
xe
ti
xe
ti
xe
ti
xe
i
i
ln
1
11ln
1
11
11
1
ln1
ln
Al cociente entre la probabilidad de que ocurra un hecho frente a la probabilidad de
que no suceda, se le denomina “odds ratio y/o riesgo”. Su interpretación es la
preferencia de la opción 1 frente a la opción 0, es decir, el número de veces que es
más probable que ocurra un fenómeno frente a que no ocurra.
Odss-ratio y/o riesgo = ln (πi / 1 - πi)
![Page 13: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección](https://reader031.fdocuments.net/reader031/viewer/2022022714/5c4e6dad93f3c34c550c6d0c/html5/thumbnails/13.jpg)
13
Dada un variable aleatoria, caracterizada por unos parámetros, y dada una muestra
poblacional, se consideran estimadores Máximo-Verosímiles de los parámetros de
una población determinada, aquellos valores de los parámetros que generarían con
mayor probabilidad la muestra observada. Es decir, los estimadores Máximo-
Verosímiles son aquellos valores para los cuales la función de densidad conjunta (o
función de verosimilitud) alcanza un máximo.
2.4.2.1 ESTIMACIÓN DE PARAMETROS EN EL PROBIT
En el caso del modelo Probit, la función de verosimilitud es:
iY
ti
xi
Yti
xn
iL
11
1
Aquí puede apreciarse que, para cada individuo i, el termino correspondiente
en la función de verosimilitud es, simplemente, t
i
t
i xx -1 o , dependiendo de qué
Yi=1 o Yi=0. Por tanto, considerando el logaritmo de la verosimilitud se tiene que:
0 1
ementeequivalent o,
0 1
)1(
Lln
:que tienen se , vector al respectocon derivadas Calculando
1ln)1(
1
lnln
1
´
11
i
t
it
i
t
i
t
iin
i
t
i
t
i
t
i
t
in
i
iit
i
t
in
i
i
xxfxx
xY
xxfdonde
x
xfYx
x
xfY
ti
xi
Yti
xn
ii
YL
El cual se trata de un sistema de k- ecuaciones no lineales.
2.4.2.2 ESTIMACIÓN DE PARAMETROS EN EL LOGIT
Suponiendo que las observaciones son independientes, la función de densidad
conjunta de las variables dicotómicas Yi queda como:
![Page 14: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección](https://reader031.fdocuments.net/reader031/viewer/2022022714/5c4e6dad93f3c34c550c6d0c/html5/thumbnails/14.jpg)
14
n
i
xt
ii
n
i
xn
i
t
ii
ti
ti
exY
eLnxYL
o
ni
ti
xe
ni
ti
xi
Y
eti
xF
iY
ti
xF
iY
L
1
11
1ln
1ln
:mismo lo es que lo ,
11
1
10
1
01
lnln
,
,1Zln
: tienese 1xk, filaun vector ,por Z Denotando
1
1
t
1
t
ti
ti
ti
x
n
i
x
i
n
i
x
n
i
t
ii
e
ex
ZL
y
eLnL
xY
El cual se trata de un sistema de k-ecuaciones no lineales por lo que es
necesario aplicar un método iterativo o algoritmo de optimización que permita la
convergencia de los estimadores3.
3. DESCRIPCIÓN DE LA BASE DE DATOS
3.1 MECOVI Y ENCUESTA DE HOGARES BOLIVIA
Bolivia ingresa como país miembro del “Programa para el Mejoramiento de las
Encuestas y Medición de Condiciones de Vida en América Latina y el Caribe”
(MECOVI) en mayo de 1999, a partir del mes de junio se da inicio al trabajo de
preparación de la primera Encuesta de Hogares (EH). En noviembre del mismo año
se llevó a cabo la primera recolección de datos en el país en el marco del Programa
MECOVI4.
Esta experiencia de encuesta multitemática y de mayor alcance le permitió al
INE, llevar a cabo encuestas de hogares cada año, optimizando los procesos de
validación y consistencia de información.
Entre los años 2003 y 2004 se ejecutó la Encuesta Continua de Hogares con
características similares a una encuesta de Presupuestos Familiares, conservándose
3 Usualmente los softwares lo resuelven por el método de máximo verosimilitud, aunque existe otro tipo de
algoritmos que permita resolver la convergencia de las estimaciones. 4 Tomado del Documento Metodológico de la Encuesta de Hogares del INE-BOLIVIA 2009.
![Page 15: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección](https://reader031.fdocuments.net/reader031/viewer/2022022714/5c4e6dad93f3c34c550c6d0c/html5/thumbnails/15.jpg)
15
los tradicionales contenidos de la encuesta, haciendo énfasis en la temática de
ingresos y gastos del hogar.
Para los años 2005 y 2007 se retomó la modalidad de encuestas puntuales de
hogares, con la ejecución de la Encuesta de Hogares, que mantuvo como temática de
exploración a las condiciones de vida de la población boliviana, a través de la
aplicación del cuestionario multitemático que permite la investigación de las
características generales, salud, educación, empleo, ingresos, gastos, vivienda e
ingresos del productor agropecuario independiente.
La Encuesta de Hogares 2008, retomó en la sección de Salud las
enfermedades diarreicas agudas y las Infecciones respiratorias agudas. Se
incorporaron preguntas nuevas en relación al Nivel de Instrucción y Ocupación de los
padres ausentes, impacto de políticas como las Chispitas Nutricionales, Vacuna
contra el Rotavirus, el Desayuno Escolar y la Renta Dignidad. En la sección de
Ingresos no Laborales, se incorporan las remesas para ver el impacto
socioeconómico en la población y finalmente en la sección de Gastos el módulo de
Turismo, para cuantificar los gastos efectuados por los viajes que realizan los
miembros del hogar fuera de su lugar habitual de residencia.
La Encuesta de Hogares 2009, es una investigación por muestreo efectuada a
hogares particulares que mantuvo la metodología de exploración a las condiciones
de vida de la población boliviana, a través de la aplicación de un cuestionario
multitemático que permite investigar: las características generales sociodemográficas,
salud, educación, empleo, ingresos y gastos de los miembros del hogar, y las
características de la vivienda y servicios básicos de los hogares, para la generación
de indicadores de pobreza, que permita la (formulación, evaluación, seguimiento de
políticas y el diseño de programas de acción en el área social), que contribuyan en
última instancia a mejorar las condiciones de bienestar de los hogares y reducir la
pobreza en el país.
3.1.1 OBJETIVOS
Tanto el Mecovi como la Encuesta de Hogares tienen objetivos muy parecidos, por lo
mismo, el objetivo general del programa es generar de forma adecuada información
sobre las condiciones de vida de la población, en términos de alcance, cobertura,
confiabilidad, y sobre todo, relevancia para fines de políticas dirigidas hacia la
reducción de la pobreza y el aumento de la equidad social.
Específicamente el programa busca:
![Page 16: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección](https://reader031.fdocuments.net/reader031/viewer/2022022714/5c4e6dad93f3c34c550c6d0c/html5/thumbnails/16.jpg)
16
Fortalecer los sistemas de encuestas de hogares, para generar una mejor y más
completa información sobre el estado de la pobreza y las condiciones de vida, y
así apoyar a la formulación de políticas en el sector social.
Capacitar a los técnicos nacionales para mantener y operar los nuevos sistemas.
Brindar asistencia y capacitar al personal sectorial en el análisis de las encuestas
para el diseño, monitoreo y evaluación del impacto de políticas dirigidas hacia la
reducción de la pobreza.
Ahora focalizándonos en nuestro trabajo de investigación, lo que realizamos es
tomar la base de datos completa del MECOVI 2002 y la ENCUESTA DE HOGARES
20095, procesamos los datos en Excel y Stata versión 12 y finalmente procedemos a
seleccionar las variables socioeconómicas de nuestro interés de estudio6. Al mismo
tiempo para lograr un mejor análisis de nuestros resultados econométricos,
desarrollamos programas que nos permitan clasificar mejor las variables de estudio7.
4. RESULTADOS EMPIRICOS
4.1 MODELOS A APLICAR
El Modelo que se aplicara en el presente trabajo de investigación son modelos de
elección discreta:
Modelo lineal de probabilidad con y sin corrección de heterocedasticidad
Modelo Gompit o de valor extremo
Modelo Logit
- Efectos marginales.
- Analisis de sensitividad.
- Análisis de especificidad.
Modelo Probit
- Efectos marginales.
- Análisis de sensitividad.
- Análisis de especificidad.
5 Se realiza un estudio comparativo entre los años 2002 y 2009, la razón de ello se debe a que la página web del
INE-BOLIVIA solo tienen publicado la encuesta de hogares hasta el año 2009, y por lo tanto en la misma no se encuentra bases de datos de encuesta de hogares para los años posteriores (2010,…, 2012, etc.). 6 Variables como: edad, ingreso del hogar per cápita de familia, incidencia de pobreza, estado civil, etc.
7 Por ejemplo para la variable de estudio “indaprendio (1=No Indigena y 0=Indígena)”, se ejecutó un programa que
permita solo clasificar a los “no indígenas” solo a aquellas personas cuya lengua que aprendieron a hablar es el castellano y/o idioma extranjero, mientras los considerados “indígenas” eran personas cuya lengua que aprendieron a hablar fuese un idioma nativo (aimara, quechua, guaraní,etc.), no se tomó en cuenta a los que no pueden hablar, el análisis es análogo, por ejemplo para la variable explicada (universitario y no universitario) y también para el estado civil.
![Page 17: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección](https://reader031.fdocuments.net/reader031/viewer/2022022714/5c4e6dad93f3c34c550c6d0c/html5/thumbnails/17.jpg)
17
4.2 RESULTADOS DEL MODELO PARA EL 2002
Cuadro 1 (Modelos de elección discreta 2002)
Variables8
Modelo 1 Modelo Lineal Probabilidad
Modelo 2 Logit
Efectos Marginales
Modelo 3 Probit
Efectos Marginales
Modelo 4 Logistico
Odds-Ratio
Modelo 5
Gompit
Valor
Extremo
PO
-0.066
[-4.70]***
-0.035
(-105.77)***
-0.047
(-116.58)***
0.496
(-130.89)***
-0.347
(-6.977)*** YHOGPCF
0.004 [3.30]***
0.001 (85.55)***
0.00013 (85.83)***
1.000 (90.98)***
0.0001 (3.831)***
INDAPRENDIO
-0.046
[-4.95]***
-0.038
(-105.61)***
-0.049
(-126.18)*** 0.413
(-104.83)***
-0.384
(-6.331)*** SOLTERO
0.171
[14.49]***
0.094
(201.20)***
0.115
(253.14)***
7.571
(274.73)***
0.829
(14.938)***
EDAD
0.007 [5.11]***
0.003 (101.14)***
0.004 (109.31)***
1.068 (113.19)***
0.032 (5.016)***
SEXO
-0.014
[1.27] -0.005
(23.45)***
-0.006
(22.77)*** 0.916
(23.59)***
- 0.075
(1.756)* URB_RUR
-0.103
[-13.62]***
-0.127
(-262.50)*** -0.139
(-262.29)***
0.069
(-171.57)***
-0.723
(-11.672)*** Constante
0.021
[0,51]
-1.163
(-5,685)***
Valor Predicho por Modelo 13.52% 10.88% 10.56% 12.54%
R2 0,15 (Pseudo R2)
0,23
(Pseudo R2)
0.23
0.23
McFadden (R2) 0.23 0.23 0.23
Maximum Likelihood (R2)
(heterocedast.)
0.17 0.17
McKelvey & Zavoina (R2) 0.55 0.51
Conteo (R2) 0.87 0.86
Cragg & Uhler (R2) 0.31 0.31
Efron (R2) 0.18 0.17
Correcta Clasificación (R2) 86.43% 86.54%
AIC 0.531 0.605 0.605 0.545
BIC -44550.53 -2.718e+07 -2.718e+07 0.554
Log likelihood Full Model -1456.372 -592213.147 -591556.617 -592213.15 -1495.394
Numero de Observaciones 5517 1957798 1957798 1957798 5517
Numero de Iteraciones 6 5 5
[Wald chi2(7)] (significancia
conjunta de variables]
200372.50 207218.80 200372.50
Pvalue: [Wald chi2(7)] 0.000 0.000 0.000
F( 7, 5509) (significancia
conjunta de variables]
81.54 903.752
Pvalue: F( 7, 5509) 0.0000 0.0000
(***, **, *): Significativo al 1% de significancia (99% de confianza), 5% de significancia (95% de confianza) y 10% de significancia (90% de confianza, [ ] = estadístico “t”, ( ) = estadístico “z”
Elaboración propia de los autores
8 Variable explicada: licenciatura=> 1:universitario y 0=no universitario
* Variables explicativas: sigue así=> Soltero=> 1:soltero y 0:no soltero; Indaprendio=> 1:No indígena y 0:indígena * Incidencia de pobreza (p0)=> 1:pobre y 0:no pobre * Urb_rur (zona donde vive)=> 1:rural y 0:urbana; Sexo (genero)=> 1:mujer y 0:hombre Por ejemplo, la variable de estudio “indaprendio (1=No Indígena y 0=Indígena)”, se ejecutó un programa que permita solo clasificar a los “no indígenas” solo a aquellas personas cuya lengua que aprendieron a hablar es el castellano y/o idioma extranjero, mientras los considerados “indígenas” eran personas cuya lengua que aprendieron a hablar fuese un idioma nativo (aimara, quechua, guaraní, etc.), no se tomó en cuenta a los que no pueden hablar, el análisis es análogo se hicieron para las demás variables, tanto para la base de 2002 y 2009.
![Page 18: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección](https://reader031.fdocuments.net/reader031/viewer/2022022714/5c4e6dad93f3c34c550c6d0c/html5/thumbnails/18.jpg)
18
Podemos advertir que el Logit (modelo 2) y Probit (modelo 3) maximizan la función de
verosimilitud en la sexta y quinta iteración respectivamente. Por otro lado el predicho
de la variable explicada dicótoma para el año 2002 (probabilidad de ser universitario 1
y 0 lo contrario) indica que el 13.52% de nuestra base de datos participo en la
actividad universitaria de estudios de pregrado para el modelo lineal de probabilidad,
un 10.88% para el modelo logit, un 10.56% para el modelo probit respectivamente9 y
12.54% para el modelo gompit.
En los cinco modelos (modelo lineal de probabilidad, logit, probit, Odss-ratio y
gompit) del cuadro 1, es claro a simple vista que si las personas son solteras, de
mayor edad, de género masculino, con mayor ingreso del hogar per cápita de familia,
no pobres, que provienen fundamentalmente del área urbana tienen mayores
posibilidades de participar en la actividad universitaria para el año 2002. Sin embargo,
queda una duda respecto a un parámetro. Nos referimos a la variable indaprendio
(indígena y no indígena) ya que la misma estaría en una posición contradictoria con
respecto a la zona de donde proviene la persona (área rural y/o urbana).
Ahora con relación a los efectos marginales, el común denominador de los
cinco modelos de las variables explicadas más significativas (modelos 1, 2, 3, 4 y 5,
del cuadro 1) estuviera dado por dos variables: soltero y zona de donde proviene
(urbana o rural). Ambas variables para los cinco modelos, nos afirmarían de manera
general que existe mayor posibilidad para una persona soltera y que provenga de la
zona urbana tenga mayores posibilidades de participar en la educación de pregrado
en Bolivia. Por ejemplo, con respecto a la variable soltero el efecto marginal del
modelo logit y probit nos diría que las personas solteras tienen 9,5% y 11.5% más de
probabilidad de participar en la actividad universitaria que los no solteros10.
También es importante el efecto negativo de que la persona provenga del área
rural (urb_rur), reduciendo en promedio para ambos modelos (logit y probit) 13,3% la
probabilidad de participar en la actividad universitaria. Asimismo, los incrementos en
la edad y el ingreso del hogar per cápita de familia (modelos 2 y 3, cuadro 1),
aumentan alrededor de 0.4 y 0.01 puntos porcentuales la probabilidad de éxito.
9 El valor predicho del modelo logit de 10.88% implicaría un total de matriculados para el 2002 de 215358
alumnos, mientras que para el probit la estimación estaría alrededor de 205569 alumnos, que en ambos modelos (logit y probit, modelos 2 y 3 del cuadro 1) pronostican y simulan casi de manera exacta los resultados reales, ello debido a que según las estadísticas de la CEUB (Comité Ejecutivo de la Universidad de Bolivia) el número de matriculados en el año 2002 fue de 218830 alumnos, véase para este dato: http://www.ceub.edu.bo/index.php?option=com_content&view=article&id=104&Itemid=132, ello nos diría que el error que se cometió en el pronóstico del modelo logit y probit (modelos 2 y 3, cuadro 1) es de 0.015% y 0.061% respectivamente, que en ambos casos son errores muy pequeños, “DYEP”. 10
Por no solteros entiéndase personas casadas o que viven en concubinato, que de por si implica mayores
responsabilidades.
![Page 19: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección](https://reader031.fdocuments.net/reader031/viewer/2022022714/5c4e6dad93f3c34c550c6d0c/html5/thumbnails/19.jpg)
19
Ahora con respecto al ratio de odds y/o riesgo11 (cociente de probabilidades del
modelo 4, cuadro 1) por ejemplo, se tendría un valor mayor a la unidad para las
variables: soltero y edad, ello implica que las personas solteras y de mayor edad
tienen mayor probabilidad de éxito de la ocurrencia del evento (ser universitarios de
pregrado). Asimismo el ingreso del hogar percápita de familia, tiene un valor igual a la
unidad (ratio de odss y/o riesgo), ello significa que la probabilidad de que ocurra la
alternativa 1 (participar en la educación de pregrado) es la misma que la de que no
ocurra.
En síntesis, se puede advertir que las estimaciones de los Odds-Ratio (riesgo)
se complementan con las interpretaciones de los efectos marginales y en ninguno de
los casos se contradicen.
Gráfico 2 Relación entre el valor observado de la variable dependiente del modelo 1 y 3 (cuadro 1), el
valor predicho de la variable dependiente, y el ingreso del hogar per cápita de familia
Elaboración propia de los autores
Tomando todo las variables explicativas constante (evaluados en algún valor)
excepto la variable ingreso del hogar per cápita de familia (yhogpcf) podemos graficar
la relación estimada entre la variable dependiente binaria que toma valor 1 si la
persona ha participado en la vida universitaria de pregrado y el ingreso del hogar per
cápita de familia. Por ejemplo, tomemos la edad en 25, una persona soltera, hombre,
que proviene del área urbana, no indígena y no pobre. El gráfico 2 (izquierda)
muestra la relación entre el valor observado de la variable dependiente, el valor
predicho de la variable dependiente, y el ingreso del hogar per cápita de familia
(yhogpcf). Mientras el gráfico 2 (derecha) nos muestra la probabilidad predicha por el
probit, siguiendo la misma analogía
11
El interés de esta medida adquiere sentido cuando se comparan las ventajas para distintos valores de la variable explicativa, calculándose el cociente entre odds. Así, si se compara la situación de la observación “i” con la de la observación “j” (que suele ser la de referencia), el cociente entre odds mide cuanto es más probable que se de la alternativa 1 en “i” que en “j”
![Page 20: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección](https://reader031.fdocuments.net/reader031/viewer/2022022714/5c4e6dad93f3c34c550c6d0c/html5/thumbnails/20.jpg)
20
Gráfico 3 [Predicción estática modelo 1, cuadro 1 (izquierda) y
Prueba de normalidad Chi-Cuadrado (derecha)]
Elaboración propia de los autores
Porcentaje de aciertos por los modelos no lineales de probabilidad (logit y probit): análisis de sensitividad y especificidad
Cuadro 2 (Análisis de Sensitividad y Especificidad con un umbral de 0.5 )
-------- True -------- (Modelo Logit)
Clasificación D ~D Total
+ 10043 11025 21068
- 254597 1682133 1936730
Total 264640 1693158 1957798
-------- True -------- (Modelo Probit)
Clasificación D ~D Total
+ 9760 8646 18406
- 254880 1684512 1939392
Total 470053 1693158 1957798
Clasificado + Si el predicho Pr(D) >= 0.5 Verdad D definido como licenciatura != 0
LOGIT
Sensitividad
Especificidad
Valor predicho positivo
Valor predicho negativo
LOGIT
Pr( +| D)
Pr( -|~D)
Pr( D| +)
Pr(~D| -)
LOGIT
3.79%
99.35%
47.67%
86.85%
PROBIT
Sensitividad
Especificidad
Valor predicho positivo
Valor predicho negativo
PROBIT
Pr( +| D)
Pr( -|~D)
Pr( D| +)
Pr(~D| -)
PROBIT
3.69%
99.49%
53.03%
86.86%
Logit: Clasificación correcta (R2) 86.43%
Probit: Clasificación correcta (R2) 86.54%
Elaboración propia de los autores
Tanto el análisis de sensitividad y de especificidad nos dan a conocer la clasificación
correcta de que las personas en un rango de edad de 17 y 30 años participen o no de
la actividad universitaria. Asimismo el coeficiente de determinación de conteo en
ambos modelos es elevado, alcanzando un 86.43% en el modelo logit y un 86.54% en
![Page 21: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección](https://reader031.fdocuments.net/reader031/viewer/2022022714/5c4e6dad93f3c34c550c6d0c/html5/thumbnails/21.jpg)
21
el probit, que en ambos casos se basan en el cálculo de las predicciones correctas
hechas por el modelo.
La interpretación seria que en un 86.43% y 86.54% las variaciones de la
variable explicada dicotoma vienen explicadas por variaciones de las variables
explicativas y en un 13.57% y 13.46% por el termino de error ecuacional que su vez
este anida a variables periféricas que no han sido incluidas por razones de falta de
información y parsimonia.
Gráfico 4 (Característica operativa del receptor: Logit)
Gráfico 5 (Característica operativa del receptor: Probit)
Elaboración propia de los autores
En los gráficos 4 y 5 de las características operativas del receptor, tanto del modelo
logit y probit, podemos advertir que los resultados gráficos son congruentes y se
complementan con los resultados obtenidos en el análisis de sensitividad y
especificidad del cuadro 2.
![Page 22: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección](https://reader031.fdocuments.net/reader031/viewer/2022022714/5c4e6dad93f3c34c550c6d0c/html5/thumbnails/22.jpg)
22
4.3 RESULTADOS DEL MODELO PARA EL 2009
Cuadro 312
(Modelos de elección discreta 2009) Variables
Modelo 6 Modelo Lineal Probabilidad13
Modelo 7 Logit
Efectos Marginales
Modelo 8 Probit
Efectos Marginales
Modelo 9 Logistico
Odds-Ratio
Modelo 10
Gompit
Valor
Extremo
PO
-0. 085
[-5.53]***
-0. 063
(-157.61)***
-0.074
(-166.41)***
0.498
(-158.37)***
-0.341
(-5.653)*** YHOGPCF
8.31e-04 [0.91]
2.03e-04 (13.87)***
2.66e-04 (18.14)***
1.000 (13.90)***
0.0002 (1.748)*
INDAPRENDIO
0. 094
[7.28]***
0.121
(283.13)***
0.130
(298.43)*** 6.205
(177.37)***
0.663
(7.491)*** SOLTERO
0. 259
[16.05]***
0.170
(341.44)***
0.194
(395.54)***
7.372
(387.57)***
0.978
(15.131)***
EDAD
0. 026
[14.10]***
0.018
(335.50)***
0.022
(374.70)***
1.215
(401.32)***
0.113
(14.276)***
SEXO
0. 035 [2.46]***
0.022
(62.59)***
0.025 (61.29)***
1.269 (62.78)***
0.098
(1.956)** URB_RUR
-0.123
[-9.10]***
-0.163
(-241.32)*** -0.174
(-253.61)***
0.177
(-216.94)***
-0.707
(-10.196)*** Constante
-0.523
[-8.13]***
-3.613
(-13,65)***
Valor Predicho por Modelo 20.01% 13.55% 13.37% 17.54%
R2 0,20 (Pseudo R2): 0,23 (Pseudo R2): 0.24 0.24
McFadden (R2) 0.24 0.24 0.24
Maximum Likelihood (R2)
(heterocedast.)
0.21 0.21
McKelvey & Zavoina (R2) 0.51 0.50
Conteo (R2) 0.82 0.82
Cragg & Uhler (R2) 0.34 0.34
Efron (R2) 0.23 0.23
Correcta Clasificación (R2) 81.69% 81.70%
AIC 0.793 0.761 0.761 0.755
BIC -25335.42 -3.268e+07 -3.268e+07 0.741
Log likelihood Full Model -1360.92 -894108.078 -892781.321 -894108.08 -1271.275
Numero de Observaciones 3452 2349387 2349387 2349387 3452
Numero de Iteraciones 5 5 6
[Wald chi2(7)] (significancia
conjunta de variables]
329216.30 348939.06 329216.30
Pvalue: [Wald chi2(7)] 0.000 0.000 0.000
F( 7, 3444) (significancia
conjunta de variables]
98.48 101.397
Pvalue: F( 7, 5509) 0.0000 0.0000
(***, **, *): Significativo al 1% de significancia (99% de confianza), 5% de significancia (95% de confianza) y 10% de significancia (90% de confianza, [ ] = estadístico “t”, ( ) = estadístico “z”
Elaboración propia de los autores
12
Los modelos Logit, Probit y Odss-ratio (riesgo) del cuadro 1 y 3 (modelos 2, 3, 4, 7, 8 y 9) se los estimo con el
denominado FACTOR DE EXPANSIÓN, mientras los modelos lineales de probabilidad y el modelo Gompit (valor extremo) sin factor expansión. Sin embargo, para todos los modelos se estimó modelos de elección discreta restringidos por edad (17 a 30 años de edad). 13
Las pruebas de heterocedasticidad y normalidad de los modelos 1 (cuadro 1) y modelo 6 (cuadro 3) se encuentran en el Anexo 1 (cuadro A1 y gráfico A1)
![Page 23: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección](https://reader031.fdocuments.net/reader031/viewer/2022022714/5c4e6dad93f3c34c550c6d0c/html5/thumbnails/23.jpg)
23
Podemos advertir que el Logit (modelo 7) y Probit (modelo 8) maximizan la función de
verosimilitud en la quinta iteración respectivamente. Por otro lado el predicho de la
variable explicada dicótoma para el año 2009 (probabilidad de ser universitario 1 y 0
lo contrario) indica que el 20.01% de nuestra base de datos participo en la actividad
universitaria de estudios de pregrado para el modelo lineal de probabilidad, un
13.55% para el modelo logit, un 13.37% para el modelo probit respectivamente14 y un
17.54% para el modelo gompit.
En los cinco modelos (modelo lineal de probabilidad, logit, probit, odds-ratio y
gompit) del cuadro 3, es claro a simple vista que si las personas son solteras, de
mayor edad, no indígenas, con mayor ingreso del hogar per cápita de familia, no
pobres, que provienen fundamentalmente del área urbana tienen mayores
posibilidades de participar en la actividad universitaria para el año 2009. Sin embargo,
queda una duda respecto a un parámetro, la variable sexo, ya que la misma nos
afirmaría que las mujeres tuvieran más posibilidades de participar en la actividad
universitaria en el año 200915.
Ahora con relación a los efectos marginales, el común denominador de los
cinco modelos de las variables explicadas más significativas (modelos 6, 7, 8, 9 y 10,
del cuadro 3) estuviera dado por tres variables: soltero, edad y zona de donde
proviene (urbana o rural). Las tres variables para los cinco modelos, nos afirmarían de
manera general que existe mayor posibilidad para una persona soltera, con mayor
edad y que provenga de la zona urbana tenga mayores posibilidades de participar en
la educación de pregrado en Bolivia. Por ejemplo, con respecto a la variable soltero el
efecto marginal del modelo logit y probit nos diría que las personas solteras tienen
17% y 19.4% más de probabilidad de participar en la actividad universitaria que los no
solteros, el mismo tratamiento, tanto para la variable edad y la zona de donde
provenga (urbana o rural: urb_rur). Asimismo, los incrementos en el ingreso del hogar
per cápita de familia aumentan en promedio en los dos modelos (modelos 7 y 8,
cuadro 3) alrededor de 0.03 puntos porcentuales la probabilidad de éxito
14
El valor predicho del modelo logit de 13.55% implicaría un total de matriculados para el 2009 de 318342 alumnos, mientras que para el probit la estimación estaría alrededor de 314113 alumnos, que en ambos modelos (logit y probit, modelos 7 y 8 del cuadro 3) pronostican y simulan casi de manera exacta los resultados reales, ello debido a que según las estadísticas de la CEUB (Comité Ejecutivo de la Universidad de Bolivia) el número de matriculados en el año 2009 fue de 331392 alumnos, véase para este dato: http://www.ceub.edu.bo/index.php?option=com_content&view=article&id=104&Itemid=132, ello nos diría que el error que se cometió en el pronóstico del modelo logit y probit (modelos 7 y 8, cuadro 3) es de 0.039% y 0.052% respectivamente, que en ambos casos son errores muy pequeños, “DYEP”. 15
En los modelos (1,2,…,5) del cuadro 1, es congruente que los modelos afirman que los hombres tienen mayores posibilidades de acceder a la educación de pregrado en Bolivia en el 2002, lo cual es congruente con las estadísticas de la CEUB-BOLIVIA (http://www.ceub.edu.bo) para el año 2002. Sin embargo, este resultado del género para el 2009 cambia en favor de las mujeres.
![Page 24: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección](https://reader031.fdocuments.net/reader031/viewer/2022022714/5c4e6dad93f3c34c550c6d0c/html5/thumbnails/24.jpg)
24
Gráfico 6 Relación entre el valor observado de la variable dependiente del modelo 6 y 8 (cuadro 3),
el valor predicho de la variable dependiente, y el ingreso del hogar per cápita de familia
Elaboración propia de los autores
Tomando todo las variables explicativas constante (evaluados en algún valor) excepto
la variable ingreso del hogar per cápita de familia (yhogpcf) podemos graficar la
relación estimada entre la variable dependiente binaria que toma valor 1 si la persona
ha participado en la vida universitaria de pregrado y el ingreso del hogar per cápita de
familia. Por ejemplo, tomemos la edad en 25, una persona soltera, hombre, que
proviene del área urbana, no indígena y no pobre. El gráfico 6 (izquierda) muestra la
relación entre el valor observado de la variable dependiente, el valor predicho de la
variable dependiente, y el ingreso del hogar per cápita de familia (yhogpcf). Mientras
el gráfico 6 (derecha) nos muestra la probabilidad predicha por el probit, siguiendo la
misma analogía.
Gráfico 7 [Predicción estática modelo 6, cuadro 3 (izquierda) y
Prueba de normalidad Chi-Cuadrado (derecha)]
Elaboración propia de los autores
El gráfico 7 nos muestra la predicción estática con intervalos de confianza al 95% y la
prueba de normalidad de chi-cuadrado para el modelo lineal de probabilidad (modelo
6, cuadro 3), la misma nos indica que no se cumple la normalidad de los errores del
modelo 6, el análisis es análogo del gráfico 3 para el modelo 1 (cuadro 1).
![Page 25: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección](https://reader031.fdocuments.net/reader031/viewer/2022022714/5c4e6dad93f3c34c550c6d0c/html5/thumbnails/25.jpg)
25
Porcentaje de aciertos por los modelos no lineales de probabilidad (logit y probit): análisis de sensitividad y especificidad
Cuadro 4 (Análisis de Sensitividad y Especificidad con un umbral de 0.5 ) -------- True -------- (Modelo Logit)
Clasificación D ~D Total
+ 143957 104043 248000
- 326096 1775291 2101387
Total 470053 1879334 2349387
-------- True -------- (Modelo Probit)
Clasificación D ~D Total
+ 136491 96414 232905
- 333562 1782920 2116482
Total 470053 1879334 2349387
Clasificado + Si el predicho Pr(D) >=0 .5 Verdad D definido como licenciatura != 0 LOGIT
Sensitividad
Especificidad
Valor predicho positivo
Valor predicho negativo
LOGIT
Pr( +| D)
Pr( -|~D)
Pr( D| +)
Pr(~D| -)
LOGIT
30.63%
94.46%
58.05%
84.48%
PROBIT
Sensitividad
Especificidad
Valor predicho positivo
Valor predicho negativo
PROBIT
Pr( +| D)
Pr( -|~D)
Pr( D| +)
Pr(~D| -)
PROBIT
29.04%
94.87%
58.60%
84.24%
Logit: Clasificación correcta (R2) 81.69%
Probit: Clasificación correcta (R2) 81.70%
Elaboración propia de los autores
El coeficiente de determinación de conteo en ambos modelos es elevado,
alcanzando un 81.69% en el modelo logit y un 81.70% en el probit, que en ambos
casos se basan en el cálculo de las predicciones correctas hechas por el modelo. La
interpretación seria que en un 81.69% y 81.70%16 las variaciones de la variable
explicada dicotoma vienen explicadas por variaciones de las variables explicativas y
en un 18.31% y 18.30% por el termino de error ecuacional que su vez este anida a
variables periféricas que no han sido incluidas por razones de falta de información y
parsimonia.
16
Evidentemente, al tratarse de modelos no lineales carece de sentido plantear la bondad del ajuste en los términos que definen el coeficiente de determinación (R
2). Existen criterios alternativos que, en cierto modo,
siguen la misma idea (R2 de conteo, McFadden, McKelvey y Zavoina, Efron, etc. ). Sin embargo, todas estas
medidas deben interpretarse con cierta cautela, su validez como criterios de selección del modelo es ciertamente limitada.
![Page 26: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección](https://reader031.fdocuments.net/reader031/viewer/2022022714/5c4e6dad93f3c34c550c6d0c/html5/thumbnails/26.jpg)
26
Gráfico 817
(Característica operativa del receptor: Logit)
Gráfico 9 (Característica operativa del receptor: Probit)
Elaboración propia de los autores
Los gráficos 8 y 9 de las características operativas del receptor18, tanto del
modelo logit y probit, podemos advertir que los resultados gráficos son congruentes y
se complementan con los resultados obtenidos en el análisis de sensitividad y
especificidad del cuadro 4.
5. CONCLUSIONES
Este trabajo ha intentado caracterizar los factores que podrían influir en el acceso a
la educación de pregrado en Bolivia, para el mismo se utilizó variables que dicta la
teoría económica y al mismo tiempo se añadieron otras variables explicativas, que
creemos podrían influir en la variable explicada. Para tal efecto estimamos distintos
modelos de elección discreta, así como análisis de sensitividad y especificidad para
conocer la proporción de predicciones correctas por nuestros modelos.
De manera general para los dos años en comparación 2002 y 2009, según
nuestras estimaciones, es claro a simple vista que si las personas son solteras, de
17
El análisis grafico de sensitividad y especificidad de los gráficos (3, 4, 6 y 7) se basan en estimaciones de la
muestra estudiada, una estimación para todas las observaciones se encuentra en los gráficos A3 y A4 del Anexo 1. 18
Las estimaciones con mínimos cuadrados ponderados, para corregir el problema de heterocedasticidad que se
da en los modelos lineales de probabilidad (modelos 1 y 6, cuadros 1 y 3), se encuentran en el cuadro A2 del Anexo 1.
![Page 27: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección](https://reader031.fdocuments.net/reader031/viewer/2022022714/5c4e6dad93f3c34c550c6d0c/html5/thumbnails/27.jpg)
27
mayor edad, con mayor ingreso del hogar per cápita de familia, no pobres y que
provienen fundamentalmente del área urbana tienen mayores posibilidades de
participar en la actividad universitaria. Al mismo tiempo, nuestros modelos indican
también, que la proporción de matriculados en el sistema universitario habría
aumentado de 215358 alumnos (2002) a 318342 alumnos para el 2009 según las
estimaciones del modelo logístico19, cuando la CEUB, en sus datos estadísticos
registra un aumento de 218830 alumnos (2002) a 331392 alumnos para el 2009. En
ambas situaciones, nuestras estimaciones y los datos estadísticos de la CEUB son
bastante parecidas.
Por otro lado, el aumento de la base de matriculados en un 66.03% en el
periodo 2002 al 2009, podría deberse a varios factores, entre ellas: la política
gubernamental del actual gobierno, bajo el lema de mayor y mejor educación para
todos, que la misma se vio reflejada en incrementos presupuestarios del gobierno
nacional al sistema universitario en los últimos años que provienen fundamentalmente
del ingreso de la venta de gas y sus derivados a nuestros principales socios
comerciales. Asimismo, hay que reconocer también el mayor interés que han
mostrado estudiantes de zonas no urbanas de participar en la educación superior,
que la misma se vio complementada y apoyada, con la apertura y descentralización
de universidades de las principales urbes, a zonas conurbadas y/o zonas rurales,
como ejemplo: la apertura de universidades en la ciudad del Alto, siglo XX, etc.
Si bien ha existido un aumento en la base de matriculados en el sistema
universitario durante el periodo en estudio, sería importante responder, que
proporción de los alumnos matriculados, efectivamente termina la carrera profesional
y al mismo tiempo que proporción de los mismos ejerce laboralmente la carrera
profesional que ha estudiado, esta última pregunta es importante, debido a la
informalidad que caracteriza a Bolivia y a toda la región latinoamericana.
Para finalizar los dos modelos (Logit y Probit) son muy parecidos que no
permite un alto grado de discriminación, la única diferencia es desde el punto de vista
gráfico, ya que la curva logistica tiene colas mucho más planas con relación a la
probit (curva probit se acerca mucho más rápido a los ejes asintóticos), por lo tanto su
elección estar en función a dos aspectos:
- Conveniencia matemática.
19
Se realiza un análisis análogo para las estimaciones del modelo Probit de los dos años en estudio
![Page 28: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección](https://reader031.fdocuments.net/reader031/viewer/2022022714/5c4e6dad93f3c34c550c6d0c/html5/thumbnails/28.jpg)
28
- Discriminación basada en medidas de bondad de ajuste (R2) y
utilización de estadísticos que reflejen la significancia de la variables
explicativas (Estadístico z)
Por último, nuestros modelos cumplen con los siguientes requisitos:
Principio de Parsimonia: Explicar mucho con poco (Milton Friedman)
Bondad del Ajuste: La cual se ve reflejada en los enfoques de discriminación que
tiene por objetivo seleccionar aquel modelo que cumpla con algunos criterios de la
bondad del ajuste en nuestro caso el Rseudo de Daniel Macfadden y el coeficiente
de determinación de conteo.
Consistencia Teórica: En los modelos de elección discreta los coeficientes de
regresión son estadísticamente significativos, reflejados en los estadísticos {T y Z
> 2} con signos esperados a priori de acuerdo con la evidencia empírica
internacional.
BIBLIOGRAFÍA
Ashenfelter, O. y Krueger, A. (1994): «Estimating the returns schooling using a nex sample of twins». American Economic Review, 84, pp. 1157-1173. Arrow, K. (1973). “Higher education as a filter” en Journal of Public Economics, núm. 2, pp. 193-216.
Barro, R. J. (1991): «Economic Growth in a Cross-Section of Countries». Quarterly Journal of Economics, 106 (2), pp. 407-443. Becker, G. S. (1964). Human capital, Nueva York: Columbia University Press. __________
(1975). Human capital: a theoretical and empirical analysis whit special reference to education, Nueva York: Columbia University Press.
Caballero, Benigno (2003). “Manual de Econometría”, Universidad Técnica de Oruro. Card, D. (2000): «Estimating the returns to schooling: progress on some persistent problems». NBER Working Paper, 7769: National Bureau of Economic Research. Cambridge, MA. Cohn, E., Kicker, B. y Oliveira, M. (1987): «Further Evidence on the Screening Hypotesis». Economic Letters, 25, pp. 289-294. Denison, E. F. (1962): The Sources of Economic Growth in the US and the Alternatives Before Us. The Brookings Institute. Washington, DC. Dixit, A. K. (1990). Optimization in economic theory, RU: Oxford University Press. Freeman, R. B. (1976). The over-educated american, Nueva York: Academic Press.
![Page 29: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección](https://reader031.fdocuments.net/reader031/viewer/2022022714/5c4e6dad93f3c34c550c6d0c/html5/thumbnails/29.jpg)
29
Heckman, J. J. (1976). “A life cycle modern of earnings, learning and consumption” en Journal of Political Economy, núm. 84, S11-S44.
Huffman, W. E. (1981). “Black-white human capital differences: impact on agricultural
productivity in the US south” en American Economic Review, núm.71, pp. 94-107.
Layard, P. R. G. y Psacharopoulos, G. (1974). “The screening hypothesis and
thereturns to education” en Journal of Political Economy, núm. 82, pp. 985-98.
Mankiw, N. G., Romer, D. y Weil, D. N. (1992): «A Contribution to the Empirics of Economic Growth». Quarterly Journal of Economics, 107 (2), pp. 407-437. Mincer, J. (1974). Schooling, experience and earnings, Nueva York: National Bureaufor Economic Research.
Pontryagin, L. S., Boltyanskii, V. G., Gamkrelidze, R. V. y Mischenko, E. F. (1962).The mathematical theory of optimal processes, Nueva York: Wiley.
Psacharopoulos, G. (1973). Returns to education, Amsterdam: Elsevier. __________
(1975). Earnings and education in OECD countries, París: OCDE. __________
(1981). “Returns to education: an updated international comparison” en Comparative Education, núm. 17, pp. 321-41.
Solow, R. M. (1956): «A Contribution to the Theory of Economic Growth». Quaterly Journal of Economics, 70 (February), pp. 65-94. Schultz, T. (1961). “Investment in human capital” en American Economic Review,núm. 51, pp. 1-17.
Spence, M. (1973). “Job market signalling” en Quarterly Journal of Economics, núm.
8, pp. 355-74.
Wilson, R. A. (1987). “The determinants of the earnings of professional engineersin Great Britain in 1981” en Applied Economics, núm. 19, pp. 983-94. Sitios Webs: Instituto Nacional de Estadística (INE-BOLIVIA): Base de datos de encuesta de hogares 2002 y 2009. Banco Central de Bolivia (BCB): Base de datos y estadísticas. Comité Ejecutivo de la Universidad de Bolivia (CEUB): Base de datos y estadísticas. Unidad de Análisis de Políticas Sociales y Económicas (UDAPE): Base de datos y estadísticas. Libros: GUJARATI DAMODAR, Econometría. 2007
MADALA. Econometria, 1996.
![Page 30: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección](https://reader031.fdocuments.net/reader031/viewer/2022022714/5c4e6dad93f3c34c550c6d0c/html5/thumbnails/30.jpg)
30
GREENE WILLIAM, Econometría, 2005
http://www.ine.gov.bo/mecovi/index.htm
ANEXO 1
Cuadro A1 Pruebas de heterocedasticidad al modelo lineal de probabilidad sin errores
estándar robustos
Breusch-Pagan / Cook-Weisberg test for heteroskedasticity Ho: Constant variance
Variables: fitted values of licenciatura Resultado 2002 Resultado 2009
chi2(1) = 1920.61 chi2(1) = 733.63 Prob > chi2 = 0.0000 Prob > chi2 = 0.0000
Las pruebas de heterocedasticidad nos afirman que los modelos lineales de probabilidad (sin errores estándar robustos) sufren de heterocedasticidad, tal como lo señala la teoría econométrica.
Gráfica A1 Pruebas de normalidad al modelo lineal de probabilidad sin errores
estándar robustos, y sin factor de expansión (2002 izquierda y 2009 derecha)
0
200
400
600
800
1000
-0.5 -0.0 0.5 1.0
Series: Residuals
Sample 1 5526
Observations 5517
Mean 3.18e-17
Median -0.067561
Maximum 1.027269
Minimum -0.697842
Std. Dev. 0.294105
Skewness 1.897771
Kurtosis 5.722084
Jarque-Bera 5014.928
Probability 0.000000
0
100
200
300
400
-0.5 0.0 0.5 1.0
Series: Residuals
Sample 1 3582
Observations 3452
Mean 2.94e-17
Median -0.111520
Maximum 1.024280
Minimum -0.843007
Std. Dev. 0.353166
Skewness 1.033361
Kurtosis 3.025159
Jarque-Bera 614.4526
Probability 0.000000
Elaboración propia de los autores
Podemos advertir como señala la teoría econométrica que el modelo lineal de probabilidad no cumple los supuestos de heterocedasticidad y normalidad de los errores, puntos 3 y 4 de la página 10.
Gráfica A2 Valor actual y pronosticado por el modelo lineal de probabilidad sin errores
estándar robustos, y sin factor de expansión (2002 izquierda y 2009 derecha)
-0.8
-0.4
0.0
0.4
0.8
1.2
-0.4
0.0
0.4
0.8
1.2
1000 2000 3000 4000 5000
Residual Actual Fitted
-1.0
-0.5
0.0
0.5
1.0
1.5
-0.4
0.0
0.4
0.8
1.2
500 1000 1500 2000 2500 3000 3506
Residual Actual Fitted
Elaboración propia de los autores
![Page 31: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección](https://reader031.fdocuments.net/reader031/viewer/2022022714/5c4e6dad93f3c34c550c6d0c/html5/thumbnails/31.jpg)
31
Cuadro A2 Corrigiendo el problema de heterocedasticidad del modelo lineal de probabilidad con mínimos
cuadrados ponderados restringidos por edad (17 a 30 años), y sin factor de expansión
Mínimos cuadrados ponderados 2002
Elaboración propia de los autores
Mínimos cuadrados ponderados 2009
Elaboración propia de los autores
Se puede advertir que las estimaciones de mínimos cuadrados ponderados para los años 2002 y 2009, tienen los mismos signos encontrados en los modelos de elección discreta estimados (cuadros 1 y 3) y en ningún caso se contradicen
Gráfico A3 Análisis de sensitividad y especificidad para todas las observaciones
Modelo Probit (Año 2002)
Elaboración propia de los autores
![Page 32: LA PPAARRTTIICCIIPPAACCIIÓÓN N SDDEE VLLOOSS … · a la educación universitaria. Para poder analizar estos efectos se emplea como metodología econométrica, los modelos de elección](https://reader031.fdocuments.net/reader031/viewer/2022022714/5c4e6dad93f3c34c550c6d0c/html5/thumbnails/32.jpg)
32
Gráfico A4 Análisis de sensitividad y especificidad para todas las observaciones
Modelo Logit (Año 2009)
Elaboración propia de los autores