Introducción al método de Regresión...

32
RD Sánchez Introducción Regresión discontinua nítida Regresión discontinua borrosa Conclusiones Discusión: RD aplicado a programas de agua y saneamiento Introducción al método de Regresión Discontinua Dr. Alan Sánchez Taller Latinoamericano de Evaluación de Impacto Lima, Perú 19 de Marzo, 2015

Transcript of Introducción al método de Regresión...

RD

Sánchez

Introducción

Regresióndiscontinuanítida

Regresióndiscontinuaborrosa

Conclusiones

Discusión: RDaplicado aprogramas deagua ysaneamiento

Introducción al método de RegresiónDiscontinua

Dr. Alan Sánchez

Taller Latinoamericano de Evaluación de ImpactoLima, Perú

19 de Marzo, 2015

RD

Sánchez

Introducción

Regresióndiscontinuanítida

Regresióndiscontinuaborrosa

Conclusiones

Discusión: RDaplicado aprogramas deagua ysaneamiento

Bibliografía

Bernal, Raquel y Peña, Ximena. 2011. “Guía práctica para la evaluaciónde impacto”. Universidad de los Andres, Capítulo 8.

Angrist, J. y Pischke, J-S. 2009. “Mostly Harmless Econometrics”.Princeton University Press, Capítulo 6.

Ziegelhofer, Zacharias. 2012. “Down with diarrhea: using fuzzyregression discontinuity design to link communal water supply withhealth”. The Graduate Institute, Ginebra.

RD

Sánchez

Introducción

Regresióndiscontinuanítida

Regresióndiscontinuaborrosa

Conclusiones

Discusión: RDaplicado aprogramas deagua ysaneamiento

1 Introducción

2 Regresión discontinua nítida

3 Regresión discontinua borrosa

4 Conclusiones

5 Discusión: RD aplicado a programas de agua ysaneamiento

RD

Sánchez

Introducción

Regresióndiscontinuanítida

Regresióndiscontinuaborrosa

Conclusiones

Discusión: RDaplicado aprogramas deagua ysaneamiento

Contenido

1 Introducción

2 Regresión discontinua nítida

3 Regresión discontinua borrosa

4 Conclusiones

5 Discusión: RD aplicado a programas de agua ysaneamiento

RD

Sánchez

Introducción

Regresióndiscontinuanítida

Regresióndiscontinuaborrosa

Conclusiones

Discusión: RDaplicado aprogramas deagua ysaneamiento

Muchos programas sociales utilizan un índice o score para seleccionar asus beneficiarios. Algunos ejemplos:

Programas anti-pobreza: se escoge a hogares pobres según laclasificación de pobreza del país (por ejemplo, consumo per cápitapor debajo de 1.25 USD diarios)

Programas de pensiones: se escoge a personas por encima de unumbral de edad

Programas educativos: otorgamiento de becas para aquellos connota por encima de un umbral determinado

RD

Sánchez

Introducción

Regresióndiscontinuanítida

Regresióndiscontinuaborrosa

Conclusiones

Discusión: RDaplicado aprogramas deagua ysaneamiento

Participación en programa según nivel depobreza

Linea de pobreza

0.2

.4.6

.81

Ele

gibl

e pa

ra r

ecib

ir pr

ogra

ma

0 20 40 60 80 100Indice de pobreza

RD

Sánchez

Introducción

Regresióndiscontinuanítida

Regresióndiscontinuaborrosa

Conclusiones

Discusión: RDaplicado aprogramas deagua ysaneamiento

Participación en programa según nivel depobreza

0.2

.4.6

.81

Ele

gibl

e pa

ra r

ecib

ir pr

ogra

ma

0 20 40 60 80 100Indice de pobreza

RD

Sánchez

Introducción

Regresióndiscontinuanítida

Regresióndiscontinuaborrosa

Conclusiones

Discusión: RDaplicado aprogramas deagua ysaneamiento

Regresión discontinua: en la línea de base

020

0040

0060

00V

aria

ble

resu

ltado

0 20 40 60 80 100Indice de pobreza

Elegibles No elegibles

RD

Sánchez

Introducción

Regresióndiscontinuanítida

Regresióndiscontinuaborrosa

Conclusiones

Discusión: RDaplicado aprogramas deagua ysaneamiento

Regresión discontinua: en la línea de base

020

0040

0060

00V

aria

ble

resu

ltado

0 20 40 60 80 100Indice de pobreza

Elegibles No elegibles95% CI Fitted values

RD

Sánchez

Introducción

Regresióndiscontinuanítida

Regresióndiscontinuaborrosa

Conclusiones

Discusión: RDaplicado aprogramas deagua ysaneamiento

Regresión discontinua: post-tratamiento

020

0040

0060

0080

00V

aria

ble

resu

ltado

0 20 40 60 80 100Indice de pobreza

Elegibles No elegibles

RD

Sánchez

Introducción

Regresióndiscontinuanítida

Regresióndiscontinuaborrosa

Conclusiones

Discusión: RDaplicado aprogramas deagua ysaneamiento

Regresión discontinua: post-tratamiento

020

0040

0060

0080

00V

aria

ble

resu

ltado

0 20 40 60 80 100Indice de pobreza

Elegibles No elegibles95% CI Fitted valuesFitted values

RD

Sánchez

Introducción

Regresióndiscontinuanítida

Regresióndiscontinuaborrosa

Conclusiones

Discusión: RDaplicado aprogramas deagua ysaneamiento

Contenido

1 Introducción

2 Regresión discontinua nítida

3 Regresión discontinua borrosa

4 Conclusiones

5 Discusión: RD aplicado a programas de agua ysaneamiento

RD

Sánchez

Introducción

Regresióndiscontinuanítida

Regresióndiscontinuaborrosa

Conclusiones

Discusión: RDaplicado aprogramas deagua ysaneamiento

Regresión discontinua nítida (sharp RD) se utiliza cuando el tratamiento(variable Di ) es una función perfecta y discontinua de algún tipo de score(variable scorei ). Por ejemplo,

Di =

{1 if scorei ≤ x0,

0 if scorei > x0

En este caso, el modelo más sencillo a aplicar es

Yi = α+ βxi + ρDi + ηi (1)

donde ρ es el parámetro de interes

Nótese que todo lo anterior también aplica si:

Di =

{1 if scorei ≥ x0,

0 if scorei < x0

RD

Sánchez

Introducción

Regresióndiscontinuanítida

Regresióndiscontinuaborrosa

Conclusiones

Discusión: RDaplicado aprogramas deagua ysaneamiento

Ejemplo: impacto de Progresa sobre consumo

RD

Sánchez

Introducción

Regresióndiscontinuanítida

Regresióndiscontinuaborrosa

Conclusiones

Discusión: RDaplicado aprogramas deagua ysaneamiento

Ejemplo: impacto de Progresa sobre consumo

RD

Sánchez

Introducción

Regresióndiscontinuanítida

Regresióndiscontinuaborrosa

Conclusiones

Discusión: RDaplicado aprogramas deagua ysaneamiento

Algunas aclaraciones

1 La asignación al tratamiento se interpreta como aleatoria en elvecindario de la discontinuidad. Es decir, para un segmento de lapoblación se asume que estar marginalmente por encima o pordebajo del cut-off es algo que está fuera de control delindividuo

2 Lo anterior que la regla de elegibilidad (instrumento de focalización)no es manipulable. El siguiente gráfico muestra dos ejemplos.

3 En estricto, se obtiene LATE (Local Average Treatment Effect). Esdecir, se obtiene el impacto del programa para aquellos en elvecindario de la discontinuidad. Útil, pero no necesariamentegeneralizable.

4 Hay que tener cuidado en no confundir el impacto del programacon una no-linearidad en los datos.

RD

Sánchez

Introducción

Regresióndiscontinuanítida

Regresióndiscontinuaborrosa

Conclusiones

Discusión: RDaplicado aprogramas deagua ysaneamiento

Esquema: densidad del instrumento defocalización

X0 X X0 X

RD

Sánchez

Introducción

Regresióndiscontinuanítida

Regresióndiscontinuaborrosa

Conclusiones

Discusión: RDaplicado aprogramas deagua ysaneamiento

Algunas aclaraciones

1 La asignación al tratamiento se interpreta como aleatoria en elvecindario de la discontinuidad. Es decir, para un segmento de lapoblación se asume que estar marginalmente por encima o pordebajo del cut-off es algo que está fuera de control delindividuo

2 Lo anterior que la regla de elegibilidad (instrumento de focalización)no es manipulable. El siguiente gráfico muestra dos ejemplos.

3 En estricto, se obtiene LATE (Local Average Treatment Effect). Esdecir, se obtiene el impacto del programa para aquellos en elvecindario de la discontinuidad. Útil, pero no necesariamentegeneralizable.

4 Hay que tener cuidado de no confundir el impacto del programacon una no-linearidad en los datos.

RD

Sánchez

Introducción

Regresióndiscontinuanítida

Regresióndiscontinuaborrosa

Conclusiones

Discusión: RDaplicado aprogramas deagua ysaneamiento

No linearidades

En el caso en que xi se relacione con yi de manera no lineal, se sugiereaplicar

Yi = α+ β1xi + β2x2i + · · ·+ βpxp

i + ρDi + ηi (2)

Esto es importante a fin de no confundir el salto ocasionado por laactivación del umbral con una no linearidad no incorporada. En laliteratura es usual utilizar polinomios de tercer o cuarto grado

La versión general del modelo anterior es

Yi = α+ β01x̃i + β02x̃2i + · · ·+ β0px̃p

i . . . (3)

+ρDi + β11Di x̃i + β12Di x̃2i + · · ·+ β1pDi x̃p

i + ηi

donde x̃i = xi − x0

RD

Sánchez

Introducción

Regresióndiscontinuanítida

Regresióndiscontinuaborrosa

Conclusiones

Discusión: RDaplicado aprogramas deagua ysaneamiento

Caso lineal

RD

Sánchez

Introducción

Regresióndiscontinuanítida

Regresióndiscontinuaborrosa

Conclusiones

Discusión: RDaplicado aprogramas deagua ysaneamiento

Caso no lineal

RD

Sánchez

Introducción

Regresióndiscontinuanítida

Regresióndiscontinuaborrosa

Conclusiones

Discusión: RDaplicado aprogramas deagua ysaneamiento

Ejemplo de por que es importante modelar nolinearidades

RD

Sánchez

Introducción

Regresióndiscontinuanítida

Regresióndiscontinuaborrosa

Conclusiones

Discusión: RDaplicado aprogramas deagua ysaneamiento

No linearidades

En el caso en que xi se relacione con yi de manera no lineal, se sugiereaplicar

Yi = α+ β1xi + β2x2i + · · ·+ βpxp

i + ρDi + ηi (4)

Esto es importante a fin de no confundir el salto ocasionado por laactivación del umbral con una no linearidad no incorporada. En laliteratura es usual utilizar polinomios de tercer o cuarto grado

una forma más general del modelo anterior es

Yi = α+ ρDi + i(xi) + ηi (5)

donde la función i(xi) caracteriza posibles no-linearidades de la relaciónentre xi e yi

RD

Sánchez

Introducción

Regresióndiscontinuanítida

Regresióndiscontinuaborrosa

Conclusiones

Discusión: RDaplicado aprogramas deagua ysaneamiento

Contenido

1 Introducción

2 Regresión discontinua nítida

3 Regresión discontinua borrosa

4 Conclusiones

5 Discusión: RD aplicado a programas de agua ysaneamiento

RD

Sánchez

Introducción

Regresióndiscontinuanítida

Regresióndiscontinuaborrosa

Conclusiones

Discusión: RDaplicado aprogramas deagua ysaneamiento

En ocasiones la discontinuidad determina quien recibe acceso alprograma, pero no de manera perfecta

Por ejemplo, aprobar marginalmente el examen de admisión de uninstituto educativo exclusivo no garantiza que el individuo sematricule. En estos casos lo que se tiene es que aprobar elexamen de admisión incrementa la probabilidad de matricularse

RD

Sánchez

Introducción

Regresióndiscontinuanítida

Regresióndiscontinuaborrosa

Conclusiones

Discusión: RDaplicado aprogramas deagua ysaneamiento

Admisión en instituto educativo exclusivosegún puesto en examen de admisión

0.2

.4.6

.81

Adm

itido

en

prog

ram

a de

est

udio

s

0 20 40 60 80 100Puesto en el examen de admisión

RD

Sánchez

Introducción

Regresióndiscontinuanítida

Regresióndiscontinuaborrosa

Conclusiones

Discusión: RDaplicado aprogramas deagua ysaneamiento

Matrícula en instituto educativo exclusivosegún puesto en examen de admisión, caso 1

0.2

.4.6

.81

Mat

ricul

ado

en p

rogr

ama

de e

stud

ios

0 20 40 60 80 100Puesto en el examen de admisión

RD

Sánchez

Introducción

Regresióndiscontinuanítida

Regresióndiscontinuaborrosa

Conclusiones

Discusión: RDaplicado aprogramas deagua ysaneamiento

Matrícula en instituto educativo exclusivosegún puesto en examen de admisión, caso 2

0.2

.4.6

.81

Mat

ricul

ado

en p

rogr

ama

de e

stud

ios

0 20 40 60 80 100Puesto en el examen de admisión

RD

Sánchez

Introducción

Regresióndiscontinuanítida

Regresióndiscontinuaborrosa

Conclusiones

Discusión: RDaplicado aprogramas deagua ysaneamiento

La regresión discontinua borrosa (fuzzy RD) se utiliza cuando eltratamiento (variable Di ) es más probable de ocurrir cuando losindividuos cumplen cierto criterio.

En este caso se tiene un modelo de dos ecuaciones.

Primero, se estima una ecuacion de probabilidad de acceder altratamieno, Di

Di = γ0 + πTi + g(xi) + ζi (6)

Donde Ti es una variable binaria que se activa cuando el individuocumple cierto criterio. Se asume que Ti es una función de xi . Luego seobtiene D̂i (el valor predicho de Di ) y se reemplaza en la ecuación deinterés,

Yi = α+ ρD̂i + i(xi) + ηi (7)

el coeficiente ρ mide el impacto del programa. Las funciones g(xi) y i(xi)permiten controlar por no linearidades.

RD

Sánchez

Introducción

Regresióndiscontinuanítida

Regresióndiscontinuaborrosa

Conclusiones

Discusión: RDaplicado aprogramas deagua ysaneamiento

Contenido

1 Introducción

2 Regresión discontinua nítida

3 Regresión discontinua borrosa

4 Conclusiones

5 Discusión: RD aplicado a programas de agua ysaneamiento

RD

Sánchez

Introducción

Regresióndiscontinuanítida

Regresióndiscontinuaborrosa

Conclusiones

Discusión: RDaplicado aprogramas deagua ysaneamiento

RD (en su versión nítida y borrosa) permite obtener estimadoresinsesgados del impacto de un programa en el vecindario de ladiscontinuidad.

Se aprovecha la existencia de reglas conocidas de acceso aprogramas para evaluarlos.

Por otro lado, el resultado que se obtiene (LATE) no esnecesariamente generalizable.

Se puede tener poca potencia si hay pocas observacionesalrededor de la discontinuidad.

RD

Sánchez

Introducción

Regresióndiscontinuanítida

Regresióndiscontinuaborrosa

Conclusiones

Discusión: RDaplicado aprogramas deagua ysaneamiento

Contenido

1 Introducción

2 Regresión discontinua nítida

3 Regresión discontinua borrosa

4 Conclusiones

5 Discusión: RD aplicado a programas de agua ysaneamiento