Metodos de Evaluacion

25
1 TÉCNICAS CUANTITATIVAS DE EVALUACIÓN DE POLÍTICAS PÚBLICAS I CURSO DE EVALUACION DE POLÍTICAS PÚBLICAS Y PROGRAMAS PRESUPUESTARIOS MADRID, OCTUBRE DE 2009 AUTOR: Ignacio Moral Arce

description

EVALUACION DE PROYECTOS

Transcript of Metodos de Evaluacion

Page 1: Metodos de Evaluacion

1

TÉCNICAS CUANTITATIVAS DE EVALUACIÓN DE POLÍTICAS PÚBLICAS

I CURSO DE EVALUACION DE POLÍTICAS PÚBLICAS Y PROGRAMAS PRESUPUESTARIOS

MADRID, OCTUBRE DE 2009

AUTOR: Ignacio Moral Arce

Page 2: Metodos de Evaluacion

2

ÍNDICE 1. Evaluación de políticas publicas ……………………………………………..…. 3

1.1 Evaluación ex_ante………………………………………………………. 3 1.2 Evaluación ex_post………………………………………………………. 3

2. El problema de la causalidad o de la evaluación de políticas…………………. 3 2.1.Problemas de medición…………………………………………………. 4 2.2.Inferencia causal…………………………………………………………. 4 3. El sesgo de selección……………………………………………………………… 7 4. Diseños de evaluación…………………………………………………………….. 8 4.1 Diseños experimentales – ensayos aleatorizados……………………. 9 4.2 Diseños cuasi-experimentales…………………………………………… 10 4.3 Diseños no experimentales……………………………………………… 11 5. Métodos de estimación…………………………………………………………….. 11 5.1. Diferencia de medias……………………………………………………. 11 5.2. Variables Instrumentales………………………………………………… 12

5.2.1. Problema de omisión de variables relevantes...…………… 12 5.2.2. Problema de participación endógena……………………… 13 5.2.3. Estimación del problema de omisión de variable y endogeneidad….….………………………………………………. 13

5.2.3.1 Estimación por mínimos cuadrados………………. 13 5.2.3.2. Estimación por variables instrumentales…………. 14

5.3. Método de dobles diferencias (dif en dif)……………………………… 15 5.3.1. Caso de más de dos periodos y grupos: Datos de panel…. 18 5.4. Regresiones en discontinuidad………………………………………… 18 5.5. Métodos de apareamiento (matching)………………………………… 20 5.5.1. Propensity score matching…………………………………… 23 5.5.1.1. Cálculo del Propensity score……………………… 23

Page 3: Metodos de Evaluacion

3

1. Evaluación de Políticas Una evaluación completa de una determinada política se define como una evaluación que incluye la supervisión o seguimiento, la evaluación del proceso, análisis del coste-beneficio, y finalmente la evaluación de impacto. El seguimiento ayudará a evaluar si un programa se está aplicando como estaba previsto y permitirá una retroalimentación continua sobre el estado de ejecución del programa y la identificación de problemas específicos a medida que surjan. La evaluación del proceso estudia de qué forma opera el programa y se centra en analizar los problemas en la prestación de los servicios. La evaluación del coste-beneficio analiza el gasto del programa (tanto monetario como no monetario), los usos alternativos que se pueden dar a los recursos disponibles y los beneficios producidos por el programa. Y, por último, la evaluación de impacto está destinada a determinar si la intervención publica tuvo los efectos deseados sobre los individuos, y si esos efectos son atribuibles a la intervención del programa. Teniendo presente lo mencionado previamente, en este tema nos vamos a centrar en explicar cuales son las técnicas mas utilizadas en la evaluación cuantitativa del impacto de una política pública. Desde de un punto de vista temporal se puede diferenciar entre dos tipos de evaluación: ex ante y ex post. La primera se realiza previa al comienzo del proyecto. La segunda se lleva a cabo cuando el proyecto ya está en ejecución o ha concluido y las decisiones se adoptan en función de los resultados que se han alcanzado. 1.1. Evaluación ex ante Tiene por finalidad proporcionar criterios racionales para tomar una decisión cualitativa de gran importancia: si el proyecto debe o no implementarse. También permite ordenar los proyectos según su eficiencia para alcanzar los objetivos perseguidos. Tanto el Análisis Coste-Beneficio como el Análisis Coste- Efectividad son metodologías aptas para la evaluación ex ante. Sin embargo, el ACB es más adecuado para analizar proyectos económicos y el ACE presenta mayores potencialidades para la evaluación de proyectos sociales. 1.2. Evaluación ex post Es necesario distinguir la situación de los proyectos que están en curso de aquellos que ya han concluido. Ambos tipos se evalúan buscando obtener elementos de juicio para la adopción de decisiones cualitativas y cuantitativas. 2. El problema de la Causalidad o de evaluación de políticas La metodología de la evaluación de impactos se basa en la existencia de relaciones causales. Si tenemos dos variables “x” e “y”, siendo “x” la causa, “y” el efecto, la causalidad se puede expresar como X y

Page 4: Metodos de Evaluacion

4

Las implicaciones que se derivan de la expresión anterior son:

a) los cambios de x producen cambios en y. b) la relación entre x e y es asimétrica y no reversible c) la variable y puede variar por otras fuentes. Se aceptan situaciones del tipo:

x --> z --> y, en este caso, x es causa de z que, a su vez, produce y. d) No existen relaciones espúreas entre variables.

2.1 Problemas de medición Para que la evaluación sea correcta debe cumplir ciertos criterios metodológicos, en especial los relacionados con la validez y la robustez de las mediciones. - Validez Existe validez si se ha medido lo que se pretende medir. Hay que diferenciar entre dos tipos de validez:

- validez interna, que está relacionada con el número mínimo de casos que se necesitan para interpretar el experimento.

- Validez externa, que tiene que ver con la generalización del resultado obtenido. En este caso la cuestión planteada es a que contexto, población y variables puede generalizarse el efecto estudiado.

- Robustez La robustez es la estabilidad y la exactitud en la medición. Una medición es robusta si un instrumento aplicado repetidamente sobre el mismo objeto de análisis genera los mismos resultados o muy similares. 2.2. Inferencia Causal El análisis de inferencia causal trata de determinar los efectos de una determinada intervención o política pública, contestando preguntas del siguiente tipo: “¿Afecta el salario mínimo al salario de todos los trabajadores? ¿Mejora la calidad de la educación si se reduce el numero de alumnos en las clases?, aunque todo este tipo de preguntas se puede analizar desde la óptica siguiente "¿Cuál sería la situación si la intervención no hubiera tenido lugar?". Esto implica estimar cuál habría sido la situación de los individuos o entidades afectadas por el programa que interesa evaluar en ausencia del mismo, así que el problema fundamental con el que nos encontramos es un problema de identificación y de falta de observación de uno de los elementos del estudio (el contrafactual). Comenzamos definiendo a la población objeto de estudio por la letra U. Cada unidad o individuo de U es denotado por u. Para cada u ∈ U, hay asociado un valor Y(u) de la variable de interés Y, la cual llamamos variable de respuesta. Sea A una segunda variable definida en U, que denominamos como el atributo de las unidades en U. La idea fundamental que esta detrás de este modelo es la posibilidad o no de exponer a cada unidad a la acción de una causa: Cada unidad tiene que ser potencialmente expuesta a cualquiera de las causas. Por simplicidad, asumimos que hay sólo 2 causas o niveles de tratamiento. Sea D una variable que indica la causa a la cual cada unidad en U es expuesta:

Page 5: Metodos de Evaluacion

5

⎩⎨⎧

=control al expuesta esu unidad la si

to tratamiena expuesta esu unidad la si ct

D

En un estudio controlado, D es establecido por el experimentador, mientras que en un estudio sin control, D es determinado por factores que están más allá del control del experimentador. Los valores que toma Y se ven (potencialmente) afectados por una determinada causa, “t” o “c”, a la que cada unidad es expuesta. Así, necesitamos dos variables de respuesta: Yt(u), Yc(u)

- Yt(u) es el valor de la respuesta que sería observada si la unidad u fuera expuesta a t.

- Yc(u) es el valor que sería observado en la misma unidad u si ésta fuera expuesta a c.

Alternativamente, D se puede expresar como una variable binaria:

⎩⎨⎧

=control al expuesta esu unidad la si 0

to tratamiena expuesta esu unidad la si 1D

Por lo tanto el resultado de una unidad “u” de la población se puede escribir como )()1()()( 01 uYDuDYuY −+= , donde )(1 uY es el resultado de la unidad u cuando es expuesta al tratamiento, mientras que )(0 uY es el resultado de la misma unidad cuando es expuesta al control. Así que, para una determinada unidad u, el efecto que tiene el tratamiento viene dado por:

δ = )()( 01 uYuY − . El problema fundamental de la ecuación anterior es que resulta imposible observar el valor de )(1 uY e )(0 uY en la misma unidad u, por lo que no podemos inferir el efecto del tratamiento porque no tenemos la evidencia del contrafactual. Dado que el efecto causal para una sola unidad u no puede ser observado, se intenta identificar el efecto causal promedio para la población, así que se calcula el efecto de tratamiento promedio (ETP) de t (en comparación a c) en una población U. Entonces, dado que

)()( 01 uYuYTE uu −== δ tenemos

[ ] δ=−=−=−= 010101 ))(())(()()( YYuYEuYEuYuYEETP UUUU , (1) por lo tanto, la solución más sencilla consiste en reemplazar el efecto causal imposible de observar de t en una unidad u específica con la posibilidad de estimar el efecto causal promedio de t sobre una población U de unidades. Sin embargo, )( 1YEU y

)( 0YEU son las esperanzas poblacionales y no se observan por lo que no pueden ser calculadas, pero pueden ser estimadas mediante sus contrapartidas muestrales

( ) 11ˆ YYEU = , ( ) 00

ˆ YYEU = ,

Page 6: Metodos de Evaluacion

6

donde ( ).ˆ

UE indica el estimador de ( ).UE , así que se sustituye en la expresión (1) y se obtiene 0101 ))(())(( YYuYEuYEETP UUU −=−= . (1.1) Vamos a considerar a continuación el estimador de ETP “después de tratamiento” como

[ ] [ ]0ˆ1ˆˆ01 =−== DYDYδ (2)

Las ecuaciones (1.1) y (2) no son comparables de manera estricta porque (1.1) está expresada en términos poblacionales, mientras que (2) representa un estimador calculado a partir de una muestra obtenida de esa población. La forma de poder comparar ambas expresiones parte del hecho de considerar una nueva variable en nuestro análisis, que llamamos “p”, y se define como la proporción de la población que es asignada al grupo de tratamiento. Entonces la expresión del ETP se puede escribir como

[ ] [ ]==−−+=−=−+= == 0)()1(1)()1( 010101 DYYpDYYppp DD δδδ

[ ] [ ] [ ] [ ]==−+=−=−−== 0)()1(1)(0)()1(1)( 1001 DYpDYpDYpDYp

01 YY −= . Si suponemos que [ ] [ ]0)(1)( 11 === DYDY y [ ] [ ]0)(1)( 00 === DYDY entonces

( ) ( )01 01 =−== DYDYδ , (3) que es una expresión poblacional, y puede ser estimada mediante

( ) ( )0ˆ1ˆˆ01 =−== DYDYδ (4)

Por lo tanto, para que el estimador muestral estime consistentemente el ETP verdadero se debe cumplir que [ ] [ ]0)(1)( 11 === DYpDYp y

[ ] [ ]0)(1)( 00 === DYpDYp , es decir, que el “resultado promedio bajo el tratamiento no difiere entre los grupos de tratamiento y de control”, y que además “el resultado promedio bajo control no difiere entre los grupos de tratamiento y de control”. Para que estas dos condiciones se cumplan es suficiente que la asignación del tratamiento D no esté correlacionado con las potenciales distribuciones resultantes de

1Y e 0Y . La forma óptima de conseguir esta ausencia de correlación es a través de la asignación aleatoria del tratamiento. El mayor problema que presenta el enfoque de inferencia causal es que en la mayoría de los casos, simplemente no hay información disponible sobre cómo aquellos individuos en el grupo control habrían reaccionado si hubieran recibido el tratamiento. Ésta es la base para comprender los potenciales

Page 7: Metodos de Evaluacion

7

sesgos del estimador estándar (2), en el que se puede observar (tras realizar algo de algebra) que:

( ) ( )[ ] [ ]0100 )1(01ˆ== −−+=−=+= DDpDYDY δδδδ .

El sesgo en nuestras estimaciones puede venir por dos motivos:

1. El sesgo de selección, que analizaremos a continuación. 2. la heterogeneidad del tratamiento, ya que las “respuestas potenciales” no

son iguales para los participantes y los no participantes, porque éstos normalmente difieren de forma sistemática por diversos motivos:

- Porque las características observables (edad, nivel de educación, situación económica) de los individuos afectan a si se les ofrece la posibilidad de participar o no.

- Porque los individuos deciden participar o no en el programa que les ofrecen dependiendo de características individuales no observables por el analista (motivación, perspectivas, etc.)

Para solucionar el primero de los problemas, la estimación de los efectos causales de un tratamiento suele empezar por entender e identificar el posible problema de selección, y posteriormente, una vez detectado, se deberá decidir la técnica de estimación más adecuada. 3. El sesgo de selección Una de las consideraciones más relevantes que pueden afectar a la elección de una determinada técnica de evaluación es el problema del sesgo, es decir, la medida en que los distintos grupos puedan participar de manera diferente en un programa, lo que afecta a la muestra de individuos analizada y finalmente a los resultados. Existen dos tipos de sesgos: (c.1) Los debidos a las diferencias en los variables observadas (que puede estimarse a partir de los datos) como variables geográficas (pertenecer a un entorno rural o urbano), ir o no a la escuela, o la participación en el mercado laboral, entre muchos otras. (c.2) Los debidos a factores no observables (que son o no conocidos por el investigador o no son fácilmente medibles), que se conocen como sesgo de selección. El problema de sesgo de selección en la evaluación de impactos es causado por el hecho de que los individuos que pertenecen a dos grupos distintos (como participantes del programa y no participantes) tienen determinadas características que no pueden ser observadas por el evaluador y afectan tanto a la decisión de participar en el programa así como a sus resultados (por ejemplo, la capacidad o la motivación de una determinada persona, relaciones familiares). Un buen ejemplo de sesgo de selección es la determinación del salario de las mujeres (en especial las que tienen niños de corta edad). Los datos que se tienen presentan información de las mujeres que trabajan, y si se decide realizar un estudio con este tipo de información, e ignorar el hecho de que no se observan todos los salarios los resultados que se van a obtener son bastante deficientes. La decisión de las mujeres de ir al mercado de trabajo no está realizada al azar, porque las mujeres comparan el

Page 8: Metodos de Evaluacion

8

salario que les ofrece un empresario con su salario de reserva (por ejemplo, el cuidado de hijos), así que las que tienen salarios de una empresa bajos van a decidir no trabajar (ya que su salario de reserva es superior), mientras que si el salario ofrecido por los empleadores es mayor que el salario de reserva decidirán trabajar. Así pues, la muestra de los salarios de las mujeres presenta un sesgo hacia arriba si no se tiene en cuenta este salario de reserva. En el caso de la evaluación de impacto un ejemplo de sesgo consiste en si los participantes del programa son aquellas personas que tienen más que ganar con el programa y están más motivadas a comprometerse con las actividades del programa. Así, los resultados observados en estos grupos de individuos, que no se han seleccionado de forma aleatoria, indicarían el impacto de este programa para ciertos individuos que están interesados en participar en el, pero no reflejarán cómo el programa afecta, en media, a la población objetivo. 4. Diseños de Evaluación Como ya se ha mencionado, el tipo de preguntas que trata de responder la evaluación1 de impacto son del tipo: "¿Cuál sería la situación si la intervención no hubiera tenido lugar?", “¿Las mejoras que se han producido en los individuos son el resultado directo del proyecto, o sencillamente es que se ha mejorado de todas formas?” “¿Eran los gastos justificados?”.

Figura 1: Impacto de una política

Como ya se ha mencionado, para resolver las preguntas anteriores y garantizar el rigor metodológico, una evaluación de impacto debe estimar un grupo de control (o contrafactual), es decir, lo que hubiera sucedido si el proyecto no se hubiera realizado. Vamos a ver esta afirmación desde un punto de vista gráfico. La figura 1 muestra este proceso. Inicialmente tenemos un individuo (o grupo de individuos) en t=0 con valor de la variable que queremos estudiar 0Y , posteriormente se produce una intervención pública mediante la implantación de un determinado programa, tras realizarse esta intervención se vuelve a obtener el valor de la variable 1 La evaluación de impactos se puede dividir en dos grandes grupos: Las técnicas cuantitativas que analizamos en este tema, y las técnicas de la evaluación cualitativa. Estos métodos se centran en ver como ven los beneficiarios de las medidas el proceso que se ha realizado mediante la realización de entrevistas, etc.

Page 9: Metodos de Evaluacion

9

de interés que tiene el individuo en el periodo t=1 que presenta un valor 1Y . Si sólo tenemos estos dos puntos (puntos negros de la figura) no sabemos si la variación en la variable “Y” a lo largo de este tiempo es debido a los efectos del programa o es debido a otros motivos. Por esta razón necesitamos una población de control (o contrafactual) que nos indique que valor presentan esos individuos en t=1 si la reforma no se hubiera realizado. Esta situación viene dada por el punto *

1Y , por lo tanto el impacto que tiene esta reforma viene dado por la diferencia de los valores en t=1. Determinar el grupo contrafactual (o de control) es un elemento fundamental en el diseño de la evaluación de una determinada política. Este grupo de control debe ser lo más parecido al grupo objetivo en todo lo posible, y que sólo se diferencie por el hecho de que sus miembros no participan en el programa que se quiere estudiar. Una estimación del impacto se obtiene sencillamente comparando los niveles de bienestar entre los grupos de control y el grupo objetivo (los que reciben la intervención). La determinación del grupo objetivo y grupo de control se puede realizar utilizando distintas metodologías que se dividen en tres grandes categorías, los diseños experimentales (aleatorios) y los diseños cuasi-experimentales (o diseños no aleatorios) y los diseños no experimentales. Ninguna técnica es perfecta y por lo tanto el evaluador debe tomar decisiones sobre las contraprestaciones e inconvenientes de cada uno de los métodos elegidos. Sin embargo, si la planificación se realiza con tiempo y de forma cuidadosa, es posible disponer de muchas más opciones metodológicas en el diseño de la evaluación. 4.1. Diseños experimentales – Ensayos aleatorizados Los diseños experimentales son los métodos más robustos de todas las metodologías de evaluación. Partiendo de la población (o de una muestra aleatoria de ésta), se realiza una asignación al azar de la pertenencia al grupo de beneficiarios y al grupo de control de los individuos objeto de estudio, generando dos grupos que son estadísticamente equivalentes entre sí. Este es un resultado de suma importancia, ya que, en teoría, el grupo de control generado a través de la asignación aleatoria servirá de contrafactual perfecto. La principal ventaja de esta técnica es la simplicidad en la interpretación de resultados. El impacto del programa sobre los resultados se puede medir como la diferencia entre las medias de las muestras del grupo de tratamiento y el grupo de control. La literatura recomienda realizar un procedimiento de dos etapas:

- En la primera etapa, partiendo de una población, se obtiene una muestra aleatoria de unidades que es representativa de dicha población.

- En la segunda etapa, la muestra anterior es asignada aleatoriamente a dos grupos: el de tratamiento y el de control.

La figura 2 muestra el proceso de muestreo. La primera etapa nos garantiza la validez externa, por lo que los resultados serán representativos de la población. La segunda etapa asegura la validez interna, ya que el impacto observado de la medida sobre la variable de interés se debe al tratamiento y no a otro factor.

Page 10: Metodos de Evaluacion

10

Figura 2: Muestreo bietápico

Aunque los diseños experimentales se consideran la opción óptima a la hora de evaluar el impacto de un determinado proyecto, en la práctica hay varios problemas, como son (1) problemas éticos, o restricciones políticas, (2) los individuos en los grupos de control pueden cambiar ciertas características de identificación durante el experimento que podría invalidar o contaminar los resultados, (3) puede ser difícil asegurar que la asignación de los individuos entre los grupos de tratamiento y control es verdaderamente al azar, (4) este tipo de estudios suele ser muy caro y consume mucho tiempo en determinadas situaciones, especialmente en la recopilación de nuevos datos. Además, se puede producir ciertas complicaciones potenciales desde un punto de vista estadístico, como son la deserción (no todos los participantes completaran el tratamiento), perdida de seguimiento ya que no se pueden localizar algunas unidades, que las observaciones cambien su comportamiento por el sencillo hecho de observarlas, o que las unidades de control traten de compensar con algún esfuerzo especial, la falta de tratamiento. Finalmente, hay que tener en cuenta el ya mencionado problema de sesgo de selección, que surge debido a la falta de datos sobre los factores comunes que afectan tanto a la participación y los resultados. En teoría, la evaluación aleatoria o experimental está libre del problema del sesgo2, mientras que este problema es prácticamente inevitable cuando se utilizan los datos no aleatorizados3. 4.2. Diseños cuasi-experimentales

2 El proceso de aleatorización asegura que antes de la intervención los grupos de tratamiento y control son estadísticamente equivalentes, en promedio, con respecto a todas las características, observadas y no observadas. Los experimentos aleatorios solucionan el problema de sesgo de selección mediante la generación de un grupo de control experimental de personas que podían participar en el programa pero que se les ha denegado (de forma aleatoria) la participación en el mismo. La asignación aleatoria no elimina el sesgo de selección, sino que equilibra la diferencia entre los grupos de participantes (tratamiento) y no participantes (control de), por lo que anula el problema de sesgo cuando se calcula (en media) el impacto de la medida. Entonces, las diferencias en media de los resultados de los dos grupos después de la intervención pueden ser atribuidas a la intervención. 3 En los estudios no aleatorios se utilizan técnicas econométricas para modelizar los procesos de participación.

Page 11: Metodos de Evaluacion

11

Estos métodos pueden ser utilizados para llevar a cabo una evaluación cuando no es posible construir los grupos de tratamiento y control de forma aleatoria. Estas técnicas permiten comparar grupos que se asemejan al grupo de tratamiento, al menos por lo que se refiere a las características observadas, a través de metodologías econométricas. La razón por la que se utilizan estas técnicas se debe a que los grupos de control y tratamiento son seleccionados después de la intervención utilizando métodos no aleatorios. Por lo tanto, es necesario aplicar controles estadísticos para construir un grupo de control que sea lo más similar posible al grupo de tratamiento. En algunos casos, el grupo de control también es elegido antes del tratamiento, pero lo más importante es que la selección de los individuos que lo componen no es aleatoria. La principal ventaja de los estudios no aleatorizados es que se pueden utilizar usando datos ya existentes y por lo tanto supone una aproximación más rápida y barata de implementar, y que se puede realizar después de que un programa ha sido realizado, siendo el único requisito necesario el poder disponer de una encuesta que tenga información tanto de los beneficiarios del programa como de los que no han recibido los beneficios. Las desventajas principales del enfoque cuasi-experimental son las siguientes: (a) la fiabilidad de los resultados es a menudo reducida porque la metodología estadística empleada es menos sólida, debido a la existencia de muchos factores que afectan a la robustez de los resultados obtenidos. (b) los métodos propuestos pueden ser bastante complejos, lo que implica que se necesita una considerable experiencia en el diseño de la evaluación y en el análisis e interpretación de los resultados. (c) Problema de sesgo de selección, ya explicado previamente. 4.3. Diseños no experimentales Existen características humanas (variables independientes) que no están sujetas a aleatorización, o si lo están no se usan por motivos éticos o políticos. Por ejemplo, queremos estudiar el grado de abandono estudiantil relacionado con el consumo de alcohol, en este caso la variable independiente es beber. Se seleccionan 500 estudiantes, donde el grupo experimental “deben beber” y en el de control no. En estas situaciones tenemos un diseño en el que el investigador observa un determinado fenómeno sin manipular las variables independientes del estudio. A pesar de sus limitaciones, este tipo de estudios es muy habitual en el campo de la educación. 5. METODOS DE ESTIMACION Los métodos de estimación dependen del tipo de diseño de evaluación que se ha realizado previamente. Diferentes diseños requieren diferentes métodos de estimación para calcular el bienestar de la situación hipotética o contrafactual. Las distintas categorías de métodos de cálculo son las siguientes 5.1 Diferencia de medias La comparación de las medias del grupo de control y el que se beneficia de la medida es un método de estimación del impacto especialmente válido en el caso de un diseño

Page 12: Metodos de Evaluacion

12

experimental. Una asignación aleatoria de la intervención entre los posibles beneficiarios elegibles crea grupos de tratamiento y de control comparables entre si. El impacto del programa sobre los resultados se puede medir por la diferencia entre ambos grupos. El estimador que evalúa el impacto de la política es ( ) ( )0ˆ1ˆˆ

01 =−== DYDYδ , que funciona correctamente en el caso de muestras grandes, porque los ensayos aleatorizados bietápicos aseguran que:

[ ] [ ]0)(1)( 11 === DYDY y [ ] [ ]0)(1)( 00 === DYDY 5.2. Método de variables instrumentales Este método de estimación es utilizado en diseños no experimentales y se emplea en el análisis estadístico para controlar el sesgo de selección debido a factores no observables. En este método de instrumentos, se usan una o más variables que afectan a la participación, pero no a los resultados dada la participación. Esto identifica la variación exógena en los resultados atribuibles al programa, reconociendo, por ejemplo, que la colocación de un individuo en el grupo de participantes o no participantes no puede ser debido al azar, sino que se ha realizado de manera intencionada. Para comparar los resultados de individuos que eligen participar con aquellos que no participan, un modelo sencillo puede ser:

εβββ +++= XDY 210 (5)

Donde D = 1 si el individuo esta incorporado al programa

D = 0 si el individuo no esta incorporado al programa x = regresores exógenos observables (controles)

El impacto de la medida que estamos buscando se encuentra en 1β , el valor de la estimación de este parámetro nos indica si el tratamiento es efectivo o no (significatividad) y el grado en que el tratamiento afecta a la variable dependiente. Sin embargo, en general los estimadores que se obtienen no presentan buenas propiedades, por lo que cualquier tipo de inferencia realizada a partir de estos resultados es errónea. Los motivos por los que los estimadores no funcionan bien son 2:

- La existencia de variables que no observamos pero que influyen en los resultados (probema conocido como “el error de especificación de omisión de variables relevantes”).

- La participación en el programa es endógena. 5.2.1. Problema de omisión de variables relevantes

Page 13: Metodos de Evaluacion

13

El investigador puede controlar los experimentos que realiza por muchas características observadas, pero aún faltan factores de gran importancia en el análisis que son complicados o imposibles de medir, como:

- Distinto grado de motivación. - Habilidad diferente. - Información asimétrica. - Coste de oportunidad de participar distinto.

De tal modo que el modelo estimado es

εβββ +++= XDY 210 (6) Mientras que el modelo verdadero es:

ξαααα ++++= ZXDY 4210 (7) Donde Z es un vector que contiene todas las variables que no han sido observadas por el investigador. Dado que calculamos (6) en lugar de (7), los estimadores que vamos a obtener son sesgados y con malas propiedades estadísticas. 5.2.2. Problema de participación endógena En este caso el modelo completo que explica el comportamiento de los individuos viene dado por un sistema de dos ecuaciones, en el que la 2ª de ellas nos ofrece la decisión de participar o no en el programa

εβββ +++= XDY 210 (8) vXZD +++= 321 πππ (9)

Sustituyendo (9) en (8) tenemos

( )=++++++=

=++++++=vZXX

XvXZY

121312110

232110

βεπβπββπββεβπππββ

ξααα +++= ZX 321 Definiendo ξβεαπβαπββαπββ =+==+=+ v132123121110 ,,, , y comparando esta última expresión con (8) observamos que tenemos dos ecuaciones completamente distintas. 5.2.3. Estimación del problema de omisión de variable y endogeneidad En los dos casos previamente descritos nos falta observar el vector de variables “Z” para poder estimar correctamente el modelo. Para estimar los modelos anteriores tenemos diferentes opciones. 5.2.3.1 Estimación por Mínimos Cuadrados La primera alternativa es la estimación directa de la ecuación (6) (o equivalentemente de la ecuación (8)) y obtener el efecto de tratamiento con 1β mediante mínimos cuadrados. El problema se presenta si D está correlacionado con Z, y no incluimos el

Page 14: Metodos de Evaluacion

14

vector Z en la ecuación. Entonces el parámetro asociado a la variable D va capturar parte del efecto de Z (la parte de Z que esta relacionada con D). Como nuestro estimador del efecto de tratamiento 1β , obtenido por mínimos cuadrados, está capturando el efecto de otras características (Z) que explican el tratamiento, resulta que )(1

ˆMCβ es un estimador sesgado del efecto del tratamiento. La

razón de este resultado es que hemos violado uno de los supuestos claves de MCO: independencia de los regresores x del término de error ε ( E(X,ε ) ≠ 0), por lo tanto: E( 11 )ˆ ββ ≠ (estimador sesgado). La solución a este problema se centra en tratar de limpiar la correlación entre D y ε, es decir, aislar la variación en D que no está correlacionada con ε, a través de Z. Para lograrlo es necesario utilizar variables instrumentales. 5.2.3.2. Estimación por Variables instrumentales En la teoría econométrica existen múltiples situaciones en las que es necesario utilizar el enfoque de variables instrumentales:

- Influencia simultánea de dos (o mas) variables,

1113212111 εβββ +++= XYY

2223122212 εβββ +++= XYY

En el que 1Y influye en 2Y y viceversa. - Omisión de variables relevantes, como ya hemos visto previamente,

en la que tenemos un sesgo en las estimaciones. - Error de medición en variables, ya que el vector de variables X de la

ecuación (6) no se puede medir con precisión. Estos tres problemas que el enfoque clásico de mínimos cuadrados no es capaz de resolver, es posible solucionarlos con la utilización de variables instrumentales. La Idea básica que se esconde detrás del enfoque de las variables instrumentales es lograr una variable (o vector de variables) “M” que verifiquen las siguientes condiciones:

- Que este altamente correlacionada con la variable que queremos instrumentar (en nuestro caso la variable D), es decir corr (M , D) ≠ 0.

- Ausencia de correlación con el término de error de la ecuación de regresión (6) o de (8) : corr (M , ε) = 0.

Así que la forma de estimar modelos con problemas de omisión de variables o endogeneidad es mediante Mínimos Cuadrados en Dos Etapas (2SLS). Consideramos el sistema de ecuaciones dado en (8) y (9). Este método consiste en la realización de las siguientes etapas Etapa1 : Estimar la ecuación (9), y con la estimación de los parámetros

321 ˆ,ˆ,ˆ πππ ,obtener el valor predicho de D

XZD 321 ˆˆˆˆ πππ ++= . (10)

Page 15: Metodos de Evaluacion

15

Entonces D̂ es la variable instrumental de D , porque verifica las dos condiciones indicadas anteriormente:

- Existe una alta correlación entre D̂ y D, y además - Como Z, X no está correlacionada con ε , entonces D̂ tampoco lo

esta, así que 0),ˆ( =εDcor . Etapa 2: Sustituir D̂ en lugar de D en la ecuación (8) y estimar la ecuación

εβββ +++= XDY 210ˆ . (11)

Se puede demostrar que los estimadores que se obtienen ahora son insesgados y consistentes, por lo tanto: E( 11 )ˆ ββ = . 5.3. Método de dobles diferencias (o dif en dif) El método de dobles diferencias compara el grupo de tratamiento frente al grupo de control (primera diferencia) antes y después de la intervención (segunda diferencia). Este método se aplica sobretodo a diseños cuasi-experimentales y requiere información tanto del grupo de control como el de tratamiento en, al menos, dos periodos de tiempo (antes y después de la intervención). Inicialmente se obtiene información de las variables de interés – también llamados indicadores - tanto para un grupo de control (punto A en la figura 3) como tratamiento (punto C en figura 3) antes de la intervención, lo que consideramos el estudio de referencia. A continuación se realiza un seguimiento a las mismas unidades de la muestra después de la intervención (en la figura 3 son el punto B para el grupo de control y el D para el de tratamiento). Una vez que se dispone de toda la información, se calcula la diferencia de los valores medios de las variables de interés entre el "después" y "antes" para cada uno de los grupos de tratamiento y de control. Finalmente se obtiene la diferencia entre estas dos diferencias de medias. La segunda diferencia (es decir, la diferencia en la diferencia) es la estimación del impacto del programa.

Figura 3: Diferencias en diferencias.

Page 16: Metodos de Evaluacion

16

Existe otra alternativa para motivar la utilización esta técnica, que consiste en iniciar nuestro análisis en la Figura 1. Si los grupos de control y tratamiento no se han obtenido de forma aleatoria entonces tenemos un sesgo de selección. Así que si se calcula la diferencia se obtiene un estimador sesgado del impacto del tratamiento, ya que el resultado incorpora diferencias de composición entre los dos grupos. Si el sesgo se mantiene constante a lo largo del tiempo la forma evitarlo consiste en estimar las diferencias entre los grupos de control y tratamiento de sus diferencias temporales. El supuesto fundamental de este método es que el sesgo se mantenga constante. Si ocurre una situación como la dada en la figura 4 los resultados obtenidos no serian correctos.

Figura 4: diferentes pendientes en dif en dif

Volviendo sobre la información disponible en esta evaluación, el cuadro 1 ofrece de forma sintética los datos que tiene el evaluador dependiendo del momento de tiempo en que se encuentra y el grupo analizado.

Cuadro 1: Diferencias en diferencias

La evaluación del impacto de la medida se obtiene calculando:

Page 17: Metodos de Evaluacion

17

( ) ( )[ ] ( ) ( )[ ]0011 0101 =−=−=−== DYDYDYDYDD (12)

La representación econométrica que evalua el impacto se establece mediante una ecuación de regresión y con dos años de datos: antes (t=0) y después (t=1). La especificación es

εβα +=+= )1(tIYit , donde (.)I es una función que toma el valor 1 si se verifica el argumento que está dentro del paréntesis y cero en caso contrario. Entonces el estimador de mínimos cuadrados viene dado por:

( ) ( )01ˆ =−== tYtYβ . La pregunta que nos tenemos que realizar es si existen cambios entre t=0 y t=1. De la forma en que lo hemos planteado necesitamos mas información para valorar si la política ha sido efectiva o no. Vamos a considerar dos grupos (control y tratamiento) y dos periodos de tiempo, y teniendo presente la información dada en el Cuadro1, se puede plantear la siguiente función de regresión

εδγβα +==+=+=+= )1()1()1()1(1 DItIDItIYit , (13) donde las únicas variables explicativas son ficticias del tipo4:

(Pertenencia a los grupos) ⎩⎨⎧

=control de grupo al pertenece si 0

to tratamiende grupo al pertenece si 1D

(Periodo de tiempo) ⎩⎨⎧

=onintervenci la a previo es periodo el si 0

onintervenci la aposterior es periodo el si 1t

Ahora es necesario calcular la esperanza de la variable endógena condicionada a las variables explicativas, para obtener los distintos valores de la ecuación (12). El primero de los valores de esta expresión es

( ) δγβαδγβα +++=××+×+×+== 111111 ii DYE , y de forma similar se obtienen el resto de esperanzas condicionadas

( ) γα +== 10 ii DYE

( ) βα +== 01 ii DYE

( ) α== 00 ii DYE . Sustituyendo el valor de estas 4 expresiones en la ecuación (12) se obtiene:

4 para evitar el problema de la trampa de las variables ficticias ha sido necesario eliminar el resto de alternativas.

Page 18: Metodos de Evaluacion

18

{( ) ( )[ ] ( ) ( )[ ] [ ] [ ] δβδβ =−+==−=−=−== 0011 0101 DYDYDYDYDD Por lo tanto, cuando estimamos la ecuación (13) el valor del parámetro δ nos indicara si la intervención ha tenido efecto o no (significatividad estadística del estimador del parámetro), y en que cuantía la medida afecta al valor de la variable dependiente. 5.3.1. Caso de más de dos periodos y grupos: Datos de panel En este caso utilizamos una regresión con efectos fijos de tiempo y grupo:

∑∑==

++=+=+=I

iititi

T

rttit DiIrtIY

1)1()( εδγβα (14)

Donde itD representa la intensidad del tratamiento D en el grupo i en el periodo t. La identificación se consigue de la variación inter-temporal dentro de los grupos. Es decir: cambios de Y en el tiempo, que son específicos para el grupo de ‘tratamiento’ (por los saltos de tendencia específicos a los grupos afectados en el momento que ocurre el tratamiento). La ecuación (14) se estima mediante datos de panel con efectos fijos de tiempo y grupo, teniendo presente que este tipo de modelo de efectos fijos es valido cuando el efecto de la reforma es inmediato. Si las respuestas tardan mas de un periodo, tenemos que utilizar variables de tratamiento con retardos ( jtiY −, ). Como los efectos fijos implican cambios comunes a los grupos en el tiempo (tendencias comunes) entonces los cambios en la tendencia entre los grupos de tratamiento y control es debido a la intervención. Finalmente, es importante destacar que si hay otras variables que influyen en la diferencia de la tendencia entre los dos grupos, entonces las estimaciones estarán sesgadas. 5.4. Regresiones en discontinuidad Recordemos que el objetivo principal de la evaluación cuantitativa es estimar el efecto del tratamiento de una intervención sobre una variable Y (que puede indicar el nivel de bienestar). La característica fundamental de esta técnica de discontinuidad es que se utiliza cuando los beneficiarios/no-beneficiarios pueden ser ordenados a lo largo de una dimensión cuantificable, que se emplea para computar un índice o parámetro claramente definido. El investigador decide un valor determinado de este índice que determina el corte para realizar la elegibilidad de los individuos y se utiliza el índice de cada unidad para asignarla al grupo de tratamiento o control en función de si el valor de su índice es mayor o menor que el valor de corte decidido, por lo que las unidades justo encima del corte son muy parecidas a las unidades justo debajo del corte, así que lo que se hace es comparar los resultados del grupo de unidades que están por arriba y debajo del corte. Vamos a considerar un ejemplo aclaratorio: Se desea estudiar el efecto de transferencias monetarias sobre el consumo, siendo el objetivo de la intervención el focalizar las transferencias en los hogares más pobres. El método que vamos a emplear para evaluar esta política es inicialmente construir un índice de pobreza, que toma valores de 1 a 100, calculado usando las características de los individuos antes

Page 19: Metodos de Evaluacion

19

de la intervención y establecer un valor que determina que hogares son pobres y cuales no:

- Hogares con un valor del índice <=50 son pobres. - Hogares con un valor del índice >50 no son pobres.

Una vez que se ha determinado que hogares son pobres, se les realiza una transferencia monetaria. La evaluación consiste en analizar los resultados (p.ej. consumo, tasa de asistencia a la escuela) antes y después de las transferencias, comparando los hogares que estan justo debajo y encima del valor 50 del índice de pobreza. La figura 5 refleja la situación de partida en la que (sin que se hayan producido las transferencias) se utiliza el valor “50” del índice de pobreza para determinar las familias que se consideran pobres o no.

Figura 5: situación antes de la intervención

La figura 6 muestra la situación de la misma muestra de familias después de recibir las transferencias del gobierno.

Figura 6: Situación después de la intervención

Se observa que la medida ha sido muy efectiva ya que lo que ha provocado es una elevación del bienestar de los hogares con menor renta. Observando las figuras A y B

Page 20: Metodos de Evaluacion

20

se ve que la intervención ha producido una discontinuidad considerable en el valor del índice de pobreza igual a 50 (hecho que no ocurría antes de la aplicación de la medida). Desde un punto de vista econométrico, la evaluación de si la medida ha sido efectiva viene dada por εβββ +++= IndiceDY ii 210 , (15) donde “índice” es el valor entre 1 a 100 que presenta esa familia y

⎩⎨⎧

=ncias transfererecibe nohogar el si 0

cias trasferenrecibehogar el si 1D

Y la regla para determinar que familia es pobre (D=1) o no es:

500501

>⇔=≤⇔=

IndiceDIndiceD

i

i

La característica principal de este tipo de técnica es que el propio método de discontinuidad determina el tratamiento. Ventajas de RD para la Evaluación de políticas Los puntos positivos de este tipo de regresión son: - Nos ofrece una estimación insesgada del efecto del tratamiento en la discontinuidad - Muchas veces, el tener una regla conocida para determinar que individuos pertenecen al grupo de beneficiarios y cuales al de control supone una ventaja. Este tipo de reglas son comunes en el diseño de la política social (una definición de pobreza es aquella situación en la que un individuo tiene una renta inferior al 60% de la mediana o media de la distribución de ingresos de la población de referencia). Desventajas de RD para la evaluación de políticas Las principales desventajas de aplicar esta técnica son: - Estimación local: Los efectos del tratamiento alrededor del corte del índice no siempre son generalizables.

- Potencia: El efecto es estimado en la discontinuidad, así generalmente tenemos menos observaciones que en un experimento aleatorio para un mismo tamaño de muestra. - La especificación puede ser sensible a la forma funcional: Tenemos que modelar correctamente la relación entre la variable de asignación y la variable de resultado.

- Relaciones no lineales. - Interacciones.

5.5 Métodos de apareamiento (matching)

Page 21: Metodos de Evaluacion

21

Ya se ha visto que el principal problema de los estudios observacionales es que la selección de los individuos que van a ser sometidos al tratamiento no es aleatoria. Por tanto, los individuos tratados y no tratados pueden diferir en otras características, diferentes de la asignación o no al tratamiento. Si no se tienen en cuenta dichas características, se podría estar atribuyendo de forma espúrea al tratamiento un efecto sobre la variable de interés que realmente es debido a la influencia de otras características. Por tanto, para poder obtener efectos causales es necesario controlar por las diferencias entre individuos tratados y no tratados. El objetivo de la técnica del matching es el de emparejar cada participante con aquellos no participantes similares a él, así que es como si construyéramos un experimento aleatorio con datos no experimentales. Decimos que hay selección debido a las características observables si existe un vector de variables x tal que el tratamiento, condicionado en dichas variables, es independiente de los resultados potenciales. Las únicas diferencias, bajo este supuesto, se deben al tratamiento. En este caso, de forma análoga a lo que ocurría en el caso de un experimento aleatorio (supuesto la asignación aleatoria del tratamiento) los resultados son independientes del tratamiento ( DYY ⊥01 , ), así que no importa que no podamos observar el contrafactual:

[ ] [ ] [ ] [ ])()(1)(0)( 1000 iiiiiiiiii uYEuYEDuYEDuYE ===== Entonces el efecto promedio del tratamiento en los tratados es

[ ] [ ] [ ] ==−===−=44 344 2144 344 21

muestraenmedirpuedeseno

iii

muestraenobserpuedese

iiiiiii DuYEDuYEDuYuYE_____

0

_var___

101 1)(1)(1)()(δ

[ ] [ ]44 344 21

muestraenmedirpuedese

iiiiii DuYEDuYE____

01 0)(1)( =−== ,

Por lo que la aleatorización asegura que el sesgo es cero

[ ] [ ] 00)(1)( 00 ==−= iiiiii DuYEDuYE . Pero ¿que ocurre si la aleatorización no es factible y se realiza en función de un conjunto de variables observadas.? En esta situación es cuando se utiliza la técnica de apareamiento: son técnicas para construir grupos de comparación cuando la asignación al tratamiento no es aleatoria pero se hace de acuerdo a las variables observadas. Por lo tanto, el grupo de comparación debe ser lo mas similar posible al grupo de tratamiento en términos de los elementos observables antes de que el tratamiento se desarrolle (suponiendo que no existen diferencias en las variables no observadas). La clave está en que si se cumple la identidad: DYY ⊥01 , , entonces la asignación al tratamiento esta identificada correctamente dadas las variables pre-tratamiento de X. Esta identificación implica que: (a) dentro de cada celda de observaciones definida por X la asignación al tratamiento es aleatoria, y (b) la asignación al tratamiento depende solamente de las variables observadas X. Aceptando la identificación anterior tenemos:

[ ] [ ] [ ] [ ]XuYEXuYEXDuYEXDuYE iiiiiiiiii )()(,1)(,0)( 1000 ===== .

Page 22: Metodos de Evaluacion

22

Ahora, para cada celda que representa unos determinados valores de X, podemos definir “el efecto promedio del tratamiento en los tratados de la celda definida por el valor X” como:

[ ] [ ] [ ] ==−===−=444 3444 21444 3444 21muestraenmedirpuedeseno

iii

muestraenmedirpuedese

iiiiiiix XDuYEXDuYEXDuYuYE_____

0

____

101 ,1)(,1)(,1)()(δ

[ ] [ ]

444 3444 21muestraenmedirpuedese

iiiiii XDuYEXDuYE____

01 ,0)(,1)( =−== .

Pero xδ y δ no miden lo mismo, ¿Qué relación existe entre ambos?

[ ] ( )[ ] ( )[ ] [ ]xxiixixiiii EXDEEXDEEDE δδ ==Δ==Δ==Δ= ,1,11 . Entonces, para estimar el efecto promedio del tratamiento en los tratados (δ ) las etapas que hay que realizar son:

- Estratificar los datos dentro de cada celda definida para cada valor de X.

- Dentro de cada celda (es decir, condicionado en X) calcular la diferencia en la variable de resultado promedio entre el grupo de tratamiento y el de control.

- Obtener el promedio de estas diferencias con respecto a la distribución de X, en la población de las unidades tratadas.

Por ejemplo, si la selección para un programa de formación se hace únicamente de acuerdo a la edad de los participantes, compararíamos los ingresos de los participantes con los no participantes dentro de cada grupo de edad. Problemas de la técnica de apareamiento. Este método no funciona correctamente cuando nos encontramos en alguna de las siguientes situaciones:

- X es continua. - La muestra es pequeña. - El vector de variables explicativas es muy grande.

En estas situaciones la bondad de la estimación se complica bastante. Como este método consiste en emparejar el resultado de cada individuo tratado con el resultado de un individuo no tratado que tenga valores de la variable X cercanos a los valores que dicha variable toma para el individuo sometido al tratamiento nos enfrentamos a una situación de ausencia de soporte común en las variables explicativas, es decir: celdas que contienen solo tratamientos o celdas que contienen solo controles. Es lo que se conoce como el problema de la maldición de la dimensionalidad. La solución de este problema es reducir la dimensionalidad del vector de variables explicativas utilizado en el estudio, pasando de un apareamiento multidimensional a un apareamiento unidimensional. Es lo que se conoce como “Propensity Score Matching”.

Page 23: Metodos de Evaluacion

23

5.5.1. Propensity Score Matching Como ya hemos mencionado, el método del propensity score trata de reducir la dimensionalidad de las variables contenidas en X a una única dimensión. El propensity score se define como la probabilidad de recibir tratamiento condicionada a unas variables observadas X antes del tratamiento: )()1()( XDEXDpXp X=== . (16) De esta expresión se deducen dos implicaciones:

- Si p(X) es el propensity score, las variables observadas X antes del tratamiento están equilibradas entre los beneficiarios de la medida y los no beneficiarios.

P(X) es propensity score )(XpXD ⊥⇒

- Suponiendo que existe independencia entre el resultado y la asignación el tratamiento, condicionado en X, entonces también existe independencia condicionada en p(X)

)(,, 0101 XpDYYXDYY ⊥⇒⊥ Para un valor determinado del propensity score, la asignación al tratamiento es aleatoria, por eso, en promedio, los tratamientos y los controles son idénticos usando las observaciones que tenemos. Ahora podemos aparear a los individuos del grupo de tratamiento y de control en función del propensity score p(X) en vez de X.

[ ] [ ] [ ] [ ]XpuYEXuYEXpDuYEXpDuYE iiiiiiiiii ()()()(,1)()(,0)( 1000 ===== . Para cada celda dada por el valor p(X), definimos “el efecto promedio del tratamiento en los tratados en la celda definida por p(X)” como:

[ ] [ ] [ ]==−===−=4444 34444 21

muestraenmedirpuedeseno

iiiiiiiiiixp XpDuYEXpDuYEXpDuYuYE_____

0101)( )(,1)()(,1)()(,1)()(δ

[ ] [ ]

4444 34444 21muestraenmedirpuedese

iiiiii XpDuYEXpDuYE____

01 )(,0)()(,1)( =−== .

Como en el caso anterior, se puede ver la relación entre δ y )(xpδ como:

[ ] ( )[ ] ( )[ ] [ ])()()()( )(,1)(,11 xpxpiixpixpiiii EXpDEEXpDEEDE δδ ==Δ==Δ==Δ= , Así que el efecto del tratamiento promedio es el efecto promedio de tratamientos en los tratados en la celda definida por p(X). 5.5.1.1. Cálculo del propensity Score Para obtener el efecto del tratamiento mediante este método es necesario realizar dos etapas:

Page 24: Metodos de Evaluacion

24

1ª Etapa: Estimar el propensity score, que caracteriza la probabilidad de participar en el programa. Para estimar el propensity score se pueden utilizar los modelos probabilísticos como la especificación logit:

( )

)exp(1exp

)(i

iii X

XXDp

γγ

+= , (17)

Para que se pueda aplicar correctamente esta técnica es fundamental que la distribución de dichas variables sea la misma (o muy similar) tanto para los individuos tratados como para los no tratados. El procedimiento de estimación en esta etapa se divide en los siguientes apartados:

1. Se estima una especificación funcional para las variables como la dada en la ecuación (17).

2. Se dividen los valores ajustados del propensity score en estratos, 3. Se contrasta si existen diferencias entre los grupos de tratamiento y de

control dentro de cada estrato mediante contrastes de igualdad de distribuciones. 4. En caso de no existir diferencias significativas, se acepta la especificación. 5. De lo contrario, se añaden potencias de orden superior en las variables e

interacciones entre éstas hasta que no se rechaza que las distribuciones entre ambos grupos son iguales.

6. Una vez determinada la especificación, las observaciones se ordenan en forma ascendente de acuerdo con el valor estimado del propensity score, descartándose aquellas observaciones de no tratados con valores estimados del propensity score estimado demasiado extremos. 2ª Etapa: Se realizará el matching en función de los valores del propensity score y se estima el efecto promedio del tratamiento dado el propensity score. Con las observaciones que quedan tras realizar la primera etapa, se procede a emparejar (con o sin reemplazamiento) a cada individuo tratado con aquel individuo no tratado cuyo valor estimado del propensity score esté más próximo, descartándose las observaciones de no tratados que queden sin emparejar. Este punto es fundamental, porque restringir las muestras asegura un soporte común, lo que va a evitar una de las fuentes mas habituales de sesgo de selección.

Figura 7: soporte común de participantes en programa y no

Page 25: Metodos de Evaluacion

25

Como se observa en la figura nos tenemos que centrar solo en aquellos valores de p(x) que son comunes en ambas distribuciones. Finalmente, se comparan los indicadores de resultados. La diferencia es la ganancia debida al programa para dicha observación y, finalmente, se calcula la media de estas ganancias individuales para obtener el promedio de la ganancia general.