Sunteți pe pagina 1din 24

TRABAJO PROPENSITY SCORE MATCHING (PSM)

JEAN CARLOS MONTERROSA CARDONA

UNIVERSIDAD DEL ATLANTICO


PUERTO COLOMBIA
2019
1. ESTIMAR PROBABILIDAD DE PARTICIPACION Y PROBABILIDAD DE
PARTICIPACION PREDICHA

En el primer modelo estimado, y, atendiendo las recomendaciones de la PSM para escoger


las variables más acordes para la estimación (no varíen en el tiempo e influyan en lo que
queremos evaluar), observamos que, la variable experiencia laboral, sexo y propiedad de
medio de transporte resultan ser no significativas, por tanto procederemos a, en caso de la
experiencia laboral, al ser una variable que, la teoría nos dice que tiene influencia en
básicamente todo lo relacionado al campo laboral y por tanto teóricamente debería ser
significativa, la usaremos elevada al cuadrado, y, en el caso de las variables sexo y
propiedad de vehículo procedo a cambiarlas por otras variables.
En nuestra segunda estimación hemos obtenido a la experiencia laboral cuadrada como
significativa, la variable soltera carece de significancia estadística por lo que procedemos a
eliminarla y conservaremos edad.
Luego de múltiples combinaciones, tenemos que, las variables estadísticamente
significativas (P<0,10) que, podemos usar debido a que maximizan las probabilidades de
obtener un empleo formal son: nivel educativo, experiencia laboral medida en meses al
cuadrado y la edad.
Precedemos a predecir las probabilidades:

Histograma pscore
0 1

6
4
Density
2
0

0 .2 .4 .6 0 .2 .4 .6
Pr(D)
Graphs by D

En este histograma observamos visualmente las densidades de distribución de las


probabilidades de participación yendo de aproximadamente 0.01 a 0,58 para control y de
aproximadamente 0,03 a 0,59 a tratados.
15
D e n s ity
5 10
0

0 .2 .4 .6
Pr(d)

Density
kdensity pscore

Histograma de probabilidades para los tratados.


Kernel density estimate

4
3
Density
2 1
0

0 .2 .4 .6
Pr(d)
kernel = epanechnikov, bandwidth = 0.0379

Probabilidades tratados estimada por método kernel epanechikov


6
D e n s ity
2
0 4

0 .2 .4 .6
Pr(d)

Density
kdensity pscore

Histograma de probabilidades para control


Kernel density estimate
3
2
D e n s ity
1
0

0 .2 .4 .6
Pr(d)
kernel = epanechnikov, bandwidth = 0.0373

Probabilidaes control estimada por método kernel epanechikov

Propensity Score
4
3
Densidad
2 1
0

0 .2 .4 .6
Probabilidad de ser tratado

Participante=1 No participante=0
En definitiva lo que hemos hecho en este apartado ha sido estimar una serie de
probabilidades para cada individuo tanto tratado como de control, con las cuales, luego de
un proceso de inspección visual procederemos a fijar un las condiciones de
emparejamiento.
2. SOPORTE COMUN

Dada la inspección visual tenemos que, aproximadamente por debajo de 0,01 de


probabilidad no hay un “clon” lo suficientemente igual al tratado, mientras que, por otro
lado, por encima de aproximadamente 0,6 tampoco hay un clon en el grupo de control lo
suficientemente parecido al tratado.
El otro método consiste en hacer uso de los mínimos y máximos de las probabilidades para
tener un intervalo de emparejamiento.

En el caso de los no tratados o grupo de control tenemos una probabilidad mínima de


0.0242 y una probabilidad máxima de 0.5730 con 296 observaciones
Para los tratados tenemos una probabilidad mínima de 0,066 y una probabilidad máxima de
0,5594 con 104 observaciones

Esto quiere decir que, no serán tenidas en cuenta probabilidades del grupo de tratamiento
que superen la máxima probabilidad del grupo de control 0,5730.
Ni probabilidades del grupo de control inferiores a la mínima probabilidad del grupo de
tratamiento 0,066.
Dando como resultado que se excluirán 12 observaciones para el emparejamiento.
GRAFICAMENTE:

0 1
4
3
Density
2
1
0

0 .2 .4 .6 0 .2 .4 .6
pscore_sc
Graphs by D

Corresponde a la distribución de las probabilidades del soporte común.


15
10
D e nsity
5
0

0 .2 .4 .6
pscore_sc

Density
kdensity pscore_sc

Distribución de probabilidad del soporte común para tratados.


(bin=100, start=.06681113, width=.00492662)

Kernel density estimate


4
3
D e n s ity
2 1
0

0 .2 .4 .6
pscore_sc
kernel = epanechnikov, bandwidth = 0.0383

Distribución de probabilidades del soporte común para tratados usando estimación de


kernel epanechikov.
8
6
Density
4 2
0

.1 .2 .3 .4 .5 .6
pscore_sc

Density
kdensity pscore_sc

Distribución de probabilidad del soporte común para control.

Kernel density estimate


3 2
D e ns ity
1
0

0 .2 .4 .6
pscore_sc
kernel = epanechnikov, bandwidth = 0.0358

Distribución de probabilidades del soporte común para control usando estimación de kernel
epanechikov.
Propensity Score con Soporte Com
4
3
Densidad
2
1
0

0 .2 .4 .6
Probabilidad de ser tratado

Participante=1 No participante=0

3. CALIDAD DEL EMPAREJAMIENTO.


En este apartado analizaremos los diferentes métodos de emparejamiento, buscando no el
mejor, pues, todos aplican metodologías de trade-off dispares para obtener un sesgo,
varianzas e impacto, sin embargo, probamos todos los métodos buscando que, todos
converjan a un valor, podemos decir que si las siguientes estimaciones se mantienen en un
margen muy cercano, seremos indiferentes de cual modelo escoger, pues ya tendremos la
certeza de que se está midiendo el impacto correctamente.
Sobre este método podemos decir que, utiliza submuestras de nuestra muestra para evaluar
el impacto desde cada variable individualmente, al final, mediante la repetición de test,
pondera sus resultados dándonos como resultados el impacto.
Vecinos:
Estimaremos con 1 y 3 vecinos
Estimación 1 vecino:

Esta estimación consiste en tomar del grupo de control la probabilidad más cercana a cada
individuo que se encuentre en el grupo de tratamiento, los resultados obtenidos con cada
individuo de tratamiento y su vecino de control se computa la diferencia entre la variable de
resultado de los individuos de tratamiento y la variable de resultado de los individuos de
control y obtenemos el impacto, en este caso con 1 vecino, tenemos un impacto de 0,105
con unos errores estándar de 0,086
Estimación 3 vecinos:

Esta estimación consiste en tomar del grupo de control 3 de la probabilidades más cercana a
cada individuo que se encuentre en el grupo de tratamiento, los resultados obtenidos con
cada individuo de tratamiento y su vecino de control se computa la diferencia entre la
variable de resultado de los individuos de tratamiento y la variable de resultado de los
individuos de control y obtenemos el impacto, en este caso con 3 vecino, tenemos un
impacto de 0,128 con unos errores estándar de 0,069
Soporte común con trimming 10 para 1 vecino:

En este método de restricción de muestra, para un vecino, pero además estableciendo


cuanto de nuestra muestra estamos dispuesto a sacrificar (en este caso 10%) para obtener
unos datos aún más ajustados, los resultados que hemos obtenido bajo este método son, un
impacto de 0,1063 y unos errores estándar de 0,0870

Emparejamiento de distancia máxima, soporte común radius caliper (0.001)


Bajo este método de emparejamiento, lo que se busca es emparejar la probabilidad de cada
sujeto del tratamiento con una del control a una distancia fija establecida por el
investigador, en nuestro estudio hemos establecido un radio de 0,001 tanto a la derecha
como a la izquierda, obteniendo los siguientes resultados, un impacto estimado de 0,132
con unos errores estándar de 0,086
Hay que cuidar el número de vecinos que se incluyen, pues a medida que se aumenten
provocará que emparejemos con clones cada vez menos similares, provocando sesgo.

Emparejamiento de distancia máxima, soporte común con radius caliper trimming


Bajo este método de emparejamiento tenemos 2 criterios de emparejamiento, un radio de
0,001 y la disposición a perder 20% del total nuestra muestra para ajustar los
emparejamientos, teniendo los siguientes resultados, un impacto de 0,147 y unos errores
estándar de 0,089

Emparejamiento por kernel soporte común


Mediante el método de emparejamiento kernel el cual en su estimación de emparejamiento
lo que hace es emparejar a cada tratado con todos los individuos del grupo de control,
dándole más peso al que se encuentre mas cercado y menos peso al que se encuentre más
lejano, ponderando así el impacto, bajo nuestra estimación hemos obtenido un impacto de
0,939

Buscando calcular los errores estándar y el intervalo de confianza de nuestro método con
kernel, hemos obtenido unos errores estándar de 0,064 y un intervalo de confianza de
-0,324 a 0.220
Emparejamiento por kernel soporte común y trimming

Mediante el método de emparejamiento kernel el cual en su estimación de emparejamiento


lo que hace es emparejar a cada tratado con todos los individuos del grupo de control,
dándole más peso al que se encuentre más cercado y menos peso al que se encuentre más
lejano, ponderando así el impacto, bajo nuestra estimación hemos obtenido un impacto de
0,1284

Tenemos por último que, mediante el bootstrapping que lo que haces es hacer repeticiones
en base a unas submuestras de nuestras observaciones, resultando en que, luego de 50
repeticiones, nuestro método de emparejamiento ha obtenido unos errores estándar de 0,060
y unos intervalos de confianza de 0.104756 a 0.2464561.
Como conclusión tenemos:

El psm es un modelo de oportunismo que, trabaja bajo el supuesto de que todo lo que
influye en la participación o no de un programa depende de variables observadas que
pueden medirse y por ende estimarse, en base a ello, contamos con una serie de métodos de
emparejamiento que, nos permiten contar con la consistencia deseada dada las variables
trabajadas.
Es un modelo que en sus estimaciones se basa en un trade-off entre varianza y sesgo para
estimar, está a consideración de investigador cuanto sesgo y varianza está dispuesto a
tolerar en su modelo.
En nuestros modelos estimados observamos unos impactos de: 0,105-0,128-0,106-0,132-
0,147-0,939-0,128, teniendo que, bajo alta exigencia podríamos tratar de ajustar nuestras
variables para obtener unos estimativos más convergentes, pero, bajo una exigencia
moderada o académica, se considera que las diferencias entre los impactos estimado
permite ser indiferente respecto a que método de emparejamiento escoger, mientras que,
respecto al impacto del servicio publico de empleo en la posibilidad de obtener uno, este
aumenta la posibilidad entre un 9,3% y un 14,7%

Evaluacion de impactos:

Método de emparejamiento Impacto B


Vecino (1) más cercano 0,105 0,298
Vecinos (5) más cercanos 0,128 0,194
Vecinos (1) con trimming (10) 0,106 0,220
Distancia máxima (0,001) 0,132 0,113
Distancia máxima (0,001) con 0,147 0,148
trimming (20)
Kernel 0,939 0,145
Kernel con trimming (20) 0,128** 0,033

*p<0.10 **p<0.05 ***p<0.01

S-ar putea să vă placă și