Sunteți pe pagina 1din 9

Modelo Bivariado

El problema que se quiere investigar con este modelo bivariado es la probabilidad


condicional de que un individuo obtenga un puntaje por encima del promedio en el rea de
matemticas, dado que ha obtenido un puntaje por encima del promedio en ciencias
sociales. La idea que hay detrs es probar que un individuo que es bueno en un rea,
seguramente lo ser en las dems. Es decir, los rendimientos entre las pruebas tendrn
algn tipo de relacin. Desde el punto de vista de las variables latentes podemos entender
de mejor forma este resultado.
Si pensamos que los resultados en las pruebas reflejan cuan inteligente, aplicado o en
resumen buen estudiante es un individuo, tendremos que el ser estudiante es la variable
latente detrs de la observada (los resultados de las pruebas). Entonces tendramos que las
variables observadas son:

Y 1 i= 1,Y 1i >0
0,Y 1 i 0

Y 2 i= 1,Y 2i > 0
0,Y 2 i 0

Y las variables latentes las podemos definir como:

Y 1 i=X 1+ 1 i

Y 2 i=X 2+ 2 i

Donde los erros distribuyen conjuntamente de la siguiente forma

([ ] [ ])

1 i , 2 i N 0 , 1
0 1

Tenemos que notar que ya impusimos una forma funcional a la distribucin conjunta de los errores
de tipo normal bivariada, esto con la intencin de seguir el supuesto que sigue el modelo BiProbit.

Variables Dependientes y Correlacin entre ellas


Se tomaron la prueba de matemtica y ciencias sociales debido al nmero de datos que
posee cada respuesta. Adems los promedios son muy similares entre ambas pruebas, al
igual que su desviacin, por lo que se podra pensar en que son materias con desempeos
similares y por tanto alto nmero de individuos que coincidan con lo que se quiere probar.

Variable

Obs

Mean

matematicas
ciencias_s~t
filosofia_~t
biologia_p~t
quimica_punt

49683
49683
8675
8675
8675

49.02284
49.11893
44.92588
47.14651
48.72934

fisica_punt
lenguaje

8675
49683

47.22674
50.00817

Std. Dev.

Min

Max

9.719365
9.736724
10.29019
9.329151
11.06601

0
0
0
0
0

109
103
95
94
89

14.00406
9.407043

0
0

111
100

Al transformar ambas variables en dummys, se puede encontrar que la proporcin de


estudiantes que coinciden en tener altos puntajes, en ambas pruebas es de ms o menos el
33,02% de toda la muestra. Esto nos plantea la pregunta de cuan relacionadas estn ambas
pruebas. Puesto que sabemos que la probabilidad condicional se puede obtener sin la
necesidad de suponer que nuestras variables dependientes estn correlacionadas, sin
embargo, si estn correlacionadas esto puede cambiar la forma de obtener esta probabilidad
evitando caer en problemas de especificacin.

Key
frequency
cell percentage

bmat

bcso
0

Total

19,215
38.68

7,795
15.69

27,010
54.36

6,269
12.62

16,404
33.02

22,673
45.64

Total

25,484
51.29

24,199
48.71

49,683
100.00

Para probar esto, realizaremos 4 pruebas. 2 de correlacin simple, en las que se mira la
correlacin entre las variables que queremos analizar y la correlacin entre los residuales de
dos modelos probit, estimados para las variables de inters. Estas correlaciones arrojan que
efectivamente existe relacin entre ambas variables. Las otras dos pruebas son mediante
una prueba tetrachorica, en donde se examina exactamente lo mismo, a travs de un
estadstico de multiplicadores de Lagrange o razn de verosimilitud. En ambas, una
obtenida por la estimacin del modelo biprobit nulo, obtenemos que se rechaza la hiptesis
de no relacin entre ambas variables.

. tetrachoric bmat bcso


Number of obs =
Tetrachoric rho =
Std error =

49683
0.6305
0.0049

Test of Ho: bmat and bcso are independent


2-sided exact P =
0.0000

Estimacin del Modelo Biprobit


Ahora, estimaremos el modelo biprobit en el cual, de forma muy general, se entiende que se
quiere estimar una funcin de distribucin conjunta, la cual distribuir normal bivariada,
midiendo la probabilidad de ser bueno en matemticas y en sociales. La diferencia de
obtener esto, por medio de dos distribuciones normales univariadas es que no se tiene en
cuenta la correlacin entre los erros de ambos modelos.
Como variables explicativas utilizamos la Educacin del padre, la Educacin de la madre,
el estrato, la jornada escolar y el sexo. La Educacin de los Padres esperamos tenga un
efecto positivo sobre el desempeo del individuo, esto es debido a todo lo que sabemos de
capital cultural. El estrato trata de reflejar las condiciones econmicas del individuo,
esperando que tengan un efecto positivo sobre los rendimientos. La jornada escolar, est
relacionada con que los estudiantes de jornadas completas o matutinas tienen mejores
desempeos. Sin embargo esto es una hiptesis a ser contrastada. Por ltimo el sexo,
esperamos encontrar que siguen habiendo diferencias en los rendimientos entre hombres y
mujeres.
Estas variables fueron utilizadas para explicar tanto la probabilidad de sacar buenos
resultados en matemticas como en sociales. Aunque se podran utilizar variables distintas
para explicar el desempeo en cada prueba, considero que si la hiptesis es demostrar que
ser bueno no es condicional a la materia, tampoco deben ser diferentes las caractersticas
del individuo que lleven a tener buenos resultados. Y por tanto los efectos de las variables
tampoco espero que sean diferentes en cada materia.
VARIABLES
Sexo: Mujer
Niveles de Educ del Padre, Primaria
Niveles de Educ del Padre, Secundaria
Niveles de Educ del Padre, Tec/Tcnogo
Niveles de Educ del Padre, Universitaria

(1)
Matemticas

(2)
Sociales

-0.254***
(0.0121)
0.0102
(0.0324)
0.109***
(0.0322)
0.352***
(0.0383)
0.372***

-0.0776***
(0.0119)
0.0380
(0.0317)
0.104***
(0.0316)
0.273***
(0.0377)
0.333***

(3)
Rho

Niveles de Educ de la Madre, Primaria


Niveles de Educ de la Madre, Secundaria
Niveles de Educ de la Madre, Tec/Tcnogo
Niveles de Educ de la Madre, Universitaria
Estrato socioeconomico, Medio
Estrato socioeconomico, Alto
Jornada de estudio, Maana
Jornada de estudio, Noche
Jornada de estudio, Sabatina
Jornada de estudio, Tarde
Constant
Observations

(0.0383)
0.210***
(0.0507)
0.364***
(0.0507)
0.534***
(0.0546)
0.588***
(0.0551)
0.155***
(0.0152)
0.399***
(0.0373)
-0.0414*
(0.0226)
-0.728***
(0.0317)
-0.719***
(0.0356)
-0.0598**
(0.0267)
-0.376***
(0.0548)

(0.0377)
0.191***
(0.0484)
0.297***
(0.0485)
0.472***
(0.0524)
0.480***
(0.0529)
0.0605***
(0.0150)
0.184***
(0.0358)
0.0789***
(0.0223)
-0.501***
(0.0306)
-0.524***
(0.0342)
0.0888***
(0.0264)
-0.422***
(0.0522)

0.584***
(0.0056)

46,629

46,629

46,629

Ahora, nuestras estimaciones arrojan que los efectos de la Educacin de los padres, el
estrato y el sexo es la esperada, siendo significativos. A mayor educacin de los padres, las
probabilidades de tener buenos resultados, en ambas reas, incrementa, se mantiene el
hecho de que el efecto es mayor para las madres que para los padres. E igual sucede con el
estrato, al pasar de estrato bajo a medio y medio a alto, se logra una mayor probabilidad de
tener buenos resultados en ambas reas. En el sexo encontramos que existen diferencias
significativas entre el rendimiento de mujeres y hombres, teniendo un efecto negativo ser
mujer.
Sin embargo, los efectos de las jornadas difieren en el tipo de prueba. Tenemos que para
para la prueba de matemtica que todas las jornadas, respecto a la jornada completa, tienen
efectos negativos y significativos al 90% en el rendimiento. Para la prueba de sociales, las
jornadas de la maana y tarde, respecto a la completa, si tienen un efecto positivo sobre el
rendimiento. Esto es algo interesante, sin embargo, la explicacin no aparece a simple vista.
Un resultado positivo es que se disminuy la correlacin entre las variables dependientes
un poco, pero sigue siendo de 0,58.
Interpretacin de los diferentes efectos marginales

Ahora, pasaremos a interpretar las probabilidades conjuntas que predice el modelo. Estas
probabilidades en pocas palabras podemos resumilarlas como la probabilidad de que en la
prueba de matematicas y la prueba de sociales los rendimientos hayan sido (1,1), (1,0),
(0,1) y (0,0). Donde 1 es que haya tenido un buen rendimiento y 0 un mal rendimiento.
Para la probabilidad de ser bueno en ambas pruebas tenemos que los efectos de la
educacion de los padres es positiva, solamente no es significante un nivel de primaria para
el padres. Los estratos medios y altos, frente al bajo, tienen estos mismo efectos. Aqu
permanece el efecto positivo de las jornadas de maana y tarde, frente a la jornada
completa. Sin embargo, se nota que los efectos no son muy fuertes sobre la probabilidad
conjunta. A diferencia de las otras variables dependientes.
Marginal effects after biprobit
y = Pr(bmat=1,bcso=1) (predict, p11)
= .32050105
variable
bsex*
_IEdup~2*
_IEdup~3*
_IEdup~4*
_IEdup~5*
_IEdum~2*
_IEdum~3*
_IEdum~4*
_IEdum~5*
_Iestr~2*
_Iestr~3*
_Ijorn~2*
_Ijorn~3*
_Ijorn~4*
_Ijorn~5*

dy/dx
-.0660546
.0089461
.0411716
.1276323
.1432382
.0792759
.128037
.2077622
.2201464
.0428758
.1177322
.0059909
-.2027604
-.201352
.0026283

Std. Err.
.0039
.01029
.01024
.01329
.01325
.01631
.01559
.01868
.01873
.00499
.0128
.0072
.00655
.00704
.0086

z
-16.92
0.87
4.02
9.60
10.81
4.86
8.22
11.12
11.75
8.59
9.20
0.83
-30.95
-28.62
0.31

P>|z|

95% C.I.

0.000
0.385
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.405
0.000
0.000
0.760

-.073705 -.058404
-.011217
.02911
.02111 .061233
.101587 .153677
.117276 .169201
.047307 .111245
.09749 .158584
.171144
.24438
.183435 .256857
.033087 .052664
.092652 .142813
-.008119 .020101
-.215601 -.18992
-.215143 -.187561
-.014227 .019483

X
.558043
.299084
.44794
.080358
.126531
.272213
.492505
.091338
.123807
.256579
.041176
.614253
.084368
.058161
.143023

En el caso de la probabilidad de ser bueno en la prueba de matemticas, pero no ser bueno


en la prueba de sociales; tenemos que la educacin de los padres no es significativa, esto es
algo realmente interesante. Sin embargo, el sexo, el estrato y la jornada son significativos.
Teniendo todas las jornadas, respecto a la de referencia, un efecto negativo. El ser mujer
tiene un efecto negativo, sin embargo es menor que el calculado para la anterior
probabilidad. Y estratos medio y alto tienen efectos positivos sobre esta probabilidad.
Ahora la probabilidad de obtener buenos resultados en sociales pero no en matemtica. En
este caso solo las educaciones superiores de los padres tienen un efecto positivo y
significativo sobre la probabilidad, los dems niveles educativos no son significativos.
Adems, solo las jornadas de la maana y tarde tienen un efecto positivo y significativo, el
resto de jornadas no son significativas. Unos efectos muy interesantes son los estratos,
donde el medio y alto tienen un efecto negativo y significativo, y el ser mujer tiene un

efecto positivo. Esto ira en contrava de los anteriores resultados. Podramos pensar
entonces que, los sentimientos de exclusin hacen que la gente tenga una mejor
preparacin en las ciencias sociales? Suena algo plausible, sin embargo no creo que la
evidencia sea lo suficientemente fuerte para llegar a esa conclusin.
Marginal effects after biprobit
y = Pr(bmat=1,bcso=0) (predict, p10)
= .13424331
variable
bsex*
_IEdup~2*
_IEdup~3*
_IEdup~4*
_IEdup~5*
_IEdum~2*
_IEdum~3*
_IEdum~4*
_IEdum~5*
_Iestr~2*
_Iestr~3*
_Ijorn~2*
_Ijorn~3*
_Ijorn~4*
_Ijorn~5*

dy/dx
-.0345602
-.0049102
.0019515
.0121119
.0041821
.0043246
.0155784
.0017282
.0096816
.018616
.0398873
-.0224165
-.0587227
-.055601
-.0262493

Std. Err.
.00252
.00668
.00667
.00821
.00794
.01063
.01043
.01113
.01151
.0032
.00868
.00475
.00484
.00547
.00498

z
-13.74
-0.73
0.29
1.48
0.53
0.41
1.49
0.16
0.84
5.81
4.60
-4.72
-12.12
-10.16
-5.27

P>|z|

95% C.I.

0.000
0.462
0.770
0.140
0.599
0.684
0.135
0.877
0.400
0.000
0.000
0.000
0.000
0.000
0.000

-.039492
-.018004
-.011125
-.003973
-.011386
-.016511
-.004868
-.020092
-.012876
.012339
.022883
-.031721
-.068218
-.066329
-.036003

-.029629
.008184
.015028
.028196
.01975
.02516
.036025
.023548
.032239
.024893
.056891
-.013112
-.049227
-.044873
-.016496

X
.558043
.299084
.44794
.080358
.126531
.272213
.492505
.091338
.123807
.256579
.041176
.614253
.084368
.058161
.143023

(*) dy/dx is for discrete change of dummy variable from 0 to 1

Marginal effects after biprobit


y = Pr(bmat=0,bcso=1) (predict, p01)
= .16713215
variable
bsex*
_IEdup~2*
_IEdup~3*
_IEdup~4*
_IEdup~5*
_IEdum~2*
_IEdum~3*
_IEdum~4*
_IEdum~5*
_Iestr~2*
_Iestr~3*
_Ijorn~2*
_Ijorn~3*
_Ijorn~4*
_Ijorn~5*

dy/dx
.0351209
.0061999
.0002343
-.0192431
-.0116791
-.0030516
-.0098373
-.0237262
-.0324134
-.0187432
-.0446009
.0254378
.0102785
.0015119
.032785

Std. Err.
.00277
.00772
.00757
.00846
.00868
.01195
.01181
.01191
.01172
.00339
.00731
.00516
.00755
.00831
.00667

z
12.67
0.80
0.03
-2.28
-1.35
-0.26
-0.83
-1.99
-2.77
-5.53
-6.10
4.93
1.36
0.18
4.92

P>|z|

95% C.I.

0.000
0.422
0.975
0.023
0.178
0.798
0.405
0.046
0.006
0.000
0.000
0.000
0.174
0.856
0.000

.029689
-.008935
-.014611
-.035819
-.028686
-.026463
-.032987
-.04707
-.055387
-.025387
-.058938
.015315
-.004528
-.014769
.019713

.040553
.021334
.015079
-.002667
.005328
.02036
.013312
-.000382
-.009439
-.0121
-.030264
.035561
.025085
.017793
.045857

X
.558043
.299084
.44794
.080358
.126531
.272213
.492505
.091338
.123807
.256579
.041176
.614253
.084368
.058161
.143023

(*) dy/dx is for discrete change of dummy variable from 0 to 1

La ltima probabilidad conjunta es no ser bueno en ambas pruebas. En esta tenemos que
solo la educacin primaria del padre y las jornadas de maana y tarde, no son significativas.

Los efectos en este caso poseen la direccin contraria a la primera calculada, y es lgico
puesto que pretende explicar lo contrario.
Marginal effects after biprobit
y = Pr(bmat=0,bcso=0) (predict, p00)
= .37812349
variable
bsex*
_IEdup~2*
_IEdup~3*
_IEdup~4*
_IEdup~5*
_IEdum~2*
_IEdum~3*
_IEdum~4*
_IEdum~5*
_Iestr~2*
_Iestr~3*
_Ijorn~2*
_Ijorn~3*
_Ijorn~4*
_Ijorn~5*

dy/dx
.0654939
-.0102358
-.0433573
-.1205011
-.1357412
-.0805489
-.1337781
-.1857641
-.1974145
-.0427486
-.1130186
-.0090121
.2512046
.2554411
-.0091641

Std. Err.
.00407
.01081
.01074
.01138
.01133
.01599
.01638
.01419
.01438
.00507
.01096
.00766
.01058
.01172
.00904

z
16.09
-0.95
-4.04
-10.59
-11.98
-5.04
-8.16
-13.09
-13.73
-8.42
-10.31
-1.18
23.75
21.80
-1.01

P>|z|

95% C.I.

0.000
0.344
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.239
0.000
0.000
0.310

.057518
-.031417
-.064413
-.142802
-.157947
-.111898
-.165892
-.21358
-.225591
-.052694
-.134495
-.024025
.230476
.232478
-.026873

.07347
.010946
-.022302
-.0982
-.113535
-.0492
-.101664
-.157948
-.169238
-.032804
-.091542
.006001
.271933
.278404
.008545

X
.558043
.299084
.44794
.080358
.126531
.272213
.492505
.091338
.123807
.256579
.041176
.614253
.084368
.058161
.143023

(*) dy/dx is for discrete change of dummy variable from 0 to 1

Los efectos marginales, sobre las probabilidades individuales de ser bueno en matemticas
o sociales, tienen la misma direccin analizada en la regresin que realizamos. Ms all de
una descripcin de magnitudes no ganaramos nada nuevo con el anlisis. Ahora las
probabilidades condicionadas de ser bueno en matemticas dado que se es bueno en
sociales y ser bueno en sociales dado que se es bueno matemticas, es lo que nos ha trado
aqu, y compararemos los efectos de las variables contra los efectos en la probabilidad
conjunta (1,1).
En la primera probabilidad condicional de bueno en matemticas dado que se es bueno en
sociales; tenemos que el efecto de la educacin primera del padre sigue sin ser significativa,
aunque cambia su efecto a negativo, y el efecto de las jornadas maana y tarde cambia a ser
negativo. Adems vemos que los efectos de la educacin de los padres se reducen, aumenta
el efecto de los estratos socioeconmicos y aumenta el efecto de las jornadas escolares.
Esto es algo interesante, siguiendo la idea que nos surgi acerca de la exclusin, puesto que
si suponemos que alguien que posee este sentimiento y no le es posible aumentar su nivel
de ingresos (o estrato socioeconmico), una solucin de poltica seria implementar la
jornada completa, dado que otro tipo de jornada escolar tiene efectos negativos muy fuertes
sobre el rendimiento escolar.
En la probabilidad condicional de ser bueno en sociales dado que se es bueno matemticas
ocurren cosas interesantes. Los efectos de los estratos se vuelven no significativos sobre la
probabilidad condicionada. La educacin de los padres sigue teniendo un efecto positivo,
pero su magnitud se ve reducida an ms que en el anterior caso. Sin embargo, el efecto

positivo de las jornadas maana y tarde se refuerza, aumentando considerablemente, y el


efecto negativo de las otras jornadas disminuye considerablemente. Esto es algo
desconcertante puesto que la anterior recomendacin de poltica podra quedar invalidada.
Marginal effects after biprobit
y = Pr(bmat=1|bcso=1) (predict, pcond1)
= .65725847
variable
bsex*
_IEdup~2*
_IEdup~3*
_IEdup~4*
_IEdup~5*
_IEdum~2*
_IEdum~3*
_IEdum~4*
_IEdum~5*
_Iestr~2*
_Iestr~3*
_Ijorn~2*
_Ijorn~3*
_Ijorn~4*
_Ijorn~5*

dy/dx
-.0931543
-.0020434
.0283768
.0975524
.097036
.0558944
.1031406
.1363914
.15448
.0541113
.1256482
-.0305207
-.2329078
-.2251074
-.0402511

Std. Err.
.00462
.0127
.01254
.01311
.01331
.01936
.01982
.0175
.01745
.00565
.01189
.0087
.01346
.01525
.01059

z
-20.17
-0.16
2.26
7.44
7.29
2.89
5.20
7.79
8.85
9.57
10.56
-3.51
-17.31
-14.76
-3.80

P>|z|

95% C.I.

0.000
0.872
0.024
0.000
0.000
0.004
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000

-.102208
-.026943
.003806
.071866
.070947
.017947
.064295
.102089
.120287
.043033
.102335
-.047575
-.25928
-.254993
-.061015

-.0841
.022856
.052947
.123239
.123125
.093842
.141986
.170694
.188673
.065189
.148961
-.013467
-.206536
-.195222
-.019487

X
.558043
.299084
.44794
.080358
.126531
.272213
.492505
.091338
.123807
.256579
.041176
.614253
.084368
.058161
.143023

(*) dy/dx is for discrete change of dummy variable from 0 to 1


Marginal effects after biprobit
y = Pr(bcso=1|bmat=1) (predict, pcond2)
=
.7047939
variable
bsex*
_IEdup~2*
_IEdup~3*
_IEdup~4*
_IEdup~5*
_IEdum~2*
_IEdum~3*
_IEdum~4*
_IEdum~5*
_Iestr~2*
_Iestr~3*
_Ijorn~2*
_Ijorn~3*
_Ijorn~4*
_Ijorn~5*

dy/dx
.0104835
.0133704
.0234741
.0509451
.0696999
.0413152
.0586512
.0961878
.0928074
-.0009683
.011048
.0383064
-.076667
-.0881266
.0440112

Std. Err.
.00439
.01167
.01163
.01271
.01248
.01751
.01805
.01627
.01681
.00547
.01275
.00829
.01274
.01447
.00918

z
2.39
1.15
2.02
4.01
5.59
2.36
3.25
5.91
5.52
-0.18
0.87
4.62
-6.02
-6.09
4.79

P>|z|

95% C.I.

0.017
0.252
0.044
0.000
0.000
0.018
0.001
0.000
0.000
0.859
0.386
0.000
0.000
0.000
0.000

.001883 .019084
-.009507 .036248
.00068 .046268
.02603
.07586
.045243 .094157
.006992 .075638
.023267 .094035
.064293 .128082
.059866 .125749
-.011687
.00975
-.013938 .036035
.022068 .054545
-.101637 -.051697
-.116487 -.059766
.02601 .062012

(*) dy/dx is for discrete change of dummy variable from 0 to 1

Conclusin

X
.558043
.299084
.44794
.080358
.126531
.272213
.492505
.091338
.123807
.256579
.041176
.614253
.084368
.058161
.143023

Como conclusin del modelo puedo recalcar lo obtenido en la bsqueda de los efectos de
las ltimas probabilidades. Esto nos muestra que la realidad social es mucho ms compleja
de lo que se piensa, y que, a diferencia de lo que pensaba, las condiciones del individuo
pueden generar que si varen los rendimientos en diferentes pruebas. Adems, esto vuelve
ms compleja la tarea de buscar polticas pblicas que efectivamente logren mejorar la
educacin de un pas. Como vemos no basta con implementar una jornada completa, puesto
que el efecto no es igual en todas las materias. Ahora, sera interesante analizar a
profundidad si existe una relacin entre los resultados en la prueba de ciencias sociales con
las condiciones socioeconmicas del individuo y que sucede con las jornadas acadmicas,
en relacin a esta prueba. Tambin sera interesante aadir otra prueba para analizar si
estos efectos se mantienen o vuelven a variar, invalidando las conclusiones hasta aqu
encontradas.

S-ar putea să vă placă și