Sunteți pe pagina 1din 8

Eco 2 – monitoria Leandro Anazawa

Econometria II

Aplicação de Variáveis Instrumentais (VI) – STATA

Vamos utilizar uma base de dados com informações sobre condições de


trabalho, educação e moradia. Os comandos do Stata estão em vermelho.

Abrindo a base de dados no Stata (que está no STOA):

use "card_mod.dta", clear

Suponha que estamos interessados em ver a relação entre os anos de


escolaridade obtidos por um indivíduo e o seu salário. Temos a seguinte
regressão:

ln(salário) = a + b*[Anos de educação] + erro

Estamos interessados no coeficiente b. Mas acreditamos que E(erro|Anos


de educação) seja diferente de zero. Ou seja, acreditamos que a nossa variável
independente (Anos de educação) seja relacionada com alguma variável no erro.

Um possível exemplo seria "inteligência". "inteligência" está relacionada


com a quantidade de anos de escolaridade que o indivíduo obtém e está no erro.
Portanto, uma estimação por MQO desse modelo resultaria em um coeficiente
estimado (𝑏̂) viesado.

Uma forma de contornar esse problema de endogeneidade é utilizar o


estimador de Variáveis Instrumentais (VI). Então, temos que encontrar um
instrumento para "Anos de educação" e obter o estimador de Variáveis
Instrumentais. O instrumento escolhido deve ser correlacionado com "Anos de
educação" e não pode ser correlacionado com o erro (que no nosso caso seria
"inteligência").

Um possível instrumento é "Anos de educação da mãe". Considerando


que "inteligência" é algo definido aleatoriamente no nascimento, teríamos que
"Anos de educação da mãe" é não correlacionado com a inteligência do filho.

1
Além disso, "Anos de educação da mãe" é correlacionado com os "Anos de
educação" obtidos pelo filho, como podemos ver a seguir:

corr anosedu edumae

Outra alternativa de instrumento é "Anos de educação do pai", que segue


a mesma lógica de “Anos de educação da mãe”. Também podemos ver a
correlação entre “Anos de educação” obtidos pelos indivíduos e “Ano de
educação do pai”:

corr anosedu edupai

Outra alternativa de instrumento é uma dummy que assume valor igual


a 1 se o indivíduo "Morou perto de uma universidade". O fato da pessoa morar
perto de uma universidade ‘motivaria’ ela a obter maiores níveis de educação
(em teoria). Além disso, morar ou não perto da universidade não estaria
relacionado com a "inteligência". A seguir podemos ver a correlação entre essa
dummy e “Anos de educação”:

corr anosedu proximidade

Com base apenas nessas correlações, qual o melhor instrumento a ser


utilizado?

2
i) Estimação por Variáveis Instrumentais.

A seguir temos o comando "ivreg" que realiza estimações de variáveis


instrumentais automaticamente, utilizando o MQO de 2 estágios. Dentro dos
parênteses colocamos ('variável endógena' = 'instrumento'). "first" no final do
comando indica para o Stata mostrar os resultados das estimações do 1º
estágio.

ivreg lnsalario (anosedu=edumae), first

3
Alternativamente, podemos fazer as estimações na mão.

1º estágio: X contra Z.

reg anosedu edumae

Obtendo 𝑋̂:

predict edu_chapeu, xb

2º estágio: Usar 𝑋̂ no lugar de X na regressão de Y.

reg lnsalario edu_chapeu

Note que o coeficiente estimado de "Anos de educação" é o mesmo nos


dois modos. Seja pelo “ivreg” ou pelo MQO de dois estágios.

4
ii) Variância do estimador de Variáveis Instrumentais (VI).

Nas correlações anteriores vimos que "Morou próximo de uma


universidade" tinha uma baixa correlação com "Anos de educação".

Assim, a variância do estimador de VI utilizando "Morou perto de


universidade" como instrumento será MAIOR, MENOR ou IGUAL a
variância do estimador de VI utilizando "Anos de educação da mãe" como
instrumento?

A seguir obtemos o estimador de VI utilizando "Morou perto de


universidade" como instrumento para "Anos de educação":

ivreg lnsalario (anosedu=proximidade) if e(sample), first

5
Note que a variância do estimador de VI utilizando “Morou perto de
universidade” como instrumento é MAIOR. Lembrem que a variância do
estimador de VI depende da correlação entre X e Z elevada ao quadrado.

Quanto menor a correlação entre X e Z, maior será a variância do


estimador de Variáveis Instrumentais.

iii) Mais do que 1 instrumento válido.

E quando temos mais de um instrumento válido? Lembrem que podemos


fazer uma combinação linear desses instrumentos, de modo a obter um
instrumento que resultará em um estimador VI mais eficiente. A seguir obtemos
o estimador de VI utilizando "Anos de educação da mãe" e "Morou perto de
universidade" como instrumentos.

ivreg lnsalario (anosedu=edumae proximidade), first

6
Alternativamente, podemos fazer as estimações na mão.

reg anosedu edumae proximidade

7
predict edu_chapeu2, xb

reg lnsalario edu_chapeu2

iv) Verificando a presença de instrumentos fracos.

Podemos utilizar o Teste de Hausman para verificar a presença de


instrumentos fracos (a sequência de comandos é essa, mas o resultado está
dando errado).

qui ivreg lnsalario (anosedu=edumae proximidade)

estimate store a

qui ivreg lnsalario (anosedu=edumae)

hausman a

S-ar putea să vă placă și