Sunteți pe pagina 1din 54

UNIVERSIDADE CATLICA DE ANGOLA

ECONOMETRIA

Por: Armando Manuel MSc


Amlia Quinto - MSc
Albertina Dekgado-MSc
Carlos Vasconcelos- MSc
2015
1

Introduo

O QUE A ECONOMETRIA

A econometria pode ser definida como a anlise quantitativa de fenmenos


econmicos concretos, baseada no desenvolvimento simultneo de teoria e da
observao, relacionadas por mtodos de inferncia adequados.'

A econometria, consiste na aplicao da estatstica matemtica aos dados


econmicos para dar suporte emprico aos modelos construdos pela economia
matemtica e para obter resultados numricos.

A econometria pode ser definida como a cincia social na qual as ferramentas da


teoria econmica, matemtica e inferncia estatstica so aplicadas anlise dos
fenmenos econmicos.

A econometria se ocupa da determinao emprica das leis econmicas.

A arte do econometrista consiste em achar o conjunto de hipteses que sejam


tanto suficientemente especficas quanto realistas, para lhe permitir tirar o
mximo proveito possvel dos dados sua disposio.'

Os econometristas... prestam uma inegvel contribuio tentativa de afastar a


pobre imagem pblica da economia (quantitativa ou no), tida como um assunto
no qual latas vazias so abertas, supondo a existncia de abridores de lata, para
revelar.

O principal interesse da economia matemtica expressar a teoria econmica na


forma matemtica (equaes), sem levar em conta a imensurabilidade ou a
verificao emprica da teoria. J a econometria, como destacamos
anteriormente est interessada na verificao da verificao emprica da teoria;

SOBRE A METODOLOGIA
Embora as questes de metodologia tm sido objecto de constantes criticas e sugestes,
a abordagem clssica apresenta 7 passos ou eixos sequenciais que nos sugerem a
metodologia de estudo da econometria:
o Formulao da teoria ou da hiptese
o Especificao do modelo matemtico da teoria
o Especificao do modelo economtrico da teoria
o Obteno de dados
o Estimativa dos parmetros do modelo economtrico
o Teste de hiptese
o Previso ou predio

1.

ASPECTOS CONCEITUAIS
a) REGRESSO

O termo regresso foi introduzido por Francis Galton num estudo relacionado
a hereditariedade, no qual descobriu a tendncia dos filhos nascerem com caractersticas
prximas as dos pais. Outros nomes adicionados a estas descobertas, dizem respeito a
Karl Pearson que encontrou resultados robustos ao verificar que a altura mdia de filhos
pertencentes a um grupo de pais baixos era superior altura de seus pais.

A anlise de regresso diz respeito ao estudo da dependncia de uma varivel em


relao a uma ou mais variveis cujo comportamento independente. Este estudo visa
determinar o valor mdio da varivel dependente.
b) CORRELAO
A relao de correlao o processo no qual medimos a intensidade da relao
existente entre duas variveis, sempre que desenvolvermos um clculo de regresso, o
coeficiente de ajustamento do modelo, permite-nos obter a noo do grau de correlao
entre ambas as variveis. Podemos dizer, que trata-se do grau de associao linear.
Na anlise de correlao no se estabelece distino entre variveis dependentes
ou independentes, como fizemo-lo na anlise de regresso. Numa situao de correlao
baseamo-nos numa hiptese de aleatoridade enquanto que para a anlise de regresso
consideramos a aleatoridade apenas para a varivel dependente contrariamente as
vaiveis independentes em cujo valores so fixados e ou no-estocstico.
c) CAUSAO
A regresso explica a relao de dependncia entre uma varivel e outra. Este
tipo de relao consiste numa relao meramente estatstica, que no obstante permitir
encontrar uma relao, no implica necessariamente uma relao de causao.
A teoria econmica faz referncia a Causalidade de Granger
d) RELAO DETERMINISTA E ESTOCSTICA
No estudo do comportamento das variveis, encontramos variveis cujo
comportamento obedece tendncias probabilsticas. Estas variveis seguem um
comportamento aleatrio tambm chamadas variveis estocsticas. Exemplo:
pluviosidade, a temperatura ambiental, queda de aeronaves soviticas em Angola etc.
Quando nos referimos a relaes determinsticas, tratam-se de relaes nas quais
intervm variveis cujo comportamento determinstico e no aleatrio. Exemplo: Lei
de gravidade de Newton, Nascimento de um ser como resultado da fecundao de
espermatozoides etc...
Alguns Conceitos Sinnimos:
Varivel Endgena
Varivel de Resposta
Regredida
Predita
Varivel Explicada
Varivel Dependente
2.

Varivel Exgena
Varivel de Estimulo ou Controlo
Regressor
Preditor
Varivel Explicativa
Varivel Independente

A NATUREZA E A FONTE DOS DADOS

Os tipos de dados existentes para o trabalho emprico sries temporais, dados


cross-secionais, dados qualitativos, e ainda dados de painel.
So dados qualitativos quando no acto da colheita tomamos uma categoria ou um
atributo cujo resultado toma o valor 1 ou 0 exemplo: homem ou mulher, empregado ou
desempregado. A este tipo de dados tambm chamamos por dummies.

Na maior parte dos casos, os economistas fazem recurso ou uso de sries de


variveis temporais. Na maior parte das sries temporais econmicas apresentam um
comportamento dinmico isto , a sua media e varincia tendem ambas a variar em
funo do tempo.
Os dados cross-seccionais, tambm chamados por dados de corte, so dados de
uma ou mais varivel colectados ano mesmo ponto de tempo. Uma grande implicao
das sries cross-seccionais, diz respeito a heterogeneidade forada por hiatos no
tamanho e no efeito de escala.
Por outro lado, existem situaes nas quais consideramos a combinao de dados
de sries temporais e de dados cross-seccionais.
Dados Em Painel, tambm conhecidos como panel data, so informaes de
unidades, indivduos ou empresas, por exemplo, que podem ser acompanhadas ao longo
do tempo. Mas os mtodos de anlise tambm podem ser aplicados, com as devidas
consideraes, a diferentes sries de dados observados em duas dimenses, por
exemplo, observar as unidades, como empresas, em diferentes estados, ou pases.
Quanto a fontes dos dados, estes podem ser colectados por agncias
governamentais ou independentes. E os dados colectados podem ser experimentais ou
no-experimentais. Todavia os dados colectados no domnio das cincias sociais so
quase sempre no-experimentais o que pressupe dizer que so dados em que o
pesquisador no consegue exercer influncia significativa.
A preciso dos dados constitui um outro factor importante. Certamente que a
colecta de dados raramente ilustra 100% da realidade; quase sempre ocorrem erros de
observao, omisso e ou execuo. Porm do esforo em aproximar os dados
estatsticos realidade especfica, um factor muito importantssimo.
3.

ELEMENTOS CHAVE

DOS CONCEITOS BSICOS

1. A ideia chave da anlise de regresso a dependncia estatstica de uma varivel (a


varivel dependente) em relao a uma outra ou outras variveis (as variveis
explicativas).
2. O objectivo desta anlise estimar e/ou prever a mdia ou o valor mdio da varivel
dependente, com base nos valores conhecidos ou fixados das variveis explicativas.
3. Na prtica, o sucesso da anlise de regresso depende da disponibilidade de dados
apropriados. Este captulo discutiu a natureza, as fontes e as limitaes dos dados que
geralmente esto disponveis para pesquisa, especialmente nas cincias so ciais.
4. Em qualquer pesquisa, o pesquisador deve informar claramente as fontes dos dados
utilizados na anlise, suas definies, seus mtodos de colecta e quaisquer lacunas ou
omisses nos dados, bem como quaisquer revises dos dados. Lembre-se de que os
dados macro-econmicos publicados pelo governo so frequentemente revistos..

II. A REGRESSO SIMPLES


1.

A FUNO DE REGRESSO POPULACIONAL (FRP)

Diremos que geometricamente, a curva de uma funo de regresso o espao


geomtrico onde as mdias ou expectativas condicionais das variveis dependentes para
os valores fixados da varivel explicativa;

E( Y X i ) f ( X i )

Equao 1

Onde X uma funo explicativa e Y a varivel explicada, linear em X.


Chamaremos assim a equao 1 como funo de populao de regresso (FPR) de
duas variveis. Assim, assumindo que X pode tomar valores nulos, podemos transcrever
a FPR em

E(Y X i ) 1 2 X i

Equao 2

onde os parmetros beta um e beta dois so desconhecidos, todavia fixos e chamase coeficientes de regresso. Tambm so conhecidos como intercepto e coeficiente de
inclinao, respectivamente.
O objectivo presente consiste em estimar os parmetros desconhecidos da FRP
descrita na equao N 2.
2.

PROPRIEDADES
a) A LINEARIDADE

Assumimos que a nossa FRP linear, o que significa que a expectativa


condicional de Y em relao a X consequncia de uma funo linear, podendo esta ser
representada geometricamente por um grfico.
Semelhantemente, a FRP linear nos parmetros, ou seja a expectativa
condicional de Y em relao a X linear nos parmetros. Todavia, se obtivermos uma
funo do tipo E(Y X i ) 1 2 X i2 ela continua sendo linear nos parmetros embora
no seja na varivel. Todavia, um caso como E(Y X i ) 1 2 X i no um modelo
de regresso linear nos parmetros.
Consideraremos um Modelo de Regresso Linear (MRL) E(Y X i ) 1 2 X i
todo aquele modelo onde E(Y X i ) linear quer nos parmetros como nas variveis.
b) A ESPECIFICAO ESTOCSTICA
Consideremos que dada a varivel Y e a sua estimativa condicional em relao a
Y, ocorrer sempre um desvio a que chamaremos o erro termo, a perturbao
estocstica ou ainda o white noise :
Yi E(Y X i ) i
Equao 3
Alternativamente, podermos escrever da seguinte maneira Yi E(Y X i ) i e
consequentemente Yi 1 2 X i i
Assim sendo o primeiro elemento do lado esquerdo ser o elemento sistemtico ou
determinstico, e o segundo termo, corresponde ao componente assistemtica ou
5

aleatria, cuja propriedade facilmente podemos obter quando aplicamos expectativas em


ambos os lados da equao condicional a X:

E(Y X i ) EE(Y X i ) E( i X i )

Equao 4

E(Y X i ) E(Y X i ) E( i X i )
note que para que a igualdade vigore, necessrio que E( i X i ) seja igual a zero

E( i X i ) 0

Equao 5

Neste contexto, considerando que ao extrapolar o caso para a vida prtica,


encontraremos variveis sendo explicadas por outras, o termo erro i representar
sempre aqueles factores no considerados na explicao da varivel dependente. Isso
pode ser o caso de variveis omissas.
c) A PERTURBAO ESTOCSTICA E A FUNO DE
REGRESSO AMOSTRAL
Para alm do aspecto da omisso de variveis destacado no ponto anterior, existem
outros factores que justificam a razo de existncia da perturbao estocstica no nosso
modelo, apontando-se:
1. Inexactido da teoria
2. Escassez de dados
3. Forma funcional errada
4. Casualidade intrnseca ao comportamento humano
5. Variveis fracas
6. Principio da parcimnia e
7. Variveis essenciais versus variveis perifricas
Considerando a aleatoriedade do erro, a representaes de uma funo de
regresso populacional para varias amostragens, da origem a chamada funo de
regresso amostral (FRA), tal que a amostra da equao 2 pode ser representada por:

Yi 1 2 X i

Equao 6

onde o Y estimador de E(Y X i ) , beta um chapu estimador de 1 e beta dois


chapu o estimador de 2 .
Assim sendo, podemos representar a FRP de duas formas, demonstradas pelas
equaes 2 e a extenso da equao 3, teremos:
Yi 1 2 X i i

Equao 7

em sntese, conclumos que o nosso principal objectivo consiste em determinar


FRP Yi 1 2 X i i dada a funo amostral FRA. Yi 1 2 X i i
Adicionalmente podemos ainda apresentar FRA do seguinte modo:

Yi Y
i
i

Equao 8

e em termos de FRP
6

Yi E(Y X i ) i
3.

Equao 9

MNIMOS QUADRADOS ORDINRIOS OLS


a) ACESSIBILIDADE DOS MQO-OLS;

Conforme referido anteriormente, constitui objecto principal testar a FRP tendo


como referncia a FRA. Dos enumeras mtodos existentes1, vamos aqui considerar o
mtodo dos quadrados mnimos MQO tambm denominado por Ordinary Least Squares
OLS desenvolvido pelo matemtico Alemo Car Friederich Gauss.
O mtodo em causa baseia-se nos princpio dos mnimos quadrados.
Sabe-se que a FRP Yi 1 2 X i i no directamente observvel, o que
ns conhecemos sim Yi 1 2 X i i conforme as equaes 6 e 7 o elemento
erro ou resduo dado pela diferena do Y observado e Y estimado.

i Yi Y
i

Equao 10

Yi 1 2 Xi

O interesse consistir neste caso em determinar a FRA mais prxima do Y


observado , o que em outras palavras pressupe dizer que quanto menor for resduo
. Note que o critrio MQO consiste em
quadrado melhor ser. i Yi Y
i

minimizar a soma do erro. Porm, veja na figura, a soma do erro 1 , 2 , 3 e 4 nula,


dada a sua assimetria. Entretanto, ns estamos mais interessados no quadrado da
soma, pois fazendo assim tornamos os valores negativos em positivos e o interesse
consistir em encontrar o menor valor possvel o que em outras palavras significa obter
resduos mais prximos da FRA.

Ilustrao 1 Demonstrao do critrio dos mnimos quadrados.


1

Existem os mtodos da Mxima Verosimilhana, OLS-two stage, Equaes


simultneas e outros.

Assim sendo, tomamos a equao 10 e aplicamos sobre ela o quadrado.

Y Y

2
i

Equao 11

Yi 1 2 X i

Em outras palavras podemos dizer que o resduo quadrado funo dos


estimadores. Quanto maior for o grau de significncia dos estimadores, maior a
probabilidade de se obter um resduo quadrado menor. i2 f 1 , 2 .

Abaixo temos um exemplo hipottico no qual assumimos inicialmente que 1 =


2.752 e 2 =1.673 com estes estimadores e conhecendo a srie de X, estimamos a
na coluna (3) uma vez conhecido Y
, determinamos
populao real ou seja, obtemos Y
i

i na coluna (4) efectuando a diferena entre as colunas (1) e (3) conforme a equao
10. Seguidamente a coluna (6) representa a aplicao da equao 11 obtendo um
i2 104.115460 . No segundo cenrio, assumimos novos valores para os parmetros

de estimao 1 =3 e 2 = 1 o que permite encontrar um quadrado da soma do resduo


i2 14 inferior ao obtido no cenrio inicial.
ui1 chapeu
Yi
1

Xi
2

Y1i chapeu
3

ui1 chapeu
4

Quadado

5
8
10
12

1
3
7
11

4.4250
7.7710
14.4630
21.1550

0.5750
0.2290
-4.4630
-9.1550

35

22

-12.814000

104.115460

ui2 chapeu
ui2 chapeu
7

Quadado

Y2i chapeu
6

0.330625
0.052441
19.918369
83.814025

4.0000
6.0000
10.0000
14.0000

1
2
0
-2

1
4
0
4

Tabela 1 Determinao Experimental da FRA

Assim, podemos representar a equao computada em (3) e (6) como:

3 X respectivamente.
Y1i 2.752 1.673Xi e Y
1i
i
b) HIPTESES BSICAS DO MODELO;
Veremos agora as hipteses bsicas do Modelo Clssico de Regresso Linear (MCRL),
que de uma forma mais avanada, infere as hipteses enunciadas por Gauss Markov.
Hiptese 1 - Modelo de Regresso Linear - O modelo linear nos
parmetros conforme mostrado em Yi 1 2 X i i ;
Hiptese 2 -

Os valores de X so fixados em amostras iterativas Os


valores assumidos pelo regressor X so considerados fixados
em repetidas2 amostras. A varivel um dado no estocstico.

Hiptese 3 -

O valor mdio do resduo i nulo Dado o valor X, o

valor esperado da perturbao residual i zero. Ei Xi 0

Para o caso especifico dos experimentos de Monte Carlo, considerando que o


resduo segue uma distribuio aleatria, conforme veremos adiante.

Hiptese 4 -Homoskedasticidade ou varincia igual de i - Dado o valor


da varivel independente, a varincia de i invariante ao
var i X i Ei E i X i

tempo.

E Xi
2
i

Hiptese 5 -No existe autocorrelao entre as perturbaes4 e, entre a


perturbao i e a varivel independente X. Dados dois
valores u i e u j tal que i j a correlao entre quaisquer
valores residuais de perodos distintos zero.

cov i , j X i , X j E i E i X i j E j X j

E i Xi j X j

cov i i , X i E i E i X i EX i

E i X j EX i

E i X i E i EX i onde EX i no estocastico
0
Hiptese 6 - O nmero de observaes n deve ser superior ao nmero de
parmetros5.
c) PROPRIEDADES DOS ESTIMADORES- GAUSS
MARKOV THEOREM;
GAUSS MARKOV dadas as hipteses bsicas do modelo clssico de regresso linear,
os estimadores por mnimos quadrados ordinrios so os
melhores estimadores lineares no enviesados MELNV com
varincia mnima.
Com ajuda das hiptese bsicas do modelo clssico e do teorema de Gauss
Markov, os estimadores dos mnimos quadrados apresentam algumas propriedades
bsicas dentre as quais:
1. Os estimadores OLS so lineares;
2. Os estimadores OLS no so viesados (unbiesed), isto quer dizer que o
valor esperado da estimativa de beta E i converge ao seu valor real i
.

Lembre-se que para o desdobramento, aplicamos a hiptese 4. Sempre que a


varincia alterar em funo do tempo, estaremos em presena da
Heteroskedasticidade.
4
Trata-se da ausncia da autocorrelao ou da correlao serial.
5
A esta hiptese juntam-se as hipteses da necessidade de suficiente
variabilidade nas variveis independentes (necessidade de um nmero positivo
finito var(X) - hiptese da multicolinearidade), assim como a hiptese de que o
modelo foi correctamente especificado retira-se a hiptese de existncia de
um vis de especificao.

3. Os estimadores OLS so eficientes possuem a varincia mnima a nvel


da classe dos estimadores lineares.

Ilustrao 2 Distribuio amostral de 2 e 2


*

O grfico demonstra a distribuio amostral de dois estimadores. Onde 2 MELNV.


d) DETERMINAO DOS ESTIMADORES
(i)

Derivao dos estimadores por OLS (modelo univarivel)

Como derivar a estimativas dos mnimos quadrados? Tomamos a funo


expressa na equao 11 e determinamos as derivadas parciais em relao a i e 2 .

i2
2 Yi 1 2 X i 2 i

Equao 12

i2
2 Yi 1 2 X i X i 2 i

Equao 13

Resolvendo estas equaes igualando-as a zero e efectuando os cortes


necessrios, resulta em:
1 Y 2 X
Equao 14

x y
x

i 6

Equao 15

2
i

(ii)

Linearidade e ausncia de vis

Como provar que os estimadores OLS so de facto MELNV? Tomando a


equao 15, considerando a anotao feita no rodap, tornamos a funo da estimativa
de 2 como uma funo linear de Y onde:
x i Yi logo assumimos que x i k , logo escreveremos
2
i
y i2
x i2
k Y
Equao 16

Lembra-se que esta funo pode ser desdobrada para apresentaes alternativas
como

x Y
X nX

X y
X nX

X y x Y e finalmente os
desvios de X e Y em relao a mdia dados por x X X ; y Y Y .
i

2
i

ou ainda

2
i

, onde

10

Note agora que a equao 16 apresenta o estimador 2 apresentado como uma


funo linear de Y dado o valor de k.
Agora como demonstrar que a o MELNV converge ao seu valor real?
Assumimos que o somatrio de k nulo, que o somatrio do quadrado de k
igual 1 sobre o somatrio de x (no seu desvio em relao a media). E finalmente
k i x i k i X i 1
Vejamos por exemplo provando que o somatrio de k nulo.
x
1
k i xi 2 x 2 x i considerando que o somatrio do desvio de X
i i
em relao a mdia nulo, a multiplicao do ltimo termo resulta num valor nulo.
Agora substitua a FRP Yi 1 2 X i i na equao 16 resultar em:
2 k i 1 2 X i i
2 1 k i 2 k i X i k i i 7
2 2 k i i
Equao 17
aplicando expectativas na nossa funo teremos:
E 2 2 k i E i
sabendo que o valor esperado do resduo nulo, conseguimos provar que o
estimador OLS converge ao seu valor real.
Equao 18
E 2 2

(iii) Varincia e erro padro dos estimadores OLS

Conhecendo a definio da varincia como sendo o quadrado do valor esperado da


diferena entre o estimador e o seu valor mdio, escreveremos:
2
Equao 19
var E E

usando a demonstrao de convergncia da estimativa ao seu valor real, substitumos


E 2

2
var 2 E 2 2
2
var 2 E k i i 8
var 2 E k 12 12 k 22 22 .... k 2n 2n 2k1 k 2 1 2 2k n 1 k n n 1 n
var 2 k 2

Aplicando as propriedades enunciadas acima, somatrio de k igual a zero e


somatrio de k vezes X igual a um.
8

Lembre-se que a equao 17 pode ser desdobrada sob forma de

2 2 k i i

11

var

2
x i2

ep 2

Equao 20

Equao 21

x i2
Covarincia entre as estimativas de 1 e 2

(iv)

Existir correlao entre dois estimadores diferentes 1 e 2 ? Vejamos por definio:


cov( , ) E E( ) E( )
1

1 2 2
2
cov( 1 , 2 ) XE 2 2
X var
1

Equao 22

Consequentemente teremos
2

cov( 1 , 2 ) X
x2
i

(v)

Equao 23

Propriedades da varincia mnima.

Lembra-se da equao 16 na qual demonstramos que 2 um estimador linear


em relao a Y, efectuamos algumas consideraes para k. Consequentemente,
podemos representa-las do seguinte modo.
Xi X
xi
Equao 24
ki

2
2
x

X
i
i
Agora, no mesmo esprito que a equao 16, achemos estimador alternativo,
tambm linear em relao a 2 :

*2 w i Yi

Equao 25

onde embora w seja um coeficiente linear de beta em relao a Y todavia no


necessariamente igual a k.
E(*2 ) w i EYi

w i E1 2 X i

1 w i 2 w i X i
agora para que o presente estimador seja no enviesado, necessrio que
w i 0 e consequentemente w i X i 1
Semelhantemente, nota que:
var *2 var w i Yi

var *2 w i2 var Yi

var *2 2 w i2

Equao 26

12

Tomando a equao 26, podemos introduzir transformaes de formas a atingir


um resultado desejado:

xi
x i
var w 1

x i2 x i2

*
2

x i
2
wi xi
var w i

xi
x i2

*
2

x i

2
x 2
i

x
x
2
i

2 2
i

1
x i
2

var *2 2 w i

2
2

x
x
i

var *2

2
x i2

Equao 27

fica assim provado que var *2 var 2 considerando que w i k i , a varincia


do estimador linear beta asterisco deve ser igual a varincia do estimador de mnimos
quadrados.
4.

ELEMENTOS CHAVE DA REGRESSO SIMPLES

1. A idia-chave que fundamenta a anlise de regresso o da funo de regresso


populacional(FRP).
2. Consideramos a FRP lineares, isto regresses lineares nos parmetros desconheci dos.
Elas podem no ser obrigatoriamente lineares na varivel dependente e na varivel
independente.
3. Para trabalhos empricos interessa mais a FRP estocstica.
4. FRP um conceito idealizado, pois na realidade quotidiana, o que se tem uma
observao da populao. Por esta razo utiliza-se a funo de regresso amostral
estocstica FRA, para estimar FRP.
5. A estrutura bsica da anlise de regresso o MCRL, baseado num conjunto de hipteses.
Com base nessas hipteses, os estimadores por mnimos quadrados adquirem certas
propriedades resumidas no teorema de Gauss-Markov, em que, na classe dos estimadores
lineares no-viesados, os estimadores de mnimos quadrados tm mnima varincia. Em
suma, eles so MELNV
6. A preciso dos estimadores por MQO medida por seus erros-padro.
7. O grau de ajuste global do modelo de regresso medido pelo coeficiente de determinao,

R 2 . Com ele se tem a proporo da variao na varivel dependente, ou regredido, que


2
explicada pela varivel explicativa, ou regressor. Este R est entre 0 e 1; quanto mais
prximo de 1, melhor o ajuste.
8. Um conceito ligado ao coeficiente de determinao o de coeficiente de correlao, r.
uma medida da associao linear entre duas variveis e est entre -1 e +1.
9. O MCRL uma abstraco ou construo terica, pois se baseia em um conjunto de
hipteses que podem ser rgidas ou "irrealistas". Mas tal abstraco com frequncia
necessria nos estgios iniciais do estudo de qualquer campo do conhecimento. Uma ve z
alcanado o domnio do MCRL, pode-se descobrir o que acontece se uma ou mais de suas
hipteses no forem satisfeitas.

13

III.

CASOS PRTICOS

1. TESTE DE HIPTESE E INTERVALOS DE CONFIANA;


Para abordagem do teste de hiptese, importa fazer meno a conceitos
fundamentais como:
distribuio de probabilidade,
erros do tipo I ,
erros do tipo II,
intervalos de confiana,
poder de um teste estatstico e
a) O INTERVALO DE CONFIANA
Recordando a estatstica II:
O melhor intervalo para um parmetro ser aquele para o qual a probabilidade de conter
o valor do parmetro a maior:
Pa b
Exemplo da mdia populacional:
Pa b
X
VF
~ N ;
(Varivel fulcral)

P z VF z

P z
z


P z
X z

n
n


P X z
X z

n
n


P X z
X z

n
n


P X z
X z

n
n

I X z ; X z
n
n

I
e z

X z

(Margem de erro)
X e

14

Voltando a matria de econometria:


Admita que queiramos descobrir quo prximo i de i , para isso tentamos
descobrir dois nmeros positivos, e , onde posiciona-se entre 0 e 1, de modo a
que a probabilidade de o intervalo aleatrio 2 ; 2 conter o verdadeiro 2 de
a 1 - .

Pr( 2 2 2 ) 1

Equao 28

Porm note que a equao acima apresentada, reflecte um intervalo aleatrio, j

que 2 um parmetro desconhecido, a no ser que tenhamos uma amostra especifica e


obtivermos um valor especifico de .
2

Conhecido o estimador dos mnimos quadrados, calculados luz dos


pressupostos bsicos do modelo clssico; normalmente distribudo com esperana nula
e varincia conhecida, e consequentemente o desvio padro, a estatstica de t seguindo a
distribuio de t student calculada do seguinte modo:

i i
estimador parmetro

erro padro estimado do estimador


ep i

Equao 29

onde t segue uma distribuio de n-2 gl , portanto, em vez de usarmos a


distribuio normal, usamos as distribuio de t estabelecendo um intervalo de
confiana para 2 tal como se segue:
Equao 30
Pr(t 2 t t 2 ) 1
onde t 2 o valor da varivel i obtido da distribuio t para o nvel de
significncia

e n 2 graus de liberdade; tambm chamado por t critico que se


2
pode encontrar na tabela.

i
Pr t 2 i
t 2 1
Equao 31
ep i

Assim que se desejar calcular o intervalo de confiana, tomar a frmula:

i t 2 ep i

Equao 32

A interpretao deste intervalo dada pelo intervalo de confiana de 95% ao


longo prazo, tal que 95 a 100% dos intervalos como (0,4268; 0,5914) contero o
verdadeiro 2 . Sabe-se ainda que a amplitude do intervalo de confiana proporcional
ao erro padro do estimador. Quanto maior este for o erro padro maior ser a amplitude
do intervalo.

b) FRMULAO DAS HIPTESES NULAS E


ALTERNATIVAS
A questo da formulao das hipteses estatsticas, relaciona-se aos casos nos
quais, dada uma observao, nos perguntamos at que ponto ela compatvel com a
15

hiptese previamente formulada. Estatisticamente a hiptese formulada conhecida


como hiptese nula H 0 . Geralmente ela testada seguida de uma hiptese alternativa
H A por vezes tambm designada por hiptese sustentada.
Exemplo:

H0 : 2 0

H A : 2 0

Equao 33

Uma vez construdo o intervalo ou detectado os valores crticos para o nvel de


significaria achado pertinente, caso 2 cair na rea de 100(1 )% , no rejeitar a
hiptese nula. Porm caso cair fora, na considerada rea critica, deve-se rejeitar a H 0 .
Este tipo de teste um teste bicaudal.

Equao 34 Intervalo de Confiana de 100 (1- )% para 2

Quando rejeitamos a hiptese nula, dizemos que estamos em presena de


resultados estatisticamente significantes. Porm, quando no rejeitamos, os resultados
no so estatisticamente significantes.
Tabela de Deciso para o Teste de Hiptese
Tipo de hiptese
H 1 : Hiptese
H 0 : Hiptese Nula
Alternativa

Regras de deciso:
rejeitar H 0 : se

2 *2

t t / 2,gl

2 *2

2 > *2

t t / 2,gl

2 *2

2 < *2

t t / 2,gl

Duas caudas

2 =

Cauda a direita
Cauda a Esquerda

*
2

Onde beta asterisco o valor numrico hipottico


c) A ESCOLHA DO NVEL DE SIGNIFICNCIA
A rejeio ou no da hiptese nula, depende em grande parte da escolha do nvel
de significncia ou seja do valor ou a probabilidade de cometer o erro do tipo I- a
probabilidade de rejeitar a hiptese verdadeira. Quando o erro do tipo II a
probabilidade de aceitar a hiptese falsa.
A literatura sugere maior ateno nos erros do tipo I. Geralmente,
geralmente fixado entre 1% a 5%, no mximo chega-se at 10%. Quanto maior for a
probabilidade de se rejeitar a hiptese nula tomando um intervalo de significncia
inferior quanto possvel, melhor.
Alguns autores consideram a arbitrariedade na escolha de , como sendo o
calcanhar de Aquiles da teoria clssica. A escolha do nvel exacto de significncia, diz
16

respeito ao valor ou ainda o valor da probabilidade; conhecido como nvel de


significncia exacto ou a probabilidade exacta de cometer-se um erro do tipo I.
Uma abordagem prtica sugere-nos de que, no devemos confundir significncia
estatstica com significncia prtica ou econmica. Goldberg advertiu que quando se
estabelece uma hiptese nula de que j 1 significa dizer que que o parmetro beta
seja mais prximo possvel de 1. Assim que em determinados casos, o teste estatstico
resume-se em valores to prximos como por exemplo 1,1. A estatstica apenas mede o
coeficiente estimado em relao ao seu erro padro, que todavia no so unidades
apropriadas para medir o comportamento econmico. Assim que, o termo
significncia usado mais para exprimir o nvel de fiabilidade dos dados estatsticos,
quando a substancialidade usada para efectuar o juzo econmico advindo
2.

DIAGNOSTICO BSICO DA ANLISE DE REGRESSO


a) ESTATSTICAS DE T

A estatstica de t o indicador tomado para testar o grau de significncia


estatstica de um simples coeficiente ou estimador. Requer para o efeito que
conheamos o valor estimado do estimador, requer que tenhamos a hiptese nula
devidamente identificada para que substituamos nela o valor de i , assim como requer
que conheamos o erro padro.
i
estimador parmetro
t i

Equao 35
erro padro estimado do estimador
ep i
Lembre-se que para um caso estremo da hiptese nula, teramos

t i 0 ep i

b) ESTATSTICA DE F
O teste de F usado para testar a significncia global do modelo isto no
obstante o nmero de parmetros existentes no modelo. Vejamos como derivar a
estatstica de F tomando a nossa funo de regresso. Coeficiente de determinao;
Consideremos

nos seus desvio em relao a mdia:


apresentamos a funo de regresso Yi Y
i
i

Y Y Y Y Y Y
2

Equao 36

teremos assim teremos a representao dos desvios em relao a mdia:

y 2 d 2

note que sendo d 2 a representao da componente residual, e querendo ns


eliminar esta, introduziremos transformaes no modelo tal que:

y
d

2
2

2
2

2
2

y
d

2
2

2
2

Equao 37

17

onde

y
F
d

2
2

2
2

1 alternativamente, podem se encontrar outros

desdobramentos do teste F como sendo:


c) ANLISE DA MUDANA ESTRUTURAL COM O
TESTE DE CHOW
O teste de Chow, uma verso do teste de F. Trata-se de um cenrio no qual o
modelo sujeito a restries. As restries submetidas a um modelo podem obedecer
vrias formas, desde os parmetros do modelo, especificao ao tamanho da populao.
No teste de chow, procuramos saber at que ponto o nvel de significncia global
do modelo sofre alteraes ao longo do tempo. O teste de Chow respeita algumas
propriedades bsicas dentre as quais:
1. it ~ N(0, 2 ) o resduo normalmente distribudo com esperana nula e
varincia conhecida;
2. it ; jt os erros de perodos distintos distribuem-se de forma
independente, quer dizer que no esto correlacionados.
Para o efeito, tomamos a populao em estudo e fixamos um perodo de
referncia no qual achamos estar caracterizado com um acontecimento especfico, seja
de poltica econmica ou secular. Assim a populao inicial reparte-se em dois
perodos, sendo I = n 1 e II= n 2 permitindo-os estimar separadamente. Os passos a seguir
seriam:
1. 1 Passo efectuamos uma regresso inicial combinando os dados todos,
digamos I = n 1 e II= n 2 ; com os graus de liberdade ( n 1 + n 2 -k) , onde k
o nmero de parmetros estimados. O objectivo consistir na
determinao do quadrado da soma dos resduos S1 .
Yi 1 2 X i i

Equao 38

3. 2 Passo estimamos em separado as regresses compreendendo os


perodos I = n 1 e II= n 2 com os graus de liberdade ( n 1 -k) e ( n 2 -k)
igualmente determinamos a soma do quadrado residual SQR, S 2 e S 3 .
De seguida, somamos os quadrados do resduo S4 S2 S3 com os
graus de liberdade ( n 1 + n 2 -2k).
Yi 1 2 X i i
n1

Equao 39

t=1,2, ....

Yi 1 2 X i i
n2

Equao 40

t=1,2, ....

4. 3 Passo Obtemos a diferena entre a SQE da primeira regresso e da


soma das duas regresses em separado. S5 S1 S4

18

monta-se assim o teste de chow:

S5
F

S4

n 1 n 2

Equao 41

2k

Conhecendo os graus de liberdade dados por (K;n1+n2-2k) vamos para tabela


estatstica e tomamos o valor critico dado o nvel de significncia (5%
preferencialmente). Se o valor de F calculado exceder o valor crtico, rejeitamos a
hiptese de que as regresses I e II so semelhantes, isto que dizer que existe mudana
estrutural no comportamento da varivel
d) O COEFICIENTE DE DETERMINAO
Por definio, o coeficiente de determinao, o rcio entre a soma do quadrado
do erro e a soma do quadrado total
SQE 2 y i x i
Equao 42
R2

SQT
y i2
o que em outra palavras significa perguntar, em que nvel a varivel dependente capta a
informao proveniente das variveis independentes. Quando este indicador aproximase a 1, significa dizer que o modelo afigura-se poderoso e estatisticamente significante.
Quando o indicador baixo, pressupe dizer que existem outras variveis que explicam
de melhor forma o modelo.

IV.

A REGRESSO MLTIPLA

A Regresso Mltipla um dos modelos mais utilizados no tratamento de sries


temporais. A anlise de Regresso Mltipla uma metodologia economtrica de
previso de valores da varivel dependente tendo com base um conjunto de variveis
explicativas.
Sua aplicao importante porque possibilita que se estime o valor de uma varivel
com base num conjunto de outras variveis. Quanto mais significante for o peso de uma
varivel isolada, ou de um conjunto de variveis explicativas, melhor poder-se- afirmar
os factores que afectam mais o comportamento de uma varivel de resposta
especificamente procurada, do que outros.
O formato da equao de Regresso Linear Mltipla :

Onde :
Y a Varivel Dependente;
Corresponde aos coeficientes tcnicos atrelados s variveis Independentes;
19

as Variveis Independentes
1.

PRESSUPOSTOS BSICOS;

Os pressupostos bsicos a serem observados na regresso mltipla, dizem respeito


aos abordados no modelo clssico, porem resumindo-se em 5 hiptese bsicas.

Notao Escalar
1.

2.
3.

E( i ) 0

para cada i

E( i j ) 0

onde i j
2
X 2 , X 3, X k so no estocsticos e fixos.

4. No h nenhuma relao linear exacta entre as


variveis X, ou seja nenhuma multicolinearidade
5. Para testar hipteses assumimos que:

i ~ N(0, 2 )

2.

Notao Matricial
1. E() 0 em que u e 0 so vectores coluna
nx1, sendo 0 um vector nulo.
2. E() I em que I uma matriz
identidade n x n
2

3. A matriz n x k, X no estocstica, ou seja


formada por um nmero de conjuntos fixos

4. O posto (rank) de X (X) k em que k o


nmero de colunas em X e k menor que o
nmero de observaes n.
5. O vector u distribudo normalmente
multivariedade isto

i ~ N(0, 2 I)

INFERNCIA A VERSO MATRICIAL DA REGRESSO MLTIPLA

Uma abordagem mais realista do modelo de regresso mltipla, sugere-nos o uso


de matrizes devido ao facto de maior parte dos modelos implicarem a incluso de k
variveis.
Seja:
Yi 1 2 X2i 3X3i ... k Xki u i
onde i 1, 2, 3, ..., n
Equao 43
Onde beta um o intercepto, e os demais betas so os coeficientes parciais. u o erro
tomando um comportamento aleatrio.
Adicionalmente, a equao pode ser apresentada sob forma de um sistema de
equaes e posterior sob forma de um sistema de equaes.
Y1 1 2 X 21 3X 31 ... k X k1 u1

Y2 2 2 X 22 3X 32 ... k X k 2 u 2
................................................................
Yn n 2 X 2 n 3X 3n ... k X kn u n
Segue-se a forma matricial:
1 X 21 X 31 ... X k1 1
Y1
u1
X X

u
1 22 32 ... X k 2 2
2
2
. . . . ... . . .
. . . ... . .
.
.
1 X X ... X
Y
u
kn nXk k kX1
n nX1 2 n 3n
n nX1

Equao 44

Equao 45

Podendo ainda assumir a forma matricial reduzida:


20

X u

nx1

nxk kx1

Equao 46

nx1

Onde
y=n X 1 um vector coluna da varivel dependente
X=n X k a matriz das variveis independentes,
B=k X 1 vector coluna dos parmetros por estimar.
u=n X 1 vector coluna nos n erros(distrbios).
Efectuamos assim o clculo dos estimadores dos mnimos quadrados ordinrios
(MQO):
Yi 1 2 X 2i 3X3i ... k X ki u i
Equao 47
Assim teramos a equao do resduo quadrado
2
u 2i
Y X X ... X

2i

3i

ki

Equao 48

Matricialmente teramos a equao representada do seguinte modo:


Equao 49
u u y' y X ' y
Equao 50
1
XX Xy

3.

Equao 51

INFERNCIA AO MTODO DE CRAMMER PARA A MATRIZ INVERSA

O mtodo de Crammer recorrido apenas com o interesse de determinar-se quer


os parmetros como a matriz inversa da matriz produto das variveis exgenas
1
XX Xy considerando ser elemento determinante para o clculo do vector dos
estimadores.
Nesta seco seria mais sensato que voc desse uma vista aos velhos
conhecimento de lgebra linear em como determinar a matriz inversa. Todavia, eu
apresentar-lhe ei aqui os passos bsicos, visto que o conhecimento da matriz inversa
faz-se necessrio.

PARA O CLCULO DOS PARAMETROS


21

A regra de Crammer requer que a Matriz A tenha uma soluo nica, tal que
X (x1 ,......, x n ) de um sistema de ordem n x n Ax b .
Tal que x i

det B i
onde B a matriz A com o membro direito igual a b
det A i

Assim para um modelo:


a 11x 1 a 12 x 2 a 13 x 3 b1
a 21x 1 a 22 x 2 a 23 x 3 b 2

Equao 52

a 31x 1 a 32 x 2 a 33 x 3 b 3

o que seria mo mesmo dizer


a 11 a 12 a 13 x 1 b1


a 21 a 22 a 23 x 2 b 2
a

31 a 32 a 33 x 3 b 3
Note que embora a simbologia no seja proporcional ao modelo de regresso,
quando no modelo de regresso precisamos calcular o vector beta, aqui o vector beta
corresponde a ao vector x quando a matriz dos a corresponde a matriz de x no
modelo de regresso.
Assim sendo, a regra de Crammer pressupe que:
b1

x1 b 2
b
3

a 12
a 22
a 32

a 11 a 12

x 2 a 21 a 22
a
31 a 32

a 13 a 11 a 12

a 23 a 21 a 22
a 33 a 31 a 32

a 13

a 23
a 33

b1 a 11 a 12

b 2 a 21 a 22
b 3 a 31 a 32

a 13

a 23
a 33

a 11 b1

x 2 a 21 b 2
a
31 b 3

a 13 a 11 a 12

a 23 a 21 a 22
a 33 a 31 a 32

a 13

a 23
a 33

Logo, conhecendo a matriz inversa, o resto reduz-se numa multiplicao.

PARA O CALCULO DA MATRIZ INVERSA


Poder recorrer a esta opo, calculando a matriz inversa e depois fazer o uso da
frmula obtida no desdobramento dos MQO na verso matricial.
A frmula para o clculo :

A 1

1
Matrix Adjunta A
det A

Equao 53

Um exemplo da Regra de Crammer:


2 4 5

A 0 3 0
1 0 1

22

primeiro passo, encontrar o determinante da matriz, assegurando que A 0 para


que exista um soluo nica.
Do calculo ficamos a saber que A 9
Segundo passo, determinamos a matriz dos co-factores:

c11
c 21
c 31

3 0
0 1
4 5
0 1
4 5
3 0

c12

c 22

15

c 32

0 0
1 1
2 5
1 1
2 5
0 0

c11

c11

c11

0 3
1 0
2 4
1 0
2 4
0 3

3
4
6

Matriz Adjunta A seria igual a:


C11

adj A C12
C
13

C 21
C 22
C 23

C 31

C 32
C 33

Note que esta matriz foi transposta; temos primeiro expressas as colunas depois as
linhas, contrariamente ao pressuposto normal, o que nos leva a afirmar que a a Matriz
adjunta, a matriz dos co-factores na sua transposta.

4.

INFERNCIA AOS EXPERIMENTOS DE MONTE CARLO

Os experimentos de Monte Carlo constituem um mecanismo que nos permite


colocar em teste a propriedade MELNV dos estimadores, procurando saber at que
ponto elas so validas.
Para melhor entendimento quanto a noo bsica dos experimentos de Monte
Carlo, apresentaremos em sntese um conjunto de passos sucessivos:
a) Considere uma funo de regresso populacional do tipo:
Y 1 2 X i i
b) Admitimos a hiptese que os parmetros reais so conhecidos, sendo: 1 =
20 e 2 =0,6.
c) Assumimos um tamanho da amostra de 25 observaes, assim como fixamos
os valores de X para cada observao.
d) Escolhemos 25 observaes aleatrias tomando uma distribuio normal
~ N(0, ) e chamamos estes de resduos i Considerando que o valor de 1 ,
2 , X i e i so conhecidos, implica dizer que podemos determinar o valor
de Yi
e) Agora, com o valor de Yi , e tomando os valores de X i , calcule uma
regresso para determinar , .
1

23

f) Imagine agora que voc repete o mesmo 19 vezes, tomando os valores de 1 ,


2 , X i , a medida que se forem criando aleatoriamente os valores de i ,
chagar ao ponto de obter 20 de , , ento, tomando estas observaes,
1

determinamos as mdia dos parmetros ficando com 1 , 2 . Se porventura


as medias encontradas forem iguais ou bem prximas aos valores iniciais de
1 e 2 , ento estes estimadores so de facto estimadores no viesados. Na
verdade este tipo de experimentos faz-se para 1000, 2000, 5000 ou muito
mais iteraes, geralmente com ajuda do computador.
g) Em sntese o mtodo de Monte Carlo o mecanismo prtico para testar as
hipteses: E 1 1 e de E 2 2

5.

OUTROS INDICADORES NA VERSO MATRICIAL


a) O TESTE DE F

Na verso matricial, a estatstica de F obedece os mesmos pressupostos


enunciados na verso escalar.
No entanto, a frmula para o clculo da estatstica de F conforme j foi dito, diznos qual o grau de significncia global do modelo. Geralmente, infere-se ao modelo
ANOVA (designado para o estudo da varincia), permitindo-nos analisar todos os
possveis de cenrios de significncia global do modelo.

Xy nY
k 1
F

yy Xy
2

Equao 54

nk

onde o teste segue a distribuio de F, com k-1 e n-k graus de liberdade.


Considerando a relao prxima entre o coeficiente de determinao e a
estatstica de F, podemos apresentar F como sendo:

k 1
F

1 R yy Xy
R 2 yy nY 2
2

nk

R2

k 1

1 R
2

Equao 55

nk

24

b) O COEFICIENTE DE DETERMINAO9
SQE X y nY 2
Equao 56
R

SQT
yy nY 2
Lembre-se que Xy nY 2 representa a soma do quadrado do erro SQE e
um escalar. Analogamente yy nY 2 representa a soma do quadrado total SQT
tambm um escalar.
2

c) O COEFICIENTE DE DETERMINAO AJUSTADO


O grande aspecto a considerar, que R 2 uma funo no decrescente em
ralao ao nmero de variveis independentes ou dos parmetros regressores presentes
no modelo. Conforme aumenta o nmero de regressores, R 2 tambm tende a aumentar.
Para resolver este problema, expurgamos o efeito dos graus de liberdade obtendo o
coeficiente de determinao ajustado:
i2
n k
R2 1
Equao 57
2
yi
n 1
curiosamente, repare que o que temos acima no nada mais do que os conceitos da
varincia do erro e a varincia de Y, logo podemos escrever:
2
R2 1 2
Equao 58
SY
mais alm, nota que ainda podemos manipular R 2 usando R 2 passando a ser:
n 1
Equao 59
R2 1 1 R2
n k
assim sempre que k>1 implica que R 2 > R 2

d) A VARINCIA E A MATRIZ VARINCIA


COVARINCIA
Considere o vector de estimadores dos mnimos quadrados ordinrios e faamos um
desenvolvimento preliminar:
1
X X X (X u )

X X X X X X X u
1

1
X X X u
implica que,
1
XX Xu

Equao 60

Determinemos agora a varincia da covarincia:


9

Lembre-se que anteriormente referenciamos que o coeficiente de determinao tambm pode ser
apresentado como:

2
i

yi2

R2 1

SQR
SQT
25

var cov( ) E

1
1
E X X X u X X X u

1
1
1
1
E XX Xuu XXX XX XEuu XXX

XX X IXXX
1

finalmente obtemos a matriz varincia covarincia:


1
var cov( ) 2 XX

Equao 61

na verdade a equao apresentar-se-ia do seguinte modo,


1

2 0

var cov( )
...

0 ... 0 n

1 ... 0 X 2 i
... ... ... ...

0 ... 1 X ki

X
X

2i
2
2i

...

ki

...
...
...

X 2i

...

X
X X

2 i ki
...

X ki2

ki

onde por obedincia das hipteses bsicas, apenas consideramos os valores da coluna
diagonal esquerda-direita, i.e. as varincias
Consequentemente, teremos:
var( 1 )
cov( 1 , 2 )

cov( 2 , 1 )
var( 2 )
var cov( )

...
...

cov( k , 1 ) cov( k , 2 )

... cov( 1 , k )

... cov( 2 , k )

...
...

...
var( k )

De seguida, para o clculo da matriz do erro padro teremos:


var( )
cov( 1 , 2 ) ...
cov( 1 , k )
1

cov(

)
var(

)
...
cov(

)
2
1
2
2
k
ep ( )

...
...
...
...

, ) ...
)
cov( , )
cov(

var(

k
1
k
2
k

onde sero vlidos apenas os elementos da diagonal. Note que voc encontrar alguns
valores negativos fora da diagonal (esquerda direita) e estes no tero raiz quadrada. ~

26

6.

EXERCCIO: ILUSTRAO

Dados:
Ordem

Qtid lbs

Pre $/lbs

Gastos em Propaganda $

1
2
3
4
5
6
7
8
9

55
70
90
100
90
105
80
110
115

100
90
80
70
70
70
70
65
60

5.5
6.3
7.2
7
6.3
7.35
5.6
7.15
7.5

10

130

55

7.15

11

130

50

6.5

Pretende-se:
1. Provar se os dados conferem com a equao abaixo:
tid 117.532 1.326X 11.237X
Q
i
i2
i3
i
2. Fazer o check up dos sinais esperados
3. Fazer o teste de t para cada parmetro.
4. Calcular o coeficiente de determinao sem tomar em conta os graus de
liberdade.
5. Interprete os resultados obtidos

RESOLUO:
Primeiro formulmos o modelo:
u1
55
1 100 5.50
u
70
1 90 6.30
2

u3
90
1 80 7.20

u4
100
1 70 7.00
u5
90
1 70 6.30 1


105 1 70 7.35 2 u 6
u
80
1 70 5.60

3 3 x1 7
u8
110
1 65 7.15
u
115
1 60 7.50
9

u10
130
1 55 7.15

13011x1 1 50 6.5011x 3
u11 11x1
Y

u
Calculo da Matriz quadrada XX das variveis exgenas.

27

1 100 5.50
1 90 6.30

1 80 7.20

1 70 7.00
1
1
1
1
1
1
1
1
1
1 1 70 6.30 11
780
73.55
1
100 90 80 70 70 70 70 65 60 55 50 1 70 7.35 780 57450
5163.5

5.5 6.3 7.2 7 6.3 6.35 5.6 7.15 7.5 7.15 6.5 1 70 5.60 73.55 5163.5 496.5975
1 65 7.15
1 60 7.50

1 55 7.15

1 50 6.50

Clculo da matriz inversa da matriz quadrada XX

das variveis exgenas

780
73.55
11

Seja A 780 57450


5163.5
73.55 5163.5 496.5975
Calculamos o determinante:

DET (A)=83815.75
Aplicar regra de Crammer neste momento segundo os passos:
Calcular determinante
Calcular a matriz dos coofactores
Calcular a matriz ajunta (transp cofactores)
Dividir pelo determinante de A
Elementos da Coluna 1
Elementos da Coluna 2
57450
5163.5
780
5163
c11
1867794.125
c12
7570.625
5163.5 496.5975
73.55 496.5975
c 21

780

73.55

7570.625

5163.5 496.5975
780
73.55
c 31
-197917.5
57450 5163.5

c 22
c 22

11

73.55

73.55 496.5975
11

73.55

780 5163.5

52.97

570.5

Elementos da coluna 3
780 57450
c13
-197917.5
73.55 5163.5
c 23
c33

11

780

73.55 5163.5
11

780

780 57450

570.5

23550

28

Montamos neste momento a matriz adjunta


1867794.125 7570.625 - 197917.5

Adj A 7570.625
52.97
570.5
- 197917.5
570.5
23550

Calculamos a matriz inversa, dividindo o determinante a transposta da matriz


adjunta.
1867794.125 7570.625 - 197917.5

1
1
A
52.97
570.5
7570.625
83815.75
570.5
23550
- 197917.5
Encontramos a matriz inversa:
22.2845244 0.090324611 - 2.361313402

1
A 0.0903246
0.000631981 0.006806597
- 2.361313402 0.006806597
0.280973445

Determinamos agora a matriz X y via multiplicao de matrizes, para computar o


vector dos parmetros.
55
70

90

100
1
1
1
1
1
1
1
1
1
1 90 1075
1


Xy 100 90 80 70 70 70 65 60 55 50 50 105 72950
5.5 6.3 7.2 7 6.3 6.35 5.6 7.15 7.5 7.15 6.5 80 7301.75

110
115

130

130

1
ok, conhecendo a frmula dos estimadores XX Xy , podemos calcula-los.
22.2845244 0.090324611 - 2.361313402 1075

0.0903246
0.000631981 0.006806597 72950
- 2.361313402 0.006806597
0.280973445 7301.75

Multiplicando obtm o vector dos estimadores:


124.7475407

1.295842369
9.698356216

E finalmente montamos a nossa funo estimada:


29

Qtidi 124.7475407 1.295842369Pi 9.698356216GPi i


Vamos agora calcular a varincia do erro:
u i2 u u yy X X 266.6220251 33.32775314
nk
nk
8

Sabendo que:
var cov( ) 2 (XX) 1

22.2845244 0.090324611 - 2.361313402

33.32775314 0.0903246
0.000631981 0.006806597
- 2.361313402 0.006806597
0.280973445

742.693128 3.010316 78.698163

var cov( ) 3.010316 0.021063 0.226849


78.698163 0.226849 9.364214

Assim teramos o vector do erro padro:


27.2523967

() 0.14512933
3.06010026

e as estatsticas de t que nos dizem qual o grau de significncia estatstica


4.578223
t ( ) 8.92888
3.169294

Neste momento, efectuamos o teste de hipteses para avaliar o resultado obtidos:

Como se pode observar, ao nvel de significncia todos os parmetros so


poderosa e estatisticamente significantes.
O Calculo do coeficiente de determinao:
Xy nY 2 110408.378 105056.8182
2
R

0.95254301
yy nY 2
110675 105056.8182

30

7. ILUSTRAO MICROSOFT EXCEL PARA CLCULOS ECONOMTRICOS

Parte A - Clculo Automtico


1. Considere que lhe foram dadas
13 observaes trimestrais da
quantidade onde as quantidades
procuras do referido preo
julgam-se depender dos gastos
com publicidade segundo os
dados descritos abaixo:

2. Para computar estes dados,


tenha-nos inseridos numa
folha de clculo, tal como se
visualiza na figura 1.
3. De seguida, v ao menu
Ferramentas e no final,
escolha Anlise de dados,
depois de aparecer a janela,
Analisar dados, escolha
Regresso, e de seguida,
insira os dados como se
visualiza na figura 2. Nota que
a figura dois possui as
referencias $B$1:$B$14,
$C$1:$D$14 que so as
coordenadas (coluna-linha)
dos dados para a varivel
dependente e para as
variveis independentes
respectivamente.

Data
1999-I
1999-II
1999-III
1999-IV
2000-I
2000-II
2000-III
2000-IV
2001-I
2001-II
2001-III
2001-IV
2002-I

Compras
340
330
370
350
380
380
400
210
390
400
410
230
420

Preo
Publicidade
$
48.00 $ 234.00
$
72.00 $ 256.00
$
96.00 $ 278.00
$
72.00 $ 300.00
$
48.00 $ 322.00
$ 144.00 $ 344.00
$
96.00 $ 366.00
$ 168.00 $ 388.00
$
96.00 $ 410.00
$ 144.00 $ 432.00
$
72.00 $ 454.00
$ 216.00 $ 476.00
$ 192.00 $ 498.00

Figura 1 Dados

4. Da figura 2, clicando OK, o resultado da analise de regresso para os


dados apresentados automaticamente representado na rea
comeando pela clula $C$17.- (Sempre que visualizar o $ entre coordenadas, ele usado para
fixar a clula). Assim sendo os seus resultados bsicos sero apresentados do
seguinte modo:

31

Figura 2 Janela de Insero de dados e definio de pressupostos

Figura 3 Resultados da Analise de Regresso

5. Em termos de apresentao da regresso tomaramos os principais


dados e apresenta-lo amos do seguinte modo. (Nota que existam varias formas
de apresentao dos dados, diferindo uma da outra):

Q i 286.59928 1.0204202Pi 0.4998118Pubi


(76.0136504)

(0.42838412)

(0.27444772)

R =0,36 %;
2

Onde os valores em parntesis representam o desvio padro. Algumas vezes, escrevemos directamente
as estatsticas de t para cada um dos coeficientes estimados (assumindo a hiptese nula)ao invs de
apresentar o desvio-padro.

Parte B Clculo Manual


Como resolver manualmente o exerccio acima exposto com ajuda do Excel?

32

1. Cria um ficheiro novo no Excel. V o menu Ficheiro, active guardar como, e


grave designando-o r-lienar
2. Introduza os dados no espao A1:D14
tal como consta na figura 1.
Alternativamente, voc poder fazer o download deste ficheiro no website;
3. Coloque o curso na Coluna C, e v ao menu Inserir, clique coluna criar-se h
uma coluna a esquerda do vector do preo.
4. Escreva Intercepto na clula C1, escreva 1 em cada clula de C2 a C14;
5. V para a clula B20, escreva Matrix X Transposta.
6. Seleccione a rea C2:E14, clique no menu Editar, active copiar, de seguida,
coloque o curso na clula C20 e v para o menu Editar, clique em colar especial.
Ver uma janela, clique na caixinha junto de transpor, e depois clique em OK.
Ter assim criada a matriz transposta das variveis independentes.
7. V para a clula B25, escreva XX, de seguida seleccione a rea (C25:E27),
clique na tecla F2 escreva =MATRIZ.MULT(C20:O22,C2:E14) de seguida clique
simultaneamente em na tecla Ctrl+Shift, com estas primadas, aperte a tecla
Enter, assim sendo voc ter a multiplicao da matriz transposta de X pela
matriz X.
8. V para a clula B29, escreva XX Inversa, seleccione a rea (C29:E31), clique
F2, escreva =MATRIZ.INVERSA(C25:E27), de seguida clique simultaneamente
em na tecla Ctrl+Shift, com estas primadas, aperte a tecla Enter
9. V para a Clula B34, escreva Xy, seleccione (C34:36) a rea posicione o
cursor, prima F2 e escreva =MATRIZ.MULT (C20:O22,B2:B14), de seguida
clique simultaneamente em na tecla Ctrl+Shift, com estas primadas, aperte a
tecla Enter
10. V para a clula B39, escreva Betas, seleccione a rea (C39:C41), prima F2 e
escreva =MATRIZ.MULT(C29:E31,C34:C36), de seguida clique simultaneamente
em na tecla Ctrl+Shift, com estas primadas, aperte a tecla Enter, voc ter
assim coeficientes no valor exacto dos clculos obtido acima.
11. Agora confira os seus resultados com os resultados da impresso no verso, para
averiguar se voc obteve os parmetros estimados conforme.

Q i 286.59928 1.0204202Pi 0.4998118Pubi


450
400
350
300
250
200
150
100
50

2002-I

2001-III

2001-II

2001-I

2001-IV

Y estimado

2000-IV

2000-III

2000-II

2000-I

1999-IV

1999-III

1999-II

1999-I

33

V.

FORMAS FUNDAMENTAIS DOS MODELOS DE REGRESSO

Ao mudar unidades de medida das variveis dependente e/ou independente, estimativas


de MQO so afectadas.
Se a varivel dependente multiplicada pela constante c(cada valor na amostra
multiplicado por c), ento as estimativas de MQO de intercepto e de inclinao
tambm so multiplicadas por c.
Se a varivel independente dividida (ou multiplicada) por alguma constante
diferente de zero (c) ento o coeficiente de inclinao de MQO multiplicado (ou
dividido) por c, respectivamente.
Mudar as unidades de medida da varivel independente no afecta o
intercepto.
O grau de ajuste do modelo (R2) no depende das unidades de medida das
variveis.
Formas funcionais populares usadas em economia podem ser incorporadas anlise de
regresso.
At agora foram analisadas relaes lineares entre as variveis dependente e
independente.
No entanto, relaes lineares no so suficientes para todas as aplicaes
econmicas e sociais.
fcil incorporar no-linearidade na anlise de regresso simples.

1.1 Modelo Nvel Nvel (Modelo Lin-lin)


Suponha que a varivel dependente e varivel independente que se quer analisar esto
tanto na forma de nvel. Por exemplo se quisermos saber o efeito sobre os salrios de
uma ano extra de educao, e que os dados disponveis permitem estimar a seguinte
equao:

Neste caso, o coeficiente da varivel analisada pode ser interpretado como o efeito
marginal. O efeito marginal a forma como a varivel dependente muda quando as
mudanas de variveis independentes por uma unidade adicional mantendo todas as
outras variveis na equao constante (isto , calculando a derivada parcial) ou:

Portanto, Bj pode ser interpretado como a variao dos salrios a partir de um aumento
de uma unidade (ou mudana de estado se varivel dummy) de Xj mantendo todas as
outras variveis independentes constantes.
34

Exemplo:
Com base nos dados utilizados nesta regresso, um ano adicional de educao
corresponde a um aumento nos salrios de 0,75 USD/horas. Da mesma forma, um ano
de experincia est associada a um aumento de 0,3 USD/hora no salrio, mantendo-se
as demais variveis constantes.
1.2 Modelo Log- Log
Considere interpretar coeficientes de uma regresso em que a varivel dependente e
independente a analisar esto na forma de log. Os coeficientes j no podem ser
interpretados como efeitos marginais. Supes que a teoria econmica sugere estimativa
da nossa equao de salrios com a varivel dependente na forma log
e incluso de horas de trabalho voluntrio da comunidade por semana (Comm), tambm
em forma de log. A equao de anlise agora :

Gostaramos de interpretar o coeficiente sobre a varivel voluntrio da comunidade


(B4). Para entender melhor a interpretao, considere o diferencial da equao acima
mantendo todas as variveis independentes constantes, excepto Commi.

Uma vez que:


Ento podemos ter:

Onde o lado esquerdo a elasticidade (parcial) de W em relao ao Comm. A


elasticidade a razo entre a percentagem de alterao numa varivel para a
percentagem de alterao em uma outra varivel. O coeficiente de regresso uma
elasticidade parcial, j que todas as outras variveis da equao so mantidos
constantes.
Portanto, B4 pode ser interpretado como a variao percentual no salrio por hora de
um aumento de um porcento em horas de trabalho voluntrio da comunidade por
semana mantendo-se a educao, idade e experincia constantes.

35

Com base nestes resultados de regresso, um aumento de um por cento em horas de


trabalho voluntrio da comunidade por semana associada a um aumento de 1,2% no
salrio por hora.
1.3 Modelo Log- Nivel (Log Lin)
Na equao do modelo 1.2, a educao, idade e experincia esto em termos de nvel,
enquanto a varivel dependente (salrio) , em termos de log.
Gostaramos de interpretar os coeficientes dessas variveis. Primeiro, considere
educao. Leve o diferencial mantendo todas as outras variveis independentes
constantes.

Multiplicandos os dois lados por 100 e reorganizando teremos:

Portanto, 100 x B1 pode ser interpretado como a variao percentual de aumento Wi


unidade em Edi, mantendo todas as outras variveis independentes constantes.
Derivaes similares podem derivar da interpretao para os coeficientes da idade e
experincia.
Considerando o modelo estimado no ponto 1.2, podemos dizer o seguinte: mantendo
todas as outras variveis independentes constantes, um ano adicional de escolaridade
est associado a um aumento de 24% no salrio por hora. Da mesma forma, um ano
adicional de experincia associada a um aumento de 16% no salrio por hora.
1.4- Modelo Nivel-Log (Lin-Log)
Considere-se uma regresso em que a varivel dependente , em termos de nvel e a
varivel independente de interesse em termos de log. Por exemplo, considere a
seguinte equao:

Lembre-se da seco de regresses de nvel-nvel que os coeficientes de educao,


idade e experincia podem ser interpretados como efeitos marginais. Gostaramos de
interpretar o coeficiente de horas de trabalho voluntrio da comunidade (B4). Mais uma
vez, levar o diferencial de ambos os lados, mantendo todas as variveis independentes
constantes excepto trabalho de voluntrio da comunidade.
36

Dividindo os dois lados por 100 e reorganizando podemos ter:

Ento:

Pode ser interpretado, interpretado como o aumento do salrio por hora de um aumento
de um porcento de trabalho voluntrio da comunidade.

Portanto, mantendo-se a educao, idade e experincia constante, um aumento de um


porcento de trabalho voluntrio da comunidade est associado a um aumento de 0,132
dlares em salrios por hora.

Podemos sumarizar os modelos no seguinte quadro:

37

VI.

RELAXANDO AS HIPTESES BSICAS DO MODELO


1. A MICRONUMEROSIDADE E MULTICOLINEARIDADE

O termo Multicolinaridade foi introduzido por Ragner Frisch para ilustrar a


existncia de uma perfeita ou exacta relao linear entre variveis independentes de um
modelo.
Existe uma relao linear exacta quando:

1X1 2 X 2 3 X 3 ..... k X k 0

Equao 62

onde 1 , 2 .... k so constantes do modelo mas que todavia nem todas so iguais a zero.
comum encontra-se modelos com multicolinearidade porem no em situao de
colinearidade perfeita

Quando estamos em presena de multicolinearidade perfeita, os coeficientes da


regresso tornam-se indeterminveis e o erro padro tende para o infinito. Se a
multicolinearidade menos que perfeita, a tendncia to somente de observar-se um
alto erro padro o que traduz a dificuldade de estimao do erro padro.
Um aspecto importante a fazer meno que ainda que o modelo observe alta
multicolinearidade, este facto no afecta as propriedade bsicas dos estimadores dos
mnimos quadrados ordinrios. Eles mantm MELNV. De facto Cristopher Achen
salienta:
Estudantes principiantes de metodologia s vezes se preocupam com o
facto de suas variveis independentes estarem correlacionadas - o assim
chamado problema da multicolinearidade. Mas a multicolinearidade no viola
nenhuma hiptese de regresso. Estimativas no-viesadas e consistentes vo
ocorrer, e seus erros-padro sero correctamente estimados. O nico efeito da
multicolinearidade tornar difcil a obteno de estimativas de coeficientes com
pequeno erro-padro. Mas ter um nmero pequeno de observaes tambm tem
esse efeito, assim como ter variveis independentes com pequenas varincias.
(Na verdade, em nvel terico, multicolinearidade, poucas observaes e
pequenas varincias nas variveis independentes so, basicamente, o mesmo
problema.) Assim, "O que devo fazer com a multicolinearidade?" uma questo
semelhante a "O que devo fazer se no tiver muitas observaes?". Nenhuma
resposta estatstica pode ser dada.

38

a) FONTES DA MULTICOLINEARIDADE
Montogomery e Peck, tero desenvolvido um trabalho extensivo no qual
possvel identificar as potenciais fontes da multicolinearidade:
1. O mtodo usado na colheita de dados: sobretudo quando consubstanciase numa gama limitada de observaes tende a traduzir-se em relaes
colineares no pressuposto de que tomando o comportamento de
determinadas sries em tamanhos ou intervalos de tempo curtos, nunca
chega a ser suficientemente explicativo para captar as tendncias reais de
mudana;
2. Restries impostas ao modelo: costuma-se usar o exemplo da relao
rendimento e consumo de electricidade, partindo do pressuposto de que
escales de baixo rendimento tendem a associar-se com habitaes
restritas em termos de espao e consequentemente no consumo de
energia;
3. Mispecification Bias: Quando as variveis a incluir no modelo no forem
devidamente especificadas ou quando o modelo possui um numero de
parmetros superior ao tamanho da populao (observaes).

b) PRESENA, DETENO E MEDIDAS


CORRECTIVAS
Como detectar a multicolinearidade constitui uma das questes preocupantes
para principiantes em econometria. De facto a existncia ou a no existncia da
multicolinearidade no deve constituir preocupao. O que mais deve preocupar so os
distintos nveis da multicolinearidade;
Veremos alguns indicadores bsicos que nos permitem induzir a existncia da
multicolinearidade:
1. Alto coeficiente de determinao e poucos parmetros afigurando-se
estatisticamente significantes: Geralmente toma-se como referencia
80%, e em muitos dos casos o teste de F rejeita a hiptese nula de
simultaneidade dos coeficientes parciais;
2. Correlao elevada entre dois a dois parmetros: se computando o
grau de correlao entre dois a dois parmetros vislumbra-se num
coeficientes de associao acima de 80% constitui uma pista para
suspeitar a existncia de alto nvel de colinearidade; Argumenta-se
tambm que para alguns casos a colinearidade pode existir mesmo em
situaes em que o grau de correlao de ordem zero entre variveis
baixo.
3. Regresses auxiliares: outra tcnica pertinente para deteno da
existncia de multicolinearidade tem sido computar regresses auxiliares
de cada varivel independente sobre as demais e o consequente calculo
do coeficiente de determinao para averiguar o grau de ajustamento do
modelo.

39

Conhecidas as fontes e detectada a presena da multicolinearidade, que


mediadas correctivas? A multicolinearidade essencialmente um problema de amostra,
o que torna simples identificar a s medidas correctivas para livrar-se dela.
1. A informao a prior constitui um factor determinante na medida em
que a percepo do tipo de variveis em causa ou o tipo de questes que
se tenham colocado num inqurito especfico, tendem a fornecer um foco
de correco; Exemplo, o modelo de determinao do consumo como
funo do rendimento pessoal disponvel e da riqueza um dos casos de
alta associao.
2. O tamanho da amostra, conforme j abordado, sempre que for possvel
incrementar o tamanho da amostra, para alguns dos casos tende a
expurgar o efeito colinear entre determinadas variveis;
3. Re-especificao do Modelo: por vezes possvel num determinado
modelo ter variveis redundantes, uma vez retiradas, o grau de
significncia estatstica do modelo no sofre grandes alteraes; Tambm
associam-se nestes casos a especificao correcta do modelo.
Exemplo:
O modelo correcto previsto dado por:

Yi i 2 X 2i 3 X 3i i

Equao 63

todavia ns especificamos o modelo da seguinte maneira:

Yi i 12X 2i i

Equao 64

quando sabe-se afinal de contas que: E12 2 3 32 onde 32 o


ngulo de inclinao das variveis X2 e X3. Consequentemente, ocorrer
que a 12 ser um estimador enviesado de 2 desde que 32 seja
diferente de zero.
4. A Transformao de variveis: Ocorre para muitas variveis no
estacionrias, geralmente quando estas apresentarem um comportamento
com trend tal que usando o exemplo do rendimento e consumo, a
tendncia de ambas as variveis seguem a mesma direco. Estes caso
cria em certa parte um comportamento ilusrio que para alguns dos casos
traduz-se em multicolinearidade. A transformao de variveis muitos
casos consiste na aplicao de logaritmos para abrandar o
comportamento do trend ou no clculo da primeira diferena.

Yi i 2 X 2i 3 X 3i i

Equao 65

aplicando uma desfazem , teramos

Yt 1 i 2 X 2 t 1 3 X 3t 1 t 1

Equao 66

consequentemente, a diferena de ambas as funes seria:

Yt Yt 1 2 X 2 t X 2 t 1 3 X 3t X 3t 1 v t

Equao 67

5. A combinao de dados de corte (cross-secionais) e sries temporais,


embora seja um artifcio um pouco complexo, constitui uma das
sugestes pertinentes para resoluo do problema;
40

c) CONSEQUNCIAS PRATICAS DA
MULTICOLINERARIDADE
1. No obstante continuarem sendo MELNV, os estimadores dos mnimos
quadrados ordinrios tendem a produzir varincias e covarincias com
um tamanho bastante alto, difceis de serem estimadas;
2. Consequentemente, os intervalos de confidncia tendem a ser bastante
largos forando a imediata aceitao da hiptese nula (de que o
coeficiente da populao real igual a zero);
3. Existe uma tendncia das estatsticas de t de cada coeficiente,
mostrarem-se estatisticamente insignificantes em contraste, o coeficiente
de determinao do modelo R 2 tende em muitos dos casos para um
valor prximo de 100% demonstrando que o modelo estimado ajusta-se
ao modelo real;
4. Pequenas alteraes nos dados estatsticos deixam os estimadores e os
desvios-padro bastante sensveis a mudanas.

41

2. ELEMENTOS CHAVE10 DA MULTICOLINEARIDADE


1. Uma das hipteses do modelo clssico de regresso linear a de que no haja
multicolinearidade entre as variveis explicativas, os Xs. Interpretada a grosso modo,
multicolinearidade se refere situao em que h uma relao linear exacta ou
aproximadamente exacta entre as variveis X.
2. As consequncias da multicolinearidade so estas: se houver uma colinearidade perfeita
entre os Xs, seus coeficientes de regresso sero indeterminados e seus erros-padro
no sero definidos. Se a colinearidade for alta, porm no perfeita, a estimativa dos
coeficientes de regresso ser possvel, mas seus erros-padro tendero a ser grandes.
Como resultado, os valores dos coeficientes na populao no podem ser estimados
precisamente. Porm, se o objectivo for estimar as combinaes lineares desses
coeficientes, as funes estimveis, isto pode ser feito mesmo na presena da
multicolinearidade perfeita.
3. Embora no haja nenhum mtodo infalvel para detectar a colinearidade, h diversos
indicadores dela, que so os seguintes:
(a) O indcio mais claro da multicolinearidade surge quando R 2 bastante alto, mas
nenhum dos coeficientes de regresso estatisticamente significativo segundo o
teste t convencional. Este caso, naturalmente, extremo.
(b) Nos modelos envolvendo apenas duas variveis explicativas, pode-se obter uma
ideia razoavelmente boa da colinearidade examinando-se o coeficiente de
correlao simples, ou de ordem zero, entre as duas variveis. Se esto
correlao for alta, geralmente a culpada a multicolinearidade.
(c) Os coeficientes de correlao de ordem zero, porm, podem ser enganadores em
modelos que envolvam mais de duas variveis X, pois possvel ter baixas
correlaes de ordem zero e, apesar disso, existir alta multicolinearidade. Em
tais situaes, talvez tenhamos de examinar os coeficientes de correlao parcial,
(d) Se R 2 for alto mas as correlaes parciais forem baixas, a multicolinearidade e
uma possibilidade. Aqui, uma ou mais variveis podem ser suprfluas. Mas se o
R 2 for alto e as correlaes parciais tambm forem altas, a multicolinearidade
pode no ser facilmente detectvel.
(e) Portanto, podemos regredir cada uma das variveis X. sobre as demais variveis
X no modelo e descobrir os respectivos coeficientes de determinao

10

Quanto a alnea (d) Alm disso, como destacaram C. Robert' Krishna Kumar,
John O'Hagan e Brendan McCable, h alguns problemas estatsticos com o teste
de correlao parcial sugerido por Farrar e Glauber.

42

3. A HETEROSKEDASTICIDADE VERSUS HOMOSKEDASTICIDADE


Uma das mais relevantes hipteses do modelo clssico, consiste no
comportamento homoscedstico da varincia do resduo ao longo do tempo
Var ( 2 ) 2 . (caracterstica bsica das sries temporais estacionarias). A questo
coloca-se de facto em questionar o que ocorre no modelo se esta hiptese for violada?
Na abordagem matricial, estaramos em presena da matriz do resduo, dada sob
forma de:

12

0
var() E()
...

0
22
...
0

... 0

... 0
... ...

... 2n

Equao 68

o que significa que ao longo do tempo, os erros de distintos perodos possuem


correlao nula, quanto aos erros do mesmo perodo correspondem a varincia.
(expressa na linha diagonal), e segundo o postulado clssico, esta varincia deve
assumir valores constantes. Contrariamente, estamos em presena da
heteroskedasticidade.
A figura abaixo uma ilustrao clara da alterao da disperso do resduo como
funo do tempo. Um caso comum sustentando a heteroskedasticidade o modelo das
expectativas racionais - na justificao de que a medida em que o tempo passa as
pessoas ajustam o seu comportamento com os seus erros, tal que as oportunidades de
cometer um erro tornam-se reduzidas. Para este caso, teramos por exemplo um grfico
semelhante ao debaixo. Porm, com a distribuio do resduo variando do sentido
inverso.
Um outro exemplo semelhante diz respeito a firmas de pesquisa. Estas tendem a
melhorar a tcnica de colecta de dados ao longo do tempo, tambm diz respeito a
redues graduais que se vo registando na componente do resduo.

Ilustrao 3: Perturbaes Heteroscedsticas

43

a) PRESENA, DETENO E MEDIDAS


CORRECTIVAS
Na presena de heteroskedasticidade, notamos que i2 2 afectando a prior a
frmula da varincia conforme visto anteriormente. Segundo, nas abordagens anteriores
fez-se meno ao facto de 2 ser um estimador linear no viesado MELNV desde que
as hipteses do modelo clssico sejam observadas.
At este ponto, o simples facto da violao da homoskedasticidade, no retira a
propriedade de MELNV. Todavia, ocorre que estes estimadores dos mnimos quadrados
ordinrios continuam sendo melhores e no viesados porm no mais so eficientes ou
seja, no possuem varincia mnima.
b) TESTES DE HIPTESES
Para a deteno da heteroskedasticidade, utilizam-se vrios mtodos dentre os
quais:
MTODOS INFORMAIS:

Mtodos Grficos: No existindo informao alguma, basta fazer um plot


do resduo em relao ao tempo ou em relao a varivel dependente, to
fcil podemos observar um comportamento (patetern) especifico que nos
permite perceber a variao do resduo em funo do tempo ou da varivel
dependente.

Ilustrao 4 Ilustrao de vrios padres de resduos quadrados estimados.


MTODOS FORMAIS:
Existem vrios testes para o efeito. O Teste de Gelser,Teste de Park , Teste de
Glejsere, Teste de Correlao de Spearman, Whites General Heteroscedasticity, Teste
de Goldfield Quandt.

Whites General Heteroscedasticity

Inicialmente computamos a regresso auxiliar do quadrado do erro nos valores de X, no


quadrado de X e nos produtos cruzados
u i 1 2 X 2i 3X3i 4 X 221 5X32i 6 X 2i X3i vi

Equao 69

de seguida computamos o coeficiente de determinao efectuamos o teste de hipteses.

44

2
n R 2 ~ df

Equao 70

Se o valor computado da estatstica for superior ao valor critico chi-square segundo os


graus de liberdade (sem o intercepto) Conclui-se que existe Heteroskedasticidade. Se
no exceder: ento 1 2 3 4 5 6 0 o que significa estar-se em presena
de homoskedaticidade.
Teste de Goldfield Quandt

SRQ 2 gl

SRQ 1 gl

u
u

2
mod elo1
2
mod elo 2

n
n

Equao 71

onde: SRQ= Soma do resduo quadrado


gl = graus de liberdade
Constitui passos para o emprego do presente teste:
o Organizar a amostra em ordem crescente a X
o Omitir m observaes centrais tal que (n-m) seja num nmero
par
o Dividir a amostra em duas regresses (n-m)/2
o Obter a soma dos resduos quadrados de ambas regresses
Se lambda for superior ao valor critico tabelado de F, segundo os graus de liberdade ((nc)/2)-k, rejeitamos a hiptese de homoscedasticidade; A varincia comporta-se
heteroscedasticamente.
c) O MTODO DOS MNIMOS QUADRADOS
GENERALIZADOS
Sempre que estivermos em presena da Heteroskedasticidade, o mtodo dos
mnimos quadrados ordinrios, no mais valido. Nestas circunstncias, fizemos
recurso ao mtodo dos Mnimos Quadrados Generalizados, um mtodo que consiste
na transformao do modelo com vista a poder estim-lo.
Vejamos um modelo com trs variveis:

Yi i 2 X 2i 3 X 3i i

Equao 72

podendo tambm ser escrito do seguinte modo

Yi i X 0i 2 X 2i 3 X 3i i

Equao 73

onde X 0i 1 suponha que seja conhecida a varincia i2 ento dividiremos a equao


anterior pelo desvio padro.

X
Yi
i 0i
i
i

X
2 2i

X
3 3i

i

i

Equao 74

o que facilita escrevermos o modelo como:


Yi* 1* X*0i *2 X*2i *3 X*3i *i

Equao 75

45

Neste momento as variveis sofreram uma transformao, tendo sido eliminado


o efeito da varincia heteroskedstica. Assim sendo, estamos em condies de estimar o
modelo aplicando os mnimos quadrados ordinrios. Assim:

var E( ) E i
i


*
i

* 2
i

var *i E( *i ) 2

Equao 76

1
1
E i2 2 i2 sabendo que E i2 i2
2
i
i

var *i E(*i ) 2 1

Equao 77
Equao 78

Onde a varincia dos mnimos quadrados ordinrios generalizados possuem


varincia semelhante a observada pelos MQO ou OLS, que de facto uma constante.

4. A AUTOCORRELAO
a) PRESENA, DETENO E MEDIDAS
CORRECTIVAS
A semelhana da heteroskedasticidade, na presena da autocorrelao os
estimadores dos MQO continuam sendo os melhores estimadores lineares no viesados
mas no mais possuem a varincia mnima entre todos os estimadores no viesados
O termo Auto-correlao significa correlao entre elementos da mesma srie ao
longo do tempo, todavia, o pressuposto do modelo clssico de que no deve existir
este tipo de perturbaes.
E( i j ) 0 quando i j

Equao 79

Todavia quando estivermos em presena deste tipo de perturbao,


contrariamente a hiptese clssica, teremos um cenrio de:
E( i j ) 0 quando i j

Equao 80

A ttulo de exemplo, num cenrio destes, a greve que ocorre neste trimestre
afecta o resultado do trimestre seguinte, ou seja um erro cometido durante um mandato
influenciar os mandatos seguintes. De facto este cenrio E( i j ) 0 o que mais
representa a realidade.
CAUSAS
Uma das caractersticas principais de determinadas sries temporais diz respeito
a Inrcia ou a rigidez. Isto ocorre muitas vezes com os ndices de preos, PNB,
emprego/desemprego e outras variveis que apresentam flutuaes cclicas ao longo do
tempo. Geralmente obedecem uma tendncia, de recesso para perodos de reanimao,
expanso e boom para depois voltar em baixo e seguir novamente o ciclo iterativo.
Outras vezes, a especificao errnea do modelo ou a omisso de determinadas
variveis de destaque, constitui razo de existncia da auto-correlao.
Tambm salientam-se casos como o fenmeno cobb-web (teia de aranha) no
qual a oferta de produtos agrcolas reage aos preos com uma defasagem de um perodo.

46

Oferta Bananas t 1 2 Pt 1
Equao 81
A manipulao de dados, sobretudo quando se tem dados brutos ao invs de
dados regulares. Circunstncias nas quais se tomam dados brutos de um trimestre e
calcula-se a mdia para criar sries mensais, em muitos dos casos factor causador de
auto-correlao.
Alguns autores como Tinter distinguem o termo auto-correlao do termo
correlao serial, embora nos paream ter o mesmo significado, existe uma pequena
diferena. A autocorrelao a srie desfasada consigo mesma segundo um nmero de
unidades de tempo. Quando o termo correlao serial diz respeito a defasagem de sries
diferentes.
NATUREZA AR(i) e MA(i)
Os modelos com auto-correlao na varivel dependente denomina-se modelos
auto-regressivos. Exemplo:

RN i 0 1RN t 1 2 Ci 3 I i t

Equao 82

uma representao mais comum, o caso da regresso do erro

u i t 1 t

Equao 83

onde o coeficiente de correlao. Neste contexto, o modelo pode ser designado


como modelo auto-regressivos de ordem um AR (1).
Quando estivermos em presena de uma funo do erro dependendo de
componentes com desfazagem, porem sendo estas perturbaes aleatrias com mdia
zero, dizemos que estamos em presena de um esquema de mdia mvel -MA (1)

u i t t 1

Equao 84

Tambm podemos representar modelos com combinaes AR e MA,


designando-os ARMA (1,1)

u i t 1 t t 1

Equao 85

MEDIDAS CORRECTIVAS
Em presena de auto-correlao, os estimadores continuam sendo MELNV
porm no mais possuem varincia mnima, o que quer dizer que deixam de ser
eficientes. Se utilizarmos a var( 2 ) AR1 , os intervalos de confiana tendem a ser muito
amplos, tornando difcil a rejeio da hiptese nula.
Considerando que o erro no conhecido, a questo da auto-correlao muitas
vezes fruto de especulaes. O remdio depende em grande parte do conhecimento
tido quanto as interdependncias entre as distintas variveis, pois lidaremos com duas
situaes, uma quando a estrutura da correlao conhecida, outra, quando ela no
conhecida.
Quando o coeficiente de correlao conhecido, tomaremos uma FRP valida no
perodo t todavia tambm no perodo t-1. tal que:

Yi t 2 X t t
47

Yt 1 i 2 X t 1 t 1

Equao 86

multiplicando a FRP desfasada pelo coeficiente de correlao em ambos os lados,


teramos.

Yt 1 i 2 X t 1 t 1

Equao 87

Subtraindo da funo primaria da equao 86 a da equao 87 teramos:

Yt Yt 1 i (1 ) 2 X t 2 X t 1 ( t t 1 )
Yt Yt 1 i (1 ) 2 (X t X t 1 ) t

Equao 88

agora assumimos um modelo


Yt* 1* *2 X *t t

Equao 89

no qual, Yt* (Yt Yt 1 ); 1* 1 (1 ); X*t (X t X t 1 )


Neste contexto, o resduo respeita todas as premissas bsicas dos MQO, sendo
possvel estimar a equao 89 sem risco de vis.
Sempre que tivermos conhecimento da dimenso da correlao, bastar aplicar
diferenas ao modelo, reduzindo-o para Yt 2 X t t , operao na qual ao aplicar
o operador da primeira diferena (delta) perdemos o intercepto. Nestas condies,
semelhantemente, podemos estimar o modelo fazendo recurso ao mtodo dos MQO.
b) TESTES DE HIPTESES
Durbin Watson
O teste de DW um dos testes tradicionais para testar a presena de autocorrelao. Ele baseia-se nos resduos e obedece uma distribuio estatstica especfica,
na qual so considerados os pontos de significncia superior e inferior. Quanto aos
graus de liberdade, o parmetro k no considera o intercepto da funo. O teste DW no
deve ser aplicado em modelos auto-regressivos. O teste tem a seguinte frmula de
clculo:
n

e
t 2

e t 1

Equao 90

e
t 1

2
t

Para o uso dos valores crticos tabelados de DW, devemos seguir o seguinte
diagrama que nos sugere em que circunstancias a correlao positiva, negativa, ou
quando que no possvel detecta-la.

Ilustrao 5 reas de deciso do teste de Durbin Watson

48

5. ELEMENTOS CHAVE DA AUTOCORRELAO


1.

A autocorrelao pode ocorrer por varias razes, pode ser derivada por inrcia ou rigidez das
sries temporais econmicas, vis resultante da omisso de variveis importantes, ou por uso
da forma funcional incorrecta, o fenmeno cobb-wed, a da teia de aranha ou ainda a
manipulao dos dados.

2.

Embora os estimadores de MQO permaneam no-viesados e consistentes na presena de


autocorrelao, eles deixam de ser eficientes. Como resultado, os testes de significancia t e F
usuais no podem ser legitimamente aplicados. Por isso, so necessrias medidas correctivas.
o remdio depende da natureza da interdependncia entre as perturbaes U t Mas como U t no
so observveis, a prtica comum supor que sejam geradas por algum mecanismo.
o mecanismo comummente suposto o esquema auto-regressivo de primeira ordem de Markov,
que supe que a perturbao no perodo corrente se relaciona linearmente com o termo de
perturbao no perodo anterior, sendo que o coeficiente de autocorrelao fornece o grau da
interdependncia. Este mecanismo conhecido como esquema AR(1).
Se o esquema AR(1) for vlido e o coeficiente de autocorrelao for conhecido, o problema da
correlao serial pode ser facilmente atacado por meio da transformao dos dados seguindo o
mtodo da diferena generalizada. O esquema AR(1) pode ser facilmente generalizado para um
esquema AR(p). Podemos tambm supor um mecanismo de mdia mvel (MA) ou uma mescla
dos esquemas AR e MA, conhecida como ARMA.
Mesmo que usemos um esquema AR(1), o coeficiente de autocorrelao p no conhecido a
priori. Examinamos vrios mtodos para estimar p, tais como d de Durbin-Watson, d modificado
de Theil-Nagar, mtodo de Cochrane-Orcutt (C-O) em duas etapas, mtodo C-O iterativo e o
mtodo de Durbin em duas etapas. Em grandes amostras, estes mtodos geralmente produzem
estimativas similares, mas no em pequenas amostras. Na prtica, o mtodo C -O iterativo se
tornou bastante popular.
Naturalmente, antes de corrigir a autocorrelao, preciso detect -la. H diversos mtodos de
deteco, dos quais o mais clebre a estatstica d de Durbin-Watson. Embora comummente
usada e rotineiramente produzida pela maioria dos pacotes de software, a estatstica d apresenta
vrias limitaes. Muitas vezes, a estatstica d indica no uma autocorrelao pura, mas sim um
vis de especificao ou o efeito ARCH.
Um modelo especial no discutido no nosso programa o modelo ARCH (Autoregressive
Conditional Heteroskedatic Model) , no qual a varincia condicional do termo de erro se
correlaciona serialmente com os valores passados do termo de erro elevados ao quadrado. Este
modelo provou ser muito til na modelagem e previso de muit as variveis financeiras, tais
como taxas de cmbio, taxas de inflao etc. Usar-lo-emos na cadeira de Mtodos de Previso.

3.
4.

5.

6.

7.

8.

49

VII.

TPICOS QUALITATIVOS

i. A REGRESSO DE VARIVEIS DUMMIES


No mbito da anlise de regresso, existem variveis que no so facilmente
quantificveis numa escala definida. Estas variveis quase frequentemente so
denominadas por variveis qualitativas, tambm designadas por variveis dummies. A
ttulo exemplificativo, num determinado modelo, mantendo todas as variveis
constantes, se estivermos a tratar do rendimento, notaremos que o sexo feminino tende
para alguns casos a auferir salrios inferiores aos seus colegas do sexo masculino.
Assim sendo, para a anlise do rendimento, veremos que este difere na medida em que
mudar o gnero. A este tipo de anlise, diz respeito o tratamento das variveis dummies.
As variveis qualitativas geralmente indicam a presena ou a ausncia de uma
qualidade ou atributo. Em termos numricos, elas assumem valores de 1 ou de 0,
servindo de indicadores alternativos variveis dicotmicas, variveis qualitativas,
variveis binrias.
1. INCIDNCIA NO INTERCEPTO
Tomemos como referncia um modelo de uma varivel, tendo o rendimento
salarial como funo dos anos de experincia acumulada. Nota-se porem que, no
obstante os anos de experincia, h sempre uma tendncia ao longo da populao,
encontrar valores que diferem, podendo estar por detrs varias causas como, origem
regional, etnia, raa, ou gnero.
Vejamos o modelo abaixo:
Equao 91
Yi i 2 Di X i ui 11
11

Nota que na verdade a incluso das variveis dummies implicaria ter as duas
categorias, para o caso do rendimento como funo da oferta de trabalho de
professores, incluiramos duas categorias, ilustrando a demanda de professores
quando tratam-se de homens e mulheres, tal que o modelo apareceria do seguinte
modo:

Yi i 2 D1i 3 D2i X i ui
D1i 1 se for hom em

Tal que teramos:

0 caso contrrio
D2i 1 se for mulheres
0 caso contrrio

Entretanto, devido ao problema da multicolinearidade,


no inclumos as duas
categoria, inclumos apenas uma, no principio de que tomando o numero de
categorias existentes, deveremos sempre deduzir uma. No nosso caso simples, a
excluso de uma categorias, ser coberta pela outra categoria na medida em que
o seus valores so exactamente o inverso da outra categoria.
Imagine que tivssemos uma amostra com trs observaes de homens, e
duas para mulheres, teramos a a apresentao do seguinte modo.

Homem
Homem
Mulher
Homem
Mulher

Y1
Y2
Y3
Y4
Y5

Intercepto
1
1
1
1
1

D1
1
1
0
1
0

D2
0
0
1
0
1

X1
234
434
325
543
278

Note que este modelo tem problemas de multicolinearidade, porque a soma


dos vectores D1 e D2 perfeitamente igual ao vector do intercepto, logo
estaramos em presena de colinearidade perfeita. Para este caso, devemos
excluir uma das variveis dummies, ou seja uma categoria da varivel dummy e
to logo poderemos estimar o modelo.
Quanto ao resultado da regresso saberemos a partida que o valor do
intercepto s ditaria os valores que a intercepto toma quando consideramos

50

Neste caso, a nossa varivel adicional expressa por D a varivel dummy. Esta
toma dois valores diferentes. Se tratar-se de um homem, tomar o valor de 1 e se tratarse de uma mulher, tomara o valor de 0.
De outro modo, formulando o modelo em relao ao valor convencional de Y
em relao a X, teremos:
E (Y | D 0) 1 X i ui Modelo representativo para as Mulheres
E(Y | D 1) (1 2 ) X i ui Modelo representativo para os Homens.
Como pode notar, as duas variantes de alfa, representam o termo intercepto,
logo, estamos em presena do efeito dummy sobre o intercepto.

Ilustrao 6 Demonstrao da Variao do Intercepto termo, numa funo onde


o salrio funo dos anos de experincia.
Uma varivel dummy pode apresentar mais de duas categorias. Sempre que
assim suceder, no acto da formulao do modelo, deduzimos sempre uma categoria (m1).
2. INCIDNCIA NO PARMETRO DE INCLINAO
A abordagem da inferncia das variveis dummies na inclinao da linha de
regresso est estreitamente correlacionada como a abordagem do teste de chow.
Lembre-se que o teste de chow diz respeito a averiguao da existncia ou no de
estabilidade estrutural, comparando duas regresses. Quando no existe estabilidade
estrutural, quer dizer que a duas regresses em anlise possuem graus de inclinao
diferentes. O mesmo seria tambm dizer que existe uma alterao da tendncia da linha
de regresso ao longo do perodo, isto seria o mesmo que admitir a existncia de uma
varivel independente cujo valor correlaciona-se com uma varivel dummy, ao ponto
desta varivel tomar valores diferenciados em funo do efeito dummy.
Considere que para o teste de chow, juntamos as duas regresses possveis e
expressamo-las no modelo abaixo:

apenas mulheres. Ao passo que se adicionarmos a este a varivel seguinte-D1 (a


dummy na sua primeira categoria) estaramos obtendo os valores do intercepto
considerando os homens.
Para livrar-se da armadilha da varivel dummy, tambm se usa um
artificio avanado que o de incluir o numero inteiro de categorias, todavia
eliminando o termo intercepto.

51

Equao 92
Yi 0 .... 2 X 2i 3 ( X 2i X 2*i ) Di ui
Onde Y= representa por hipoteticamente rendimentos de firma da gua da
Chela,
Por hiptese poderamos ter uma varivel X1. Representando os gastos de
explorao, todavia, deixamos omissa para efeitos didcticos..
X2 =Volume de vendas geradas
X 2* Valor limiar das vendas, tambm designado como n, (conhecido de ante
mo). Tal que:
D=1 se X2> X 2*
D=2 se X2 < X 2*
Admitindo que E (ui ) 0 veremos imediatamente que:

E(Y | D 0) 0 .... 2 X 2i ui Rendimentos at o ponto nvel alvo de vendas X 2*


a.
E (Y | D 1) i .... 3 X 1*i ( 2 3 ) X 2i ui i Que da o rendimento ultrapassando
o ponto alvo de vendas.
Nota que este exemplo semelhante ao teste de chow da estabilidade estrutural,
no qual a primeira regresso corresponderia a aos valores da regresso quando D=1 e a
segunda regresso representaria D=2. Nota porm que, o facto da dummy incidir numa
das variveis independentes, subentende dizer que a inclinao da curva tender alterar.

ii. EXERCCIO: INFERNCIA DE DUMIES NO ANGULO DE


INCLINAO

Derivamos alguns dados hipotticos para estimar o comportamento dos custos


de uma firma, tomando o conhecimento que a determinado ponto do nvel de produo
ou de quantidades vendidas, o custo total muda de inclinao ao atingir 5500 unidades.
Neste contexto, a varivel dummy tomar valores de 0 at a quantidade vendida de 5500
unidades. Temos duas hipteses para a anlise.
Uma hiptese admitir a pura inclinao at esta quantidade, tomando a
dummy valores de 1 a partir deste ponto. Neste caso a especificao do
modelo seria a do tipo: Yi 0 .... 2 X 2i 3 ( X 2i ) Di ui
Outra modalidade de deduzir 5500 a partir do nvel de produo acima
deste ponto, teramos assim um modelo do tipo
Yi 0 .... 2 X 2i 3 ( X 2i X 2*i ) Di ui .

52

Dados:
Modelo 2
Rend

Vendas
Intercep
*Dummy
256
1
1.000
0
414
1
2.000
0
634
1
3.000
0
778
1
4.000
0
1.003
1
5.000
0
1.839
1
6.000
500
2.081
1
7.000
1.500
2.423
1
8.000
2.500
2.734
1
9.000
3.500
2.914
1
10.000
4.500

Yi 145,717 0,2791X i 0,0945( X i X i* ) Di ui


(176,73411) (0.046008)
(0,082552)
t=
2,01
6,066
1,144
R 2 =0,973706
* = ( X 2i X 2*i ) Di ui

Modelo 1
Rend. Intercep Venda Dummy**
256
1
1.000 1000*D=0
414
1
2.000 2000*D=0
634
1
3.000 3000*D=0
778
1
4.000 4000*D=0
1.003
1
5.000 5000*D=0
1.839
1
6.000 6000*(D=1)
2.081
1
7.000 7000*(D=1)
2.423
1
8.000 8000*(D=1)
2.734
1
9.000 9000*(D=1)
2.914
1
10.000 10000*(D=1)
Yi 73 0,182052 X i 0,1082 X i Di ui
(36,30) (0.011) (0,007741)
t=
2,0199 16,3833 13,9831
R 2 =0,99
**= ( X 2i ) Di ui

Importa realar que no mbito dos modelos de variveis qualitativas, existem


enumeras verses relativas a inferncia de variveis dummies. Exemplo, existem
verses nas quais a varivel dependente tambm uma varivel qualitativa a ser
regredida com variveis quantitativas.

53

iii.

ELEMENTOS CHAVE DA INFERNCIA DAS VARIVEIS


DUMMIES

1.

Variveis dummies assumindo valores de 1 e 0 (ou suas transformaes lineares) so um meio


de introduzir regressores qualitativos na anlise de regresso.

2.

Variveis dummies so um expediente classificatrio de dados, uma vez que elas dividem uma
amostra em vrios subgrupos com base em suas qualidades ou atributos (sexo, estado civil,
raa, religio etc.) e implicitamente nos permitem efectuar regresses individuais para cada
subgrupo. Se houver diferenas na resposta do regressando a variao nas variveis
quantitativas dos diferentes subgrupos, elas vo se reflectir nas diferenas nos interceptos ou
nos coeficientes de inclinao ou em ambos, das regresses dos diferentes subgrupos.

3.

Embora seja uma ferramenta verstil, a tcnica da varivel dummy precisa ser manipulada com
cautela. Em primeiro lugar, se a regresso tiver um termo constante, o nmero das variveis
dummies deve ser menor que o nmero de classificaes de cada varivel qualitativa. Em
segundo lugar, o coeficiente ligado as variveis dummies deve sempre ser interpretado em
relao ao grupo-base, ou grupo de referncia, ou seja, o grupo que assume o valor zero. Por
fim, se um modelo tiver diversas variveis qualitativas com diversas classes, a introduo de
variveis dummies pode consumir um grande nmero de graus de liberdade. Portanto, devemos
sempre ponderar o nmero de variveis dummies a serem introduzidas em confronto com o
nmero total de observaes disponveis para a anlise.

4.

Dentre suas vrias aplicaes existentes no domnio variveis dummies, apenas tomamos em
considerao a comparao de duas (ou mais) regresses e a regresso de modelos de regress o
linear por partes. Todavia, existem ainda outras abordagens que no fazem parte do no sso
programa de ensino, como a desazonalizao de dados de sries temporais; a combinao de
dados de corte (cross sectional) com sries temporais.

5.

Como as variveis dummies so no-estocsticas elas no apresentam nenhum problema


especial quanto a aplicao dos MQO (OLS). Porm, deve-se tomar cuidado ao transformar
dados envolvendo variveis dummies. Em particular, e preciso lidar atentamente com os
problemas de autocorrelao e heteroskedasticidade.

54

S-ar putea să vă placă și