Sunteți pe pagina 1din 24

DELEGAO DE NAMPULA

DEPARTAMENTO DE CONTABILIDADE E FINANAS


ESCOLA SUPERIOR DE CONTABILIDADE E GESTO
Curso de Licenciatura em Gestao de Empresas

Econometria
Texto de Apoio Compilado pelo Docente:
Castigo Jos Castigo (Lic.)

Nampula, Setembro de 2014


1

1.

INFERNCIA ESTATSTICA

1.1 O Sentido da Inferncia Estatstica


A infrencia estatstica lida com dois tipos de problemas: estimao e teste de hipoteses. Faz uso das
varias ferramentas da teroria estatstica como um meio para chegar a concluses rasoveis acerca da
populao a partir de uma anlise baseada numa amostra extraida desta mesma populao.
Em Estatstica os conceitos de Populao e Amostra so extremamente importantes. A Populao
definida como o universo (a totalidade) de todos os resultados possveis de um fenmeno de interesse
(ex. populao escolar da Faculdade de Economia). A Amostra um subconjunto da populao (ex.,
estudantes do 3o Ano do curso de Economia, que uma parte da populao escolar da Faculdade de
Economia).
A Inferncia Estatstica simplesmente definida o estudo da relao entre a Populao e a Amostra
dela extrada. Para entender melhor este conceito considere o seguinte exemplo:
A Faculdade de Economia tem inscritos cerca de 200 estudantes no curso de Economia.
Suponha que so seleccionados ao acaso 50 estudantes deste universo particular e calculada
a nota mdia. A pergunta que se coloca : com esta nota mdia dos 50 estudantes possvel
dizer algo sobre qual a nota mdia dos 200 estudantes de Economia? ou seja, se x = a nota
50
mdia de um estudante e x = a nota mdia dos 50 estudantes (= X i / 50 ) possvel dizer qual
i =1

E(x) ou a nota mdia da populao como um todo?


Este processo de generalizao do valor mdio da amostra ( x ) para o valor mdio da populacao E(x)
a essncia da Inferncia Estatstica.
Do que foi referido pode ser resumido no seguinte: existe uma populao de interesse, sejam 200
estudantes de Economia da Faculdade de Economia e estamos interessados em estudar um aspecto
particular desta populao - seja a sua nota escolar.
Como no estamos interessados em estudar a nota de cada estudante mas sim, a nota mdia do grupo
e porque a colecta de informao muito onerosa em tempo e dinheiro para os 200 estudantes,
extraimos ento uma amostra aleatria de somente 50 estudantes para obter a nota de cada um dos
estudantes seleccionados e calcular a nota mdia amostral x .
Assim x um estimador tambm conhecido por Estatstico Amostral da mdia populacional E(x) que
tambm se chama Parmetro. Por exemplo, a mdia e a Varincia so parmetros de uma distribuio
normal. Um valor particular de um estimador se chama de Estimativa (ex., x de 11.5). Torna-se
assim que a Estimao o primeiro passo da Inferncia Estatstica.
Depois de obtida a estimativa de um parmetro, o passo seguinte, saber quo "boa" a estimativa,
para aquela que no parece ser igual ao verdadeiro valor do parmetro. Se obtivermos duas ou mais
amostras de 50 dos 200 estudantes que temos e calcularmos a nota mdia destas amostras, elas no
2

sero provavelmente iguais. Esta variao nas estimativas de amostra para amostra conhecida como
Variao ou Erro Amostral.
1.2 Teste de Hipoteses
Em Testes de Hipteses podemos ter um julgamento a priori ou expectativa acerca do valor de um
parmetro provvel. Por exemplo, a Directora Pedaggica por experincia pode dizer que a
verdadeira nota mdia dos 200 estudantes de Economia 13. Assuma que da amostra seleccionada a
nota mdia seja 11.5 valores. Ser este valor "prximo" do valor em "hiptese" de 13? Obviamente
que eles so diferentes. Mas sero "Estatisticamente diferentes"?
Uma teoria ou hiptese que no seja verificvel por meio de evidncias emprica
no pode ser admitida como parte da investigao cientfica (Milton Friedman,
1953)
Antes que o econometricista faa uso da relao estimada, necessrio avaliar tal relao por forma a
determinar a sua confiabilidade, isto , se os resultados obtidos conformam o que a teoria economica
postula. Para o efeito, o econometricista faz uso de trs tipos de testes: teste econmico a priori, teste
estatstico e teste economtrico.
a. Teste econmico a priori
O teste econmico a priori est asociado com os sinais e magnitudes dos coeficientes da relao
econmica. Em qualquer anlise economtrica aqueles sinais e magnitudes tm de ser
especificados logo no estgio de especificao do modelo. Uma vez que o exerccio de
estimao seja terminado, o teste econmico a priori, requere que os sinais e as magnitudes das
estimativas estejam em concordncia com a especificao a priori que tambm foi feita no
estgio de especificao dos modelos. Somente quando tal concordncia existir que as estimativas
da relao fazem sentido economicamente.
b. Teste estatstico
Em geral existem duas categorias de testes estatsticos usados para determinar a confiabilidade da
estimativa de uma determinada relao. A primeira categoria faz uso do coeficiente de
determinao (R2) para determinar quo bem a recta de regresso da amostra estimada se ajusta
aos dados1. Em outras palavras, esta medida estatistica mede o grau de ajuste do modelo
estimado. A segunda categoria do teste tem como objectivo determinar a significancia estatstica
dos coeficientes individuais do modelo.
c. Testes economtricos
Os vrios mtodos economtricos empregues na estimao da relao economtrica so baseados
em certos pressupostos especficos. A violao destes pressupostos pode provocar vrios
problemas economtricos com a consequncia de que as estimativas geradas por tais mtodos
1 Num modelo de duas variaveis X e Y, o coficiente de determinao
equivalente ao quadrado do coeficientede correlacao entre X e Y (r2).

economtricos podem no conter as propriedades desejveis. Embora as tecnicas de estimao e


os pressupostos correspondentes, bem como os problemas economtricos encontrados quando tais
pressupostos forem violados sejam um assunto das seces precedentes, importa sublinhar aqui
que o propsito dos testes economtricos determinar se os pressupostos de uma dada tecnica
econometrica relevante foram todos satisfeitos ou no. Uma vez que o nosso objectivo principal
obter uma relao estimada que possua certas propriedades desejveis, se os pressupostos mais
relevantes forem violados, o econometricista ir tradicionalmente rever a especificao da sua
relao, e re-estimar tal relao numa tentativa de gerar estimativas com propriedades desejveis.
O problema de teste de hipotese estatstica pode ser exposto simplesmente assim: uma dada
observao ou descoberta compatvel ou no com alguma hiptese formulada? A palavra
compatvel, aqui, significa suficientemente proximo do valor admitido por hipotese para que a
hipotese formulada nao seja rejeitada.
Na linguagem de teste de hipotese a hipotese formulada conhecida como hiptese nula indicada
pelo simbolo H0. A hipotese nula aquela que se pretende testar com base nas evidencia fornecidas
pelas estimativas da amostra. A hiptese nula usualmente testada contra uma hipotese alternativa
(tambm conhecida como hipotese sustentada), indicada pelo simbolo H1.
A teoria de teste de hipotese se preocupa em desenvolver regras ou procedimentos para decidir se uma
hipotese nula deve ser rejeitada ou no.
As hipteses podem ser apresentadas como se segue conforme sejam hipteses alternativas
Unilaterais ou Bilaterais.
Tipo de Hipotese

H0: Hipotese
Nula

H1: Hipotese Alternativa

Regra de Deciso:
Rejeita H0 se

`2 = 2*

`2 2*

| t |> t / 2 , gl

`2 = 2*

`2 > 2*

t > t , gl

`2 = 2*

`2 < 2*

t < t , gl

Bilateral
Unilateral
direita
Unilateral
esquerda

H duas abordagens mutuamente complementares que delineam essas regras a saber: Intervalo de
Confiana e teste de Significancia. Ambas pressupem que a varivel (estatstica ou estimador) que
esta sendo considerada tenha alguma distribuio de probabilidade e que o teste de hipotese faa
declaraoes ou afirmaes sobre o(s) valor(es) do(s) parametro(s) dessa distribuio.

2.

TESTE DE HIPOTESES

2.1 Abordagem de Intervalo de confiana


^

Sob hiptese de normalidade do termo ui, os estimadores dos MQO, 1 e 2 se distribuem eles
prprios normalmente com os seguintes parmtros:
4

com

E ( 1 ) = 1

Var ( 1 ) =

Xi
* 2
n x i2

Z=

E ( 2 ) = 2

com

Var ( 2 ) =

xi

Por isso, por exemplo, a varivel

2 1
^

( 2 1 ) * x i2

ep( 2 )

Parece ento que podemos usar a distribuio normal para fazer declaraoes probabilisticas sobre 2 ,
desde que a verdadeira varincia da populao, 2 , seja conhecida. Se 2 conhecida, uma
importante propriedade de uma variavel distribuida normalmente com mdia e variancia 2 , que
a rea abaixo da curva normal entre de cerca de 68%, a rea entre os limites 2 de
aproximadamente 95% e a rea entre 3 de cerca de 99.7%.
Mas como 2 raramente conhecida sendo determinada na pratica pelo seu estimador no-viesado
^ 2

^ 2

2
. Se substituirmos por , podemos escrever a relao anterior da seguinte forma:

t=

2 1

estimador parametro

ep ( 2 )

erro padrao estimado do estimador

( 2 1 ) * x i2

(1)

Pode-se mostrar que a varivel t assim definida, segue a distribuio t com n-2 gl. Portanto, em vez de
usarmos a distribuicao normal, podemos usar a distribuicao t para fazer declareoes de intervalos
como este:
Pr(t / 2

2 2
ep( 2 )

t / 2 ) = 1

(2)

onde *2 o valor de `2 sob a H 0 , t / 2 e t / 2 so os valores de t (os valores de t critico) obtidos da


tabela de t para um nvel de significancia de / 2 e n-2 gl.
Rearranjando (2), obtemeos

P[ 2 + t / 2 ep( 2 ) 2 + t / 2 ep( 2)] = 1


ou

P[ 2 t / 2 ep( 2)]

(3)
(4)

Tal intervalo, se existir, e conhecido como intervalo de confiana, isto , o intervalo no qual 2 se
encontrar com probabilidade 1 . Na linguagem de hipotese, o intervalo de confianca de
5

100( 1 )% estabelecido em (3) ou (4) conhecido como regio de aceitao (da hipotese nula) e a
regio ou regies fora do intervalo de confiana chamada de regio de rejeio (da H 0 ) ou regio
critica.
Observe uma importante caracteristica dos intervalos de confiana dados em (3) ou (4); Em ambos os
casos, a amplitude do intervalo de confiana proporcional ao erro-pardo do estimador; Ou seja,
quanto maior o erro-padro, maior a amplitude do intervalo de confiana. Dito de outro modo, quanto
maior o erro-padro do estimador, maior a incerteza de se estimar o verdadeiro valor do parametro
desconhecido. Assim, o erro-padro de um estimador muitas vezes descrito como uma medida de
precisao do estimador.
Para ilustrar a abordagem do intervalo de confiana para 2 , considere a regressao da funo
consumo-renda de um pas hipottico para o perodo 1991-2000, que forneceu os seguintes resultados:
^

1 = 24.45
^

com Var ( 1 ) = 41.14

sendo ep( 1 ) = 6.414

2 = 0.5091
^

com Var ( 2 ) = 0.0013 sendo ep( 2) = 0.0357

Cov ( 1 ; 2) = 0.2172

2 = 42.16

r 2 = 0.9809

Se admitirmos que = 5% , ou seja, um coeficiente de confianca de 95%, entao a tabela t nos mostra
que para 8 gl, o t / 2 crtico t 0.025 = 2.306 . Substituindo este valores em (4), podemos facilmente obter
o intervalo de confiana de 95% para 2 como segue:
0..4268 2 0.5914

Podemos interpretar este intervalo de confiana da seguinte forma: dado o coeficiente de confianca de
95%, a longo prazo, em 95 de 100 casos, intervalos como (0.4268;0.5914) contero o verdadeiro 2 .
Suponha agora que postulamos que H 0 : `2 = 0.3

H 1 : `2 0.3

O 2 observado compativel com a Ho?. Sabemos que, a longo prazo, intervalos como
(0.4268;0.5914) iro conter o verdadeiro 2 com 95% de probabilidade. Consequentemente, a longo
prazo, isto , em amostragem repetida, tais intervalos fornecem uma classe ou limites dentro dos quais
o verdadeiro 2 pode estar com um coeficiente de confiana de, digamos 95%. Se 2 sob a hipotese
nula estiver dentro do intervalo de confiana de 100(1 )% no rejeitamos a hipotese nula, caso
contrrio, rejeitamos-la.
Seguindo a regra anterior, para o nosso exemplo hipottico H 0 : `2 = 0.3 est claramente fora do
intervalo de confiana de 95%. Logo podemos rejeitar a hipotese nula de que o verdadeiro `2 0.3
com 95% de confiana.

Em estatstica, ao rejeitarmos a hipotese nula, dizemos que o nosso achado estatsticamente


significante. Por outro lado, quando nao a rejeitamos, dizemos que nosso achado nao
estatisticamente significante.
2.2 Teste de Significancia
O teste de significncia uma alternativa, mas complementar e talvez a mais curta forma de teste de
hipteses. Em linhas gerais, o teste de significancia um procedimento pelo qual os resultados da
amostra sao usados para verificar a validade ou a falsidade de uma hipotese nula.
Se recorrermos hipotese de que ui ~ N (0, 2) , ento, podemos utilizar o teste t para testar uma
hipotese sobre qualquer coeficiente de regressao parcial individual. Para ilustrar o modo como feito,
consideremos o nosso exemplo numrico. Postulemos que:

H 0 : `2 = * 2

H 1 : `2 * 2

Para testar a hipotese nula, usamos o teste t dado em (1). Em conformidade com este teste, se o valor
calculado de t excede o valor critico de t, podemos rejeitar a hipotese nula e dizer que 2
estatisticamente significativo, ou seja, significativamente diferente de zero.
Assim, na linguagem de testes de significncia dois termos so importantes:
um teste estatstico diz-se Estatisticamente Significante se a hiptese nula pode ser
rejeitada, ou seja que a diferena entre o valor amostral e o valor da hiptese nula no
pode ser resultado do mero acaso e por conseguinte o teste estatstico se encontra na
regio de aceitao.
do mesmo modo, o teste estatstico Estatisticamente Insignificante se a hiptese nula
no pode ser rejeitada, caso em que o valor amostral e o valor da hiptese nula podem
diferir devido a variaes amostrais.
Na prtica o recurso a teste de hiptese quer pela abordgaem do intervalo de confianca quer pela
abordagem do teste de signifancia um problema de convenincia. Na abordagem de intervalo de
confiana especificamos um intervalo de valores plausvel para o parametro e verificamos se o valor
em hiptese se encontra dentro desse intervalo; caso se encontre no rejeitamos a hiptese nula, caso
contrario, rejeitamos a hipotese nula.
Na forma de teste de significncia ao em vez de especificarmos um intervalo plausvel de valores,
tomamos um valor especfico do parametro sugerido pela hiptese nula, calculamos o teste estatstico
(t, Z, F, etc.) e encontramos a sua distribuio e a probabilidade de obter um valor especfico de tal
teste estatstico. Se esta probabilidade muito pequena, seja, menos que =5 ou 1%, rejeitamos a
hiptese nula em questo, caso contrrio no a rejeitamos.

Escolhendo a abordagem do intervalo de confianca, estabeleca o intrevalo de de confianca de 100(1)%. Se o valor da hipotese nula se encontra neste intrevalo (i.e. a regio de aceitacao), nao rejeita a
hipotese nula. Mas se cai fora deste intervalo (i.e. regiao de rejeicao), podes rejeitar a hipotese nula.
Escolhendo a abordagem de Teste de Significancia, o btenha o teste estatistico relevante (exemplo, o
teste t) sob a hipotese nula e encontre a probabilidade de de obter tal valor especifico do teste a partir
da distribuicao de probabilidade apropriada (exemplo, distribuicao t, F, etc.) Se esta probabilidade
menor que o valor de previamente escolhido rejeita a hipotese nula, caso contrario, nao rejeita.
Qualquer que seja a abordagem tenha sempre em mente que ao rejeitar ou nao a hipotese nula, Voce
esta tomar a chance de estar errado a % das vezes.
Para ilustrar a abordagem do teste de significancia, voltemos ao nosso exemplo da funo consumo^
^
renda. Sabemos que 2 = 0.5091 , ep( 2 ) = 0.50357 . Se admitirmos = 5% com 8 gl, t 0.025 = 2.306 . Se
e
H 1 : `2 0.3 , podemos calcular o valor t dada pela relao (1) e
denotarmos H 0 : `2 = 0.3
ver se ele se encontra entre os valores criticos de t ou fora deles. Em nosso exemplo:
t=

0.5091 0.3
= 5.86
0.50357

que claramente superior ao valor crtico de 2.306. A conclusao permanece a mesma, a saber:
Rejeitamos a Ho.

2.3 Teste de Hiptese: Alguns aspectos praticos


a.

O significado de ceitar ou rejeitar uma hipotese

Se, com base em teste de significancia, digamos que o teste t, dicidirmos aceitar a hipotese nula,
tudo o que estamos dizendo que, com base na evidencia da amostra, nao temos nenhuma razao para
rejeit-la; Nao estamos dizendo categoricamente que a hipotese nula seja verdadeira, porque uma
outra hipotese nula pode ser igualmente compativel com os dados. Por isso, preferivel dizer que nao
rejeitamos a hipotese nula a afirmar que a aceitamos. Melhor ainda,
... assim como um tribunal pronuncia um veredito como nao-culapdo, em vez de
inocente, a conclusao de um teste estatistico nao rejeita, em vez de aceita (Kmenta,
J. 1971:114).
b.

Escolha do nvel de significncia

Um facto importante a ser entendido nos testes de hipteses a arbitrariedade na escolha do nvel de
significncia ou a probabilidade de cometer um erro de tipo I, isto , a probabilidade de rejeitar a
hipotese nula quando ela verdadeira. Um outro facto importante que rejeitar ou nao a hipotese
nula depende decisivamente deste nivel de significancia. Muito embora os valores 0.01, 0.05, e 0.10
sejam comumente utilizados, no existe nada de sacrosanto nestes valores. Na prtica prefervel
encontrar o chamado "p-value"(ou seja o valor da probabilidade) tambm conhecido como o nvel
8

exacto de significncia do teste estatstico, definido como o mais baixo nvel de significncia ao qual
a hiptese nula pode ser rejeitada.
c.

Erro Tipo I e Tipo II

Visto como um problema de tomada de decisao, os testes de hipoteses envolvem duas accoes
alternativas que podem ser tomadas: aceitar ou rejeitar a H0. Estas duas alternativas, isto , a
veracidade ou a falsidade da H0, sao assumidas como estado das coisas que afectam o playoff da
decisao. O payoff envolve a veracidade da decisao, ou o tipo de erro incurrido.
importante estar claro que ao decidir rejeitar ou nao a hipotese nula, estaremos provavelmente a
cometer dois tipos de erros: (1) podemos estar a rejeitar a Ho quando na verdade ela verdadeira
Erro de Tipo I ou (2) podemos nao rejeitar a Ho quando na verdade ela falsa: Erro de Tipo II.
Idealmente, gostariamos de minimizar ambos tipos de erros. Mas infleizmente, para qualquer amostra
dada, nao possivel minimizar ambos erros sumultaneamente. A abordagem classica a este problema
incorporado no trabalho de Neyman and Pearson, assumir que o Erro de Tipo I na pratica
provavelmente o mais serio que o Erro do Tipo II. Por conseguinte, podemos tentar manter a
probabilidade de cometer o Werro do Tipo I a um nivel ligeiramente baixo, tal como 0.01 ou o.o5 e
depois tentar minimizar a probabilidade de cometer o erro do Tipo II tanto quanto possivel.
Na literatura, a probabilidade de Erro do Tipo I designa-se por e chamado de nvel de
significancia, e a probabilidade de Erro do Tipo II designa-se por . A probabilidade de nao cometer
o erro do tipo II, 1- , chama-se de poder do teste. A abordagem classica sobre teste de hipoteses
procura fixar a um nivel tal como 0.01 ou 0.05 e depois procura maximizar o poder do teste.
Tenha em mente que ao rejeitar ou nao rejeitar uma hipotese nula, voce esta a tomar uma chance
de ester errado porcentos das vezes.
O Valor p, ou o nvel de significancia exacto. No lugar de predefinir a um nivel arbitrario tal com
1, 5 ou 10 porcentos, podemos obter o valor de p (probabilidade), ou nivel de significancia exacto de
um teste estatistico. O valor p define-se como o valor do nivel de significancia mais baixo ao qual
uma hipotese nula pode ser rejeitada.

Resumo dos passos que involvem o Teste de uma Hipotese Estatistica


1.
2.
3.
4.
5.

Formule a hipotese nula (H0) e a hipotese alternativa (H1);


Seleccione o Teste Estatistico
Determine a distribuicao de probabilidade do teste estatistico, i.e., x~(u,s^@)
Escolha o nivel de significancia , isto , a probabilidade de cometer o erro de tipo I
Escolha a abordagem do intervalo de confianca o do teste de significancia

3. TESTE DE HIPOTESE NO CONTEXTO DA REGRESSO MULTIPLA


No contexto da regressao multipla, os testes de hipoteses assumem diversas formas:
3.1 Teste de hipoteses sobre um coeficiente de regressao parcial individual
3.2 Teste sobre a significancia global do modelo de regressao multipla, ou seja, para
verificar se todos os coeficientes de inclinacao sao simultaneamente iguais a zero;
3.3 Teste para apurar se dois ou mais coeficientes sao iguais entre si
3.4 Teste para apurar se os coeficientes de regressao parcial satisfazem certas restries
3.5 Teste de estabilidade do modelo de regressao ao longo do tempo ou em diferentes
unidades de corte
3.6 Teste sobre a forma funcional do modelo de regressao

3.1 Teste de hipoteses sobre um coeficiente de regressao parcial individual


Sob a hipotese de que ui ~ N(o;2), podemos utilizar o teste t para testar uma hipotese sobre qualquer
coeficiente parcial de regressao individualmente. Para compreender melhor o sentido de coeficiente
parcial de regrassao, considere o seguinte modelo de tres variaveis:
Yi = 1 + 2 X 2 t + 3 X 3t + u t

Sabemos das aulas anterior que 1 representa o valor mdio de Y quando X2 e X3 so iguais a zero.
Os coeficientes 2 e 3 so chamados de coeficientes parciais de regressao, cujo sentido o seguinte:
2 mede a variacao no valor mdio de Y, E(Y), por uma variacao de uma unidade de X2 mantendo
constante X3. Igualmente, 3 mede a variacao no valor mdio de Y, E(Y), por uma variao de uma
unidade de X3 mantendo constante X2. Esta a unica caracteristica de uma regressao multipla. No
contexto da regressao simples nao tivemos que nos preocupar com a presenca de uma outra variavel
explicativa no modelo. No contexto da regressao multipla, queremos saber que parte da variacao do
valor medio de Y pode ser directamenteatribuida a X2 e que parte a X3.
O coeficiente parcial de regresao reflecte o efeito (parcial) de uma variavel explicativa sobre o valor
medio da variavel dependente ou explicada, quando os valores das outras variaveis indpendentes ou
explicativas incluidas no modelo sao mantidas constantes.
Esta caracteristica unica da regresao multipla nos permite nao so incluir mais do que uma variavel
explicativa no modelo, mas tambm perimte isolar ou separar o efeito de cada variavel X das
outras sobre Y.

10

Para ilustrar o teste, consideremos os resultados da funo consumo que relaciona o consumo pessoal
(Yi), renda pessoal disponvel (X2) e tempo (X3). Postulemos o seguinte:

H 0: 2 = 0 e

H 1: 2 0

A hipotese nula diz que, mantendo X3 constante, a renda pessoal disponvel no tem nenhuma
influencia sobre a despesa de consumo pessoal. Para testar esta hipotese, usamos o teste t da seguinte
forma:
^

t=

2 2

(5)

ep( 2 )

A um nivel de significancia , se o valor calculado de t supera o seu valor critico, podemos rejeitar a
hipotese nula, caso contrario, podemos nao-rejeit-la. Em nosso exemplo, usando a expresso (5) e
observando que 2 =0 sob a hipotese nula, obtemos:

t=

0.51
= 14.27
0.03574

Se admitirmos = 0.05, t/2= 2.306 para 8 gl. Como o valor calculado de t (14.27) excede o valor
critico de t (2.306), podemos concluir nao haver evidencias impiricas para nao rejeitar a hipotese nula,
ou seja, 2 estatisticamente significativo.
Pela abordagem do intervalo de confiana, segue que a um nivel de confianca de 95% para 2 , e
lembrando que intervalo de confianca dada por:
^

Pr[ 2 t / 2 * dp( 2 ) 2 2 + t / 2 * dp ( 2 )] = 1
em noso exemplo teriamos:

0.51 + 2.306 * 0.03574 0.51 + 2.306 * 0.03574


ou seja,

0.42758 0.59242
Interpretao: em repetidas amostra, se construirmos 100 intervalos de confianca do tipo
0.4276 0.5924 , esperamos que 95 deles contenham o verdadeiro parametro 2 da populacao.
Como o valor de 2 =0 admitido pela hipotese nula noo est no intervalo acima, podemos concluir
no haver evidencia impiricas para no rejeitar a hipotese nula com o coeficiente de confianca de
95%. Como se pode observar, seja usando o teste de significancia t, seja estimando o intervalo de
confianca, chegaremos mesma conclusao.
11

3.2 Testando a significancia global da Regressao da amostra


O objectivo deste teste o de estabelecer se as variaveis explicativas tm simultaneamente um
impacto significativo ou no. Caso seja estabelecido que este impacto de facto estatisticamente
significante, podemos concluir que Yi tem uma relacao linear tanto com X1 como com X2.
Para ilustrar este teste, consideremos a seguinte hipotese:

H 0: 2 = 3 = 0
Esta hipotese nula uma hipotese conjunta de que 2 e 3 sao simultaneamente iguais a zero. A
hipotese alternativa de que pelo menos um coeficiente diferente de zero. Um teste de significancia
assim chamado de teste de significancia global da reta de regressao estimada.
Na seccao anterior discutimos como testar individualmente a significancia de 1 e 2 . Mesmo que
tenhamos testado todos os parametros do modelo, nao o mesmo que testar a hipotese conjunta:
... testar uma srie de hipoteses em particular (individuais) nao equivale a testar essas mesmas
hipoteses conjunamente. A razao intuitiva disto que, em um teste conjunto de diversas
hipoteses, qualquer hipotese individual afectada pela informacao em outras hipoteses.
Para testar a hipotese nula de que 2 e 3 sao simultaneamente iguais a zero, existem duas
abordagens:


A abordagem da Analise de Variancia (ANOVA) para testar a significancia


global de uma regressao Multipla: o teste F

Testando a significancia global da regressao Multipla em termos de R2: o


Teste F

Para ilustrar estas duas abordagens, definamos primeiro o Coeficiente de Determinao R2: Uma
Medida do Grau de Ajuste
O mtodo MQs tem tambm outra caracterstica que o torna popular - o facto de a soma do quadrado
dos desvios da varivel dependente volta da mdia poder permitir o clculo de um importante
parametro; o Coeficiente de Determinao. No caso de duas variavesi, o coeficiente de determinao
R2 mede o grau de ajuste da equacao da regressao, ou seja, fornece a proporcao ou percentagem da
variacao total na variavel dependente Y explicada pela (unica) variavel independente X.
Para ilustrar a frmula de R2, procedemos da seguinte forma:
Lembremos que
^

Y i = Y + ei
12

(6)

Expressemos a equao (6) de uma forma diferente mas equivalente:


^

(Yi Y ) = (Y Y ) + (Y i Y )

(7)
^

(Yi Y ) = variao em Y do seu valor mdio; (Y Y ) = variao em Y explicada pelos Xs

onde
^

( = Y ) ; (Y i Y ) = variao no explicada ou residual.


Substituindo os desvios por letras minusculas, podemos escrever a equao resultante da seguinte
forma:
^

y i = y + ei

(8)

Elevando ao quadrado ambos membros e tomando o somatorio de toda a amostra, teremos:


2

yi

^ 2

= yi

+ ei2

(9)

As varias somas dos quadrados podem ser definidas da seguinte forma


2

yi

= Variao total dos valores actuais de Y volta da sua mdia Y e pode apropriadamante ser
chamada de Soma dos Quadrados Totais (SQT)

^ 2

yi

= Variao total do Y estimado volta da sua mdia e pode ser apropriadamente chamada de
Soma dos Quadrados devia a Regresso ou simplesmente Soma dos Quadrados Explicados
(SQE)

ei2 = Como definido anetriormente, Soma dos Quadrados dos Residuos (SQR) ou simplesmente,
variao residual ou no explicada de Y volta da linha da regresso.
Assim, podemos reescrever a equao (9) da seguinte forma

SQT

SQE

SQR

da relao SQT = SQE + SQR j estudada, podemos expressar outra relao bastando para tal a
diviso de todos os termos por SQT , ou seja

13

SQT
SQT
Seja

=
2
2
r =R =

SQE
SQT
SQE
SQT

1 =

Por conseguinte,

SQR
SQT

obtemos

SQE
SQT

SQR
SQT

(10)

, substituindo na expresso (10) obtemos

SQR
SQT

2
r =R

ou

= 1

=
ei2
2
yi

ei2
2
yi

(11)

(12)

Assim, o coeficiente de determinao mede a proporo da variao total explicada pela varivel
independente, e como parte da variao total ela est limitada a unidade, isto , 0 < R2 < 1. Isto
significa que se R2=0, ento 2 =0 e por conseguinte Cov(X,Y)=0 e por isso X e Y so independentes;
caso contrrio, X e Y tero alguma relao e R2>0 e a Cov(X,Y)0, sendo 2 0; e portanto X e Y
mover-se-o no mesmo sentido se 2 >0 ou em sentido inverso se 2 <0.
2

e o R ( R 2 Ajustado)

R2

Como foi referido anteriormente, o coeficiente de determinacao R 2 usa-se para medir a fraccao das
varioacoes da variavel dependente explicadas pela equacao de regressao. Por conseguinte, podemos
usar este coeficiente para comparar os resultados da regressao, sob especificacoes alternativas das
variaveis independentes no modelo. Contudo, o R 2 apresenta uma serie de fraquezas:
i) R 2 alheio aos gl corespondentes
ii) R 2 sensivel ao numero de variaveis explicativas usadas na equacao de regressao. A inclusao
de mais variaveis explicativas na equacao de regressao, regra geral, eleva o valor de R 2 ou
deixa inalterado, mas nao diminui o R 2 . Em outras palavras, o R 2 uma funo nodecrescente do numero de variaveis explicativas ou regressores presentes no modelo. Por
conseguinte, o investigador sempre tentado a incluir mais variaveis explicativas, por forma a
maximizar o R 2 .
iii)A interpretacao bem como o uso do R 2 tornam-se dificeis para os modelos especificados sem
intercepto.
A fraqueza principal do R 2 , como referido em (i), de que nao toma em consideracao os graus de
2
liberdade, uma fraqueza que corrigida usando o R 2 ajustado ( R ). Por forma a resolver esta
2
fraqueza, definimos o R em termos de variancias (definidas como variacoes divididas pelos gl), e por
conseguinte eliminando a dependencia deste parametro estatistico sobre o numero de variaveis
2
explicativas no modelo. Isto vai fornecer-nos R definido pela seguinte formula:

14

R = 1 (1 R 2)

n 1
nk

(13)

Caracteristicas do R 2 Ajustado
2

Se K > 1, R R 2 , ou seja, medida que o nmero de variaveis explicativas aumenta, o R


aumenta menos que R 2 . Parece existir uma penalizacao pela inclusao de mais variaveis no
modelo
2
Embora o R 2 seja sempre positivo, R pode, algumas vezes, chegar a ser negativo.
2

Actualmente pratica apresentar tanto o R 2 como R . Esta uma pratica, porque o R vai nos
permitir copmparar dois modelos de regressao que tenham a mesma variavel independente, embora
com diferentes variaveis explicativas.
A abordagem da Analise de Variancia (ANOVA) para testar a significancia global de uma
regressao Multipla: o teste F
No contexto da Analise de Regressao, a variacao total (VT) pode ser decomposta em variacao
explicada (VE) - explicada pela linha de regressao, e variacao nao-explicada ou variao residual
(VR) - atribuida ao termo aleatorio e representada pela disperssao das observacoes volta da linha de
regressao. Formalmente,

SQT = SQE + SQR

VT = VE + VR
^

(Yi Y ) = (Y Y ) + (Y i Y )

(15)

onde SQT = soma dos quadrados totais, SQE=soma dos quadrados explicada e SQR=soma dos
quadrados dos residuos. O Estudo destes componentes da SQT conhecido como anlise de variancia
(ANOVA) do ponto de vista da regressao. De acordo com o procedimento de ANOVA, podemos
construir a seguinte Tabela:
Fonte de Variacao
Devida a Regressao
Devida aos Residuos
Total

SQ
SQE
SQR
SQT

Gl
k-1
n-k
n-1

SQM
SQE/gl
SQR/gl

Pode-se demonstrar que, sob a hipotese de distribuio normal para ui e a hipotese nula de que
2 = 3 = 0 , a varivel

F=

SQE / gl
SQR / gl

(16)

15

tem distribuio F com k-1 e n-k gl. O valor F da expressao (16) fornece-nos um teste de hipotese
nula de que os verdadeiros coeficientes de inclinacao sao simultaneamente iguais a zero. Se o valor F
calculado por meio de (16) exceder o valor critico de F constante na Tabela F a um nivel de
significancia , rejeitamos a H 0 . Caso contrario, nao a rejeitamos.
Retomando o nosso exemplo, podemos obter a seguinte Tabela de ANOVA
Fonte de Variacao
SQ
Devida a Regressao (SQE)
Devida aos Residuos (SQR)
Total

F=

Gl
k-1
n-k
n-1

SQM

SQE / gl
SQR / gl

Se usarmos o nivel de significancia de 5%, o valor critico de F para 2 e 12 gl, isto , F0.05(2;12), ser
3.89. Obviamente, o valor calculado de F significativo e, consequentemente, podemos rejeitar a
hipotese nula.
Testando a significancia global da regressao Multipla em termos de R2: o Teste F
O teste F como medida de significancia global da estimada linha de regressao, tambem um teste de
significancia do R2 ou seja, se R2 estatisticamente diferente de zero. Em outras palavras, testar a
hipotese nula de que H 0 : 2 = 3 = 0 , equivale a testar a hipotese nula de que o R2 (da populacao)
igual a zero, ou seja, H 0 : R2 = 0 .
Uma das vantagens do teste F expressado em termos de R2, a facilidade de computacao: Tudo o
que nos precisamos, o valor do R2. Dado o modelo de regressao de k variaveis:

Y i = 1 + 2 X 2 i + 3 X 3i + ... + k X ki + u i
para testar a hipotese:

H 0 : 1 = 2 = 3 = ... = k = 0

H 1 : Nem todos os coeficientes de inclinacao sao simultaneamente iguais a zero.


Calcule
2

F=
Se
16

F > F ( k 1; n k )

R /(k 1)
(1 R 2) /(n k )

rejeita a hipotese nula, caso contrario, nao rejeita.

(17)

Relacao entre R2 e F
Existe uma relacao muito importante entre o coeficiente de determinacao R2 e a razao F usada na
Analise de Variancia (ANOVA).
Admitindo a distribuicao normal para as perturbacoes ui e a hipotese nula de que 2 = 3 = 0 , vimos
que

F=

SQE /(k 1)
SQR /(n k )

(18)

Segue a distribuicao F com k-1 e n-k gl.


Manipulemos a expressao (18) da seguinte forma:

nk
k 1
nk
F=
k 1
nk
F=
k 1
nk
F=
k 1
F=

SQE
SQR
SQE
SQT SQE
SQE / SQT
1 ( SQE / SQT )
2

R
1 R2
2
R /( k 1)
F=
(1 R 2) /( n k )

Porque

2
R =

SQR
SQT

Assim fica demonstrado que F e R2 se relacionam. Eles variam directamente. Quando R2=0, F = 0.
Quanto maior o R2, maior o valor de F. No limite, quando R2 = 1, F infinito.
3.3 Teste para apurar se dois ou mais coeficientes sao iguais entre si
Considere a seguinte funo de regregresso multipla

Y i = 1 + 2 X 2 i + 3 X 3i + 4 X 4 i + u i

(19)

e queremos testar as hipoteses

H0 : 3 = 4

ou

( 3 4) = 0
17

(20)

H1 : 3 4

ou

( 3 4) 0

ou seja, os dois coeficientes de inclinao 3 e 4 so iguais. Uma hipotese nula deste tipo tem
muita importancia pratica. Por exemplo, se assumirmos que (19) a funo da procura por uma
mercadoria, em que Y a quantidade procurada da mercadoria, X2 o preo da mercadoria, X3 a renda
do consumidor e X4 a riqueza do consumidor. A hipotese nula, neste caso, significa que os
coeficientes da renda e da riqueza so iguais. Se (19) for expresso na forma logartmica a hipotese
nula em (20) implica que as elasticidades de consumo com relao renda e da riqueza so iguais.
Para testar essa hipotese, sob a s hipoteses clssicas, pode-se mostrar que:
^

( 3 4 ) ( 3 4 )

t=

(21)

ep( 3 4 )
segue a distribuio t com (n-4) gl, ou mais genericamente com (n-k) gl sendo k o nmero de
parametros no modelo incluindo o intercepto.
^

ep( 3 4 ) = var( 3 ) + var( 4 ) 2 cov( 3 , 4 )

(22)

Substituindo em (21)
^

( 3 4 ) ( 3 4 )

t=

(23)

var( 3 ) + var( 4 ) 2 cov( 3 , 4 )


Exemplo: Considere os resultados da seguinte funo de custos
^

Yi = 141.77 + 63.48 X i 12.96 X i 2 + 0.94 X i 3


ep = (6.357) (4.779) (0.986)
(0.059)
^

cov( 3 , 4 ) = 0.0576

2
R = 0.9983

n = 10

Suponhamos que queremos testar a hipotese de que os coeficientes dos termos X2 e X3 na funo de
custos so iguais, ou seja, 3 = 4 ou ( 3 4) = 0 .
Para testar esta hipotese, a mevanica correcta como segue:
18

( 3 4 ) ( 3 4 )

t=

var( 3 ) + var( 4 ) 2 cov( 3 , 4 )


=

12.96 0.94
(0.986) 2 + (0.059) 2 2(0.0576)

= 13.313

Com 6 gl a um nvel de significancia de 5%, teste bilateral, t 5%;6 = 2.447 que em termso absolutos
inferior a 13.313. Consequentemente podemos rejeitar a hipotese de que os coeficentes de X2 e X3 na
funo de custos so identicos.

3.4 Teste para apurar se os coeficientes de regressao parcial satisfazem certas restrioes
H ocasies em que a teoria economica pode sugerir que os coeficientes em um modelo de regressao
satisfaam algumas restries de igualdade linear. Por exemplo, considere a funo Cobb-Douglas:

Yi = 1 X 2 i 2 X 3i 3 e

u i

(24)

Onde Y o produto, X2 o trabalho e X3 o capital. Escrita na forma logartmica, a equao (24) seria:

LnYi = 0 + 2 LnX 2 i + 3 LnX 3i + u i

(25)

onde 0 = Ln 1
Se o modelo comportasse rendimentos constantes de escala (variao equiproporcional no produto
para uma variao equiproporcional nos insumos), a teoria economica sugeriria que

2 + 3 =1
Este um exemplo de uma restricao de igualdade linear.
Para estar esta hipotese, existem duas abordagens:
1.
2.

Abordagem de teste t
Abordagem de teste F: Minimos Quadrados Restritos

19

Abordagrem do Teste t
O mtodo mais simples estimar (25) de maneira habitual se levar em conta explicitamente a
restrio 2 + 3 = 1 . Chama-se esto de regressao sem restrio. Depois de estimar 2 e 3 podemos
realizar um teste dahipotese ou restrio 2 + 3 = 1 por intermdio do teste t a saber:
^

( 3 + 4 ) ( 3 + 4 )

t=

var( 3 ) + var( 4 ) + 2 cov( 3 , 4 )


(26)
^

( 3 + 4 ) 1

t=

var( 3 ) + var( 4 ) + 2 cov( 3 , 4 )


Em que sob a hipotese nula e sendo o denominador o erro-padro de ( 2 + 3) . Seguindo o
procedimento habitual, se o valor de t calculado exceder o valor critico de t a um nivel de
significancia dado, rejeta-se a hipotese nula de que o modelo comporta rendimentos constantes de
escala. Caso contrario no rejeitamos.
Abordagem de Teste F: Mnimos Qudardos Restritos
Este teste uma espcie de exame postumo, porque tentamos descobrir se a restrio linear
satisfeita depois de stimar a regressao irrestrita. Uma abordagem directa seria incorporar, desde o
principio a restrio 2 + 3 = 1 , da seguinte maneira:

2 = 1 3

ou

3 = 1 2

Usando qualquer uma destas desigualdades, podemos eliminar um dos e estimar a equao
resultante. No nosso exemplo, se utilizarmos a restrio 2 = 1 3 , podemos escrever a funo CobbDouglas da seguinte forma:

LnYi = 0 + (1 3) LnX 2 i + 3 LnX 3i + u i


LnYi = 0 + LnX 2 i + 3 ( LnX 3i LnX 2 i ) + u i

LnYi LnX 2 i = 0 + 3 ( LnX 3i LnX 2 i ) + u i


Ln(Yi / X 2i ) = 0 + 3 Ln( X 3i / X 2 i ) + u i
Yi / X 2 i

20

a razo produto/trabalho e X 3i / X 2i razo capital trabalho.

(27)

O Mtodo delineado em (27) conhecido como Mnimos Qudardos Restritos que pode ser
generalizado para modelos com qualquer nmero de variaveis explicativas e mais de uma restrio de
igualdade linear. Repare que aps estimarmos 3 em (27), facilmente se pode obter 2 por meio da
relao 2 = 1 3 .
Como sabemos se a restrio 2 + 3 = 1 valida? Esta questo pode ser testada por meio da aplicao
do teste F a seguir: Sejam
^ 2

u IR = SQR da regressao sem restricao


^ 2

u R = SQR da regressao com restricao

m = numero de restricoes lineares


k = numero de parametros na regressao sem restricao `
n = numero de observacoes
Ento:

F=

( SQR R SQR IR ) / m
SQR IR /( n k )
(28)
^ 2

( u R u^ IR ) / m
^ 2

u IR /( n k )
Segue a distribuio F com m, (n-k) gl.
O teste F acima pode tambm ser expressado em termos do R2 como segue:

( R IR2 R R2 ) / m
F=
(1 R IR2 ) /( n k )

(29)

Onde RIR2 e RR2 so, respectivamente, os valores R2 obtidos das regresses sem e com restrio.
Deve-se observar que RIR2 RR2
Uma palavra de advertencia: ao usar (28) ou (29), tenha em mente que, se a varivel dependente nos
modelos com e sem restrio nao for a mesma, RIR2 e RR2 nao sero directamente comparaveis.
21

3.5 Comparando duas regressoes: teste de estabilidade do modelo de regressao


Para ilustrar este teste, consideremos a seguinte funo poupana:

Yt = 1 + 2 X t + u t

(30)

Suponhamos que queremos testar se a funo poupana sofreu uma mudana estrutural entre os dois
perodos (periodo de reconstrucao e pos-reconstrucao), sito , os parmetros da funo poupana
mudaram.
Para verificar se esta mudana real, vamos supor que as funes poupana para os dois periodos
sejam como segue:
Periodo de reconstrucao:

Yt = 1 + 2 X t + u1t

Periodo pos-reconstrucao: Yt

= 1 + 2 X t + u 2 tt t = 1, 2, ... n2 (32)

t = 1, 2, ... n1 (31)

As seguintes situaes so possiveis:

1. 1 = 1

mas

2 = 2

No houve nemhuma mudana estrutural

2. 1 = 1

mas

2 2

Os dois interceptos so iguais mas as inclinaes so

mas

2 = 2

as inclinaes dos dois periodos so iguais, mas os

2 2

Tanto os interceptos como as inclinaes sofreram

iguais;

3. 1 1

interceptos so diferentes;

4. 1 1

mas

alterao;
Naturalmente, se no houver nenhuma mudana estrutural (isto , com estabilidade estrutural
primeira situao), podemos combinar todas as n1 e n2 observaoes e simplismente estimar uma
funo poupana (25).
Como verificamos se h uma mudana estrutural na relao (25) entre os dois perodos? Um teste
comunmente usado para responder a esta questo conhecido como Teste de Chow, embora ele seja
simplesmente o teste F descutido anteriormente.

22

Duas hipoteses fundamentam o teste de Chow:


a) u1t ~ N(o,2)

u2t ~ N(o,2)

ou seja, os dois termos erro se distribuem normalmente com a mesma variancia 2 (homoscidastica), e
b) u1t e u2t se distribuem independentemente

Com estas hipoteses, o teste de Chow procede da seguinte forma:


Passo 1: combinando todas as n1 e n2 observaes, estimamos (25) e obtemos sua SQR e chamemos
S1 com gl = (n1 + n2 k) onde k o nmero de parmetros estimados.
Passo 2: estime (31) e (32) individualmente e obtenha sua SQR, que podem ser denotados por S2 e S4
com gl=( n1-k) e (n2 k) respectivamente. Some estas duas SQR, digamos S4=S2+S3 com gl=( n1+n2 2k);
Passo 3: obtenha S5= S1- S4
Passo IV: dadas as hipoteses do teste de Chow, pode-se mostrar que:

F=

S5 / k
S 4 /( n1 + n 2 2k )

(33)

Segue a distribuio F com gl=(k, n1+n2 -2k). Se o F calculado exceder o valor critico de F, rejeita-se
a um nivel de significancia escolhido, rejeita-se a hipotese nula de que as regressoes (31) e (32) sao
iguais, ou seja, rejeita-se a hipotese de estabilidade estrutural.

3.6 Teste sobre a forma funcional dos modelos de regressao


A escolha entre um modelo de regressao linear (a varivel regredida uma funao linear dos
regressores) ou um modelo de regressao log-linear (o log da variavel regredida uma funo dos log
dos regressores) uma questo permanente na analise empirica. Podemos usar o teste proposto por
MacKinnon, White e Davidson (Teste de MWD) para escolher entre os dois modelos.
Para ilustrar o teste, suponha que:
H0: Modelo Linear: Y uma funo linear dos regressores, os Xs;
H1: Modelo Log-Linear: LnY uma funo linear dos logs dos regressores, os Logs dos Xs;

O teste MWD envolve os seguintes passos:


Passo 1: estime o modelo linear e obtenha os valores estimados de Y. Chamemos de Yf , isto
^

, Y
23

Passo 2:estime o modelo log-linear e obtenha os valores estimados de LnY. Chamemos de Lnf ,
^

isto , LnY
Passo 3: obtenha Z1 = ( LnYf Lnf )
Passo 4: regrida Y sobre os Xs e Z1 obtidos no passo anterior. Rejeita a H0 se o coeficiente de Z1
for estatisticamente significativo pelo teste t usual;
Passo 5: obtenha Z 2 = (anti log de ln f yf ) , rejeita a H1 se o coeficiente Z2 for estatisticamente
significativo pelo teste t usual.

FIM

24

S-ar putea să vă placă și