Sunteți pe pagina 1din 147

UNIVERSIDADE FEDERAL DA BAHIA

INSTITUTO DE MATEMTICA
DEPARTAMENTO DE ESTATSTICA
Av. Adhemar de Barros, s/n Ondina CEP: 40.170-290
Tel./Fax.: (071) 263-6262 ou 263-6263
E-Mail: mat04@ufba.br ome!a"e: #tt$://%%%.e&t.ufba.br
NOTAS DE AULA
Para a Disciplina
MAT229 Anlise de
Regresso
Gilnio !orges "ernandes
1
No#e$%ro de 2&&2
2
'o(te)*o
1. Introduo......................................................................................................................................1
1.1. Relaes de dependncia e de interdependncia. Regresso e correlao.............................2
1.1.1. Terminologia, notao e questes especficas..........................................................2
1.2. Modelos matemticos e modelos
estatsticos.........................................................................!
1.2.1. "onceito de componente aleat#rio ou erro nos modelos estatsticos.........................$
1.!. % modelo de regresso na populao e na amostra...............................................................&
1.'. (ados de cortes trans)ersais e dados de s*ries temporais....................................................12
2. % modelo de regresso linear simples...........................................................................................1!
2.1 "onceitos e pressupostos so+re os componentes do modelo de regresso.............................1!
2.2 ,stimao pontual dos par-metros.....................................................................................1!
2.2.1. M*todo dos mnimos quadrados...............................................................................1!
2.2.2. M*todo da m.ima )erossimil/ana........................................................................10
2.! ,stimao da )ari-ncia dos termos do erro.........................................................................11
2.' 2ropriedades dos estimadores... .........................................................................................23
2.$ 4ari-ncia e erro 5 padro dos estimadores..........................................................................21
2.& % enfoque da anlise de )ari-ncia no modelo de regresso.................................................22
2.6 ,stimao por inter)alo de confiana e teste de /ip#teses so+re o modelo de regresso.......2$
2.6.1. "onstruo de inter)alos de confiana e teste de /ip#teses so+re os
da par-metros da equao de regresso................................................................2$
2.6.2. "onstruo do inter)alo de pre)iso para a resposta m*dia,
dado um )alor particular da )ari)el independente...............................................26
2.6.!. "onstruo do inter)alo de pre)iso para uma no)a o+ser)ao,
dado um )alor particular da )ari)el independente...............................................26
2.6.'. 7oes de inferncia simult-nea so+re os par-metros e a lin/a de regresso.........!2
2.0. % coeficiente de determinao e a +ondade do a8uste..............................................................'!
2.1. 9nlise de resduos................................................................................................................'$
2.1.1. (efinio e propriedades dos resduos.....................................................................'$
2.1.2. 9nlise grfica dos resduos....................................................................................'0
2.1.!. Teste : para linearidade..........................................................................................$!
2.13. %s mnimos quadrados ponderados....................................................................................&0
!. % modelo de regresso linear m;ltipla..........................................................................................&$
!.1. Tratamento matricial do modelo de regresso linear. ,quaes normais.............................&$
!.2. "onceitos e pressupostos so+re os componentes do modelo.................................................&6
!.!. ,stimao pontual dos par-metros de regresso do modelo. Teorema de <auss5Mar=o).....&6
!.'. ,.emplos de aplicao de regresso m;ltipla.....................................................................6'
!.$. 9nlise de )ari-ncia............................................................................................................0'
!.$.1. ,stimao da )ari-ncia dos erros.............................................................................0'
!.$.2. % coeficiente de determinao m;ltiplo e +ondade do a8uste....................................0$
!.$.!. "oeficientes de determinao parcial.......................................................................0$
!.&. Inferncia so+re o modelo de regresso...............................................................................06
!.&.1. Testes de /ip#teses so+re os par-metros..................................................................06
!.&.2. Inter)alos de confiana para os par-metros e resposta m*dia...................................00
!.&.!. 2redio de no)as o+ser)aes................................................................................00
'. (iagn#stico so+re o modelo de
regresso........................................................................................1$
'.1 %+ser)aes influentes e discrepantes....................................................................................1$
'.2 9)aliao do efeito de multicolinearidade no modelo de regresso linear m;ltipla.................16
$ >eleo do mel/or su+con8unto de )ari)eis independentes..........................................................131
$.1 98uste de todos os modelos poss)eis....................................................................................131
$.2 >eleo pelo m.imo ou mnimo incremento no coeficiente de determinao R
2
.................131
$.! >eleo atra)*s da estatstica "p de Mallo?..........................................................................131
$.' >eleo 5 eliminao >T,2@I>,.........................................................................................113
$.$ %s m*todos :%R@9R( e A9"B@9R(............................................................................113
!
& Regresso com )ari)eis indicadoras...........................................................................................1!2
&.1 Modelos com uma ou mais )ari)eis independentes qualitati)as..........................................1!2
&.2 ,feito de interao...............................................................................................................1!&
&.! 4ari)el dependente indicadora...........................................................................................1'2
6 9pndices
6.1 9pndice 1 5 (efinies, f#rmulas e notaes usadas no te.to..............................................1'6
6.2 9pndice 2 5 ,.erccios propostos........................................................................................1'1
6.! 9pndice ! 5 (istri+uies de : de >nedecor e t de >tudent.................................................1&3
6.' 9pndice ' 5 98uste do modelo e estatsticas de diagn#stico no >9>....................................1&2
6.$ 9pndice $ C (iagn#stico de influncia no >9>..................................................................1&$
6.& 9pndice & C M*todos de seleo de )ari)eis para o modelo usando o >9>........................162
0. Referncias +i+liogrficas...............................................................................................................16&
1 - +,T-./.012
1
1
2arte deste material foi cedido gentilmente pelo professor 7elson :ernandes de %li)eira, para a disciplina 9nlise ,statstica do curso
de +ac/arelado em ,statstica da D:Aa. 9lgumas adaptaes foram feitas e a distri+uio no foi autoriEada por aquele autor.
'
(ados podem ser o+tidos de )rias maneiras, e a maneira como os dados so
o+tidos, +em como sua natureEa especfica so fatores que determinam a anlise. (ados
podem ser o+tidos a partir de e.perimentos plane8ados, o+ser)aes de fenFmenos da
natureEa, le)antamentos etc. Gualquer que se8a a maneira pela a qual os dados so
o+tidos eles cont*m informaes a respeito de algum fenFmeno, que precisam ser
organiEadas, analisadas e interpretadas. %s dados so medidas de alguma propriedade ou
caracterstica do fenFmeno em estudo. 7este curso sero considerados m*todos de
anlise de dados +aseados em modelos de regresso linear simples e m;ltipla.
E&3ala& *e me*i*a&
9 mensurao de uma propriedade ou caracterstica qualquer implica em se
atri+uir )alores num*ricos para representar a propriedade. ,stes so )alores de )ari)eis,
freqHentemente aleat#rias, e dependendo da escala em que os )alores so medidos, as
)ari)eis podem ser classificadas nos seguintes tiposI cae!"ricas e arim#icas. 9s
)ari)eis categ#ricas so aquelas cu8os )alores so medidos numa escala que no se
presta para operaes aritm*ticas, e podem ser di)ididas em nominais e ordinais. %s
)alores das )ari)eis nominais so apenas r#tulos, sem qualquer relao l#gica entre eles,
como por e.emplo nas )ari)eis se.o JmasculinoKfemininoL, estado ci)il JsolteiroKcasadoL
etc. ,ntre estas )ari)eis, as dico$micas, isto *, aquelas que tem apenas dois )alores
poss)eis, ocorrem com muita freqHncia, em )rias reas de aplicao. 9s )ari)eis
ordinais so aquelas cu8os )alores apresentam uma relao l#gica de ordem entre eles,
como por e.emplo, nas )ari)eis n)el de instruo Jcom )alores 1M. grau, 2M. grau, !M.
grau, etc.L, ou em intensidade do efeito J com )alores fraco, moderado e se)ero, etc.L.
9s )ari)eis aritm*ticas so aquelas medidas numa escala apropriada para operaes
aritm*ticas, e podem ser su+di)idas em discreas e con%n&as. 9s )ari)eis discretas tem
)alores isom#rficos ao con8unto Jou qualquer su+con8untoL dos n;meros inteiros, e as
contnuas tem )alores isom#rficos ao con8unto dos n;meros reais. Dsualmente as
)ari)eis discretas resultam de contagens JfreqHnciasL, enquanto que as contnuas
resultam de medidas onde so usados instrumentos de medida como padres de
comprimento, massa, etc. 9s )ari)eis contnuas podem ser medidas em diferentes
escalas como por e.emplo as c/amadas de raEo, inter)alar, circular, etc. 9s escalas de
raEo tem um Eero ar+itrrio, como a medida de temperatura, por e.emplo. 9 escala
inter)alar tem o Eero fi.o, como as medidas de altura, peso, etc. ,.emplos de dados
medidos em escala circular so -ngulos, /orrio, etc. 2ode5se falar ainda de )ari)eis
derivadas, como percentagens, ta.as, ndices, ran=ings, etc.
4(5li&e *e *a*o&
,m qualquer aplicao, todos os tipos de )ari)eis mencionadas no item anterior, podem
ser o+ser)adas. Muitos m*todos estatsticos so especficos para determinados tipos de
)ari)eis, sendo portanto fundamental a escol/a adequada do m*todo, de acordo com o
tipo de dado. 7este curso, ser considerado o m*todo de regresso linear para anlise de
dados referentes a )ari)eis aritm*ticas. ,ste m*todo * +aseado em modelos estatsticos,
especificamente no modelo linear geral JMN<L. Isto significa que o modelo de regresso
linear * um caso particular do modelo linear geral.
$
Dm paradigma geral para anlise de dados contnuos * proposto a seguir J+aseado em
Oelms, R. @., 'enera( (inear mode(s )or he ana(*sis o) conin&o&s daa, citado por
:ernandes, 7. %LI
I 5 9nlise descriti)a e e.plorat#ria dos dados 5 :aEer anlise descriti)a das )ari)eis
importantes com o o+8eti)o de detectar anomalias, no normalidade,
/eterocedasticidades, etc.P
II 5 (efinio do modelo 5 ,specificar o modelo. 7o caso do modelo linear ,J6L Q 7 ,
a definio consiste em se especificar 6, 7 e , +em como 4arJ6LP
III 5 (efinio de par-metros e /ip#teses 5 (efinir , a priori, os par-metros de interesse,
com+inaes lineares de , RcontrastesS, Refeitos R, etc. e /ip#teses a serem testadasP
I4 5 98ustes do modelo, estimao de par-metros e teste de /ip#teses 5 Dsando5se os
dados, a8ustar o modelo especificado no item II, estimar os par-metros de interesse e
testar /ip#teses. 4erificar a R+ondadeS do a8ustamento atra)*s de t*cnicas de
diagn#sticoP
4 5 Interpretao dos resultados e concluses C T o processo de se atri+uir significado
aos resultados dos testes de /ip#teses e refletir so+re a rele)-ncia e import-ncia dos
mesmos. 2ossi+ilidade de interpolao e e.trapolao.
1.1 - -ela89e& *e *e$e(*:(3ia e i(ter*e$e(*:(3ia. -e"re&&;o e 3orrela8;o
1.1.1 - Termi(olo"ia< (ota8;o e =ue&t9e& e&$e3>fi3a&
7o estudo de anlise de regresso, * comum se falar do efeito da )ari)el Jou
)ari)eisL independente so+re uma )ari)el dependente. ,ntretanto, * imposs)el pro)ar
que mudanas Jou trocasL na )ari)el independente causam mudanas Jou trocasL na
)ari)el dependente. Regresso pode ser usada , apenas para esta+elecer que as duas
)ari)eis mo)em 8untas e que a )ari)el independente contri+ui com informaes para
pre)er JestimarL a )ari)el dependente. 2or e.emplo, anlise de regresso pode ser usada
para esta+elecer que as )endas de licor cresceram durante os ;ltimos anos, salrios de
professores cresceram tam+*m, etc. 2or*m, isto no pro)a que o crescimento nas )endas
de licor foi causado pelo crescimento dos salrios dos professores. 2ro)a)elmente,
am+as as )ari)eis foram influenciadas por uma terceira )ari)el econFmica ao longo do
tempo.
1.2 ? Mo*elo& matem5ti3o& e mo*elo& e&tat>&ti3o&
-ela8;o fu(3io(al e(tre *ua& @ari5@ei&
Dma relao funcional entre duas )ari)eis * e.pressa por uma f#rmula
matemtica. >e U * a )ari)el independente e V, a )ari)el dependente, a relao
funcional * da formaI V Q fJUL. (ado um particular )alor de U, a funo f indica o
correspondente )alor de V.
&
,.emplo 1.2.1 J9daptado de 7eter, 116'LI "onsidere a ralao entre o )alor das )endas
de um produto JVL, )endido a um preo fi.o, e o n;mero de unidades )endidas JUL. >e o
preo de )enda for RW 2,33 por unidade, a relao * e.pressa pela equaoI V Q 2U.
,sta relao funcional * ilustrada com a ta+ela 1.2.1 e figura 1.2.1. 9 ta+ela 1.2.1
apresenta o n;mero de unidades )endidas e o )alor das )endas em unidades monetrias
em trs recentes perodos, enquanto os preos permaneceram constantes. %+ser)a5se na
figura 1.2.1 que a relao funcional entre as )ari)eis U e V * uma relao perfeita, ou
se8a, os pares de pontos que formam a relao entre as duas )ari)eis caem so+re uma
lin/a reta no grfico.
,.emplo 1.2.2 J 9daptado de 7eter, 116'LI % preo de aluguel de autom#)eis de uma
agncia * definido pela seguinte equaoI V Q 0 X 3.1$ U, onde
V Q Ta.a de aluguel JRWLP U Q dist-ncia percorrida J=mLP 0 Q ta.a de ser)ios JRWLP 3.1$
Q ta.a por =m rodado JRWL.
T interessante mencionar que, nos e.emplos 1.2.1 e 1.2.2 os pontos JU, VL caem
e.atamente so+re uma lin/a reta, na representao grfica da relao entre as )ari)eis.
Ta+ela 1.2.1 4endas de um dado produto V Q )alor das )endas

2erodo Dnidades 4alor das V Q 2U
)endidas )endas 2&3
1 6$ 1$3
2 2$ $3 1$3
! 1!3 2&3
2$
3 2$ 6$ 1!3 U
Dnidades )endidas
:igura 1.2.1 5 Ilustrao de uma relao
funcional
-ela8;o e&tat>&ti3a e(tre *ua& @ari5@ei&
9 relao estatstica, diferente da relao funcional, no * uma relao perfeita
entre as duas )ari)eis. <eralmente, as o+ser)aes de uma relao estatstica no caem
e.atamente so+re a cur)a de relacionamento.
,.emplo 1.2.! J7eter, 116'LI Dma certa pea * manufaturada por uma compan/ia, uma
)eE por ms, em lotes que )ariam de taman/o de acordo com as flutuaes na demanda.
9 ta+ela 1.2.2 cont*m dados so+re taman/o do lote e n;mero de /oras 5 /omem gastas
na produo de 13 recentes lotes produEidos so+ condies similares. ,stes dados so
apresentados graficamente na figura 1.2.2, tomando5se /oras 5 /omem como )ari)el
de+endene ou )ari)el res+osa JVL e o taman/o do lote como )ari)el inde+endene ou
+redicor JUL. 9 figura 1.2.2 sugere claramente que / uma relao entre o taman/o do
lote e o n;mero de /oras 5 /omem, de modo que, maiores lotes tendem a corresponder a
maiores n;meros de /oras 5 /omem consumidas. 2orem, a relao no * perfeita, ou
se8a, / uma disperso de pontos sugerindo que alguma )ariao no n;mero de /oras 5
/omem no * dependente do taman/o do lote. 2or e.emplo, dois lotes de !3 unidades J1
e 0L demandaram quantidades um pouco diferentes de /oras 5 /omem. 2or ser a
disperso dos pontos numa relao estatstica, a figura 1.2.2 * denominada dia!rama de
dis+ers,o. 7a terminologia estatstica, cada ponto de um diagrama de disperso *
denominado o-serva.,o ou ensaio. 7a figura 1.2.2 foi traada uma lin/a JretaL de
6
relacionamento descre)endo a relao estatstica entre /oras 5 /omem e taman/o do lote.
,la indica a tendncia geral da )ariao em /oras 5 /omem quando / trocas no taman/o
do lote.
%+ser)a5se que a maioria dos pontos da figura 1.2.2 no cai diretamente so+re a
lin/a de relacionamento estatstico. 9 disperso dos pontos em torno da lin/a de
relacionamento representa a )ariao em /oras 5 /omem que no * associada ao taman/o
do lote, e que * usualmente considerada aleat#ria. Relaes estatsticas so geralmente
;teis, mesmo no tendo uma relao funcional e.ata.
% relacionamento estatstico entre )ari)eis pode no ser linear como no e.emplo
anterior. % e.emplo seguinte J,.emplo 1.2.', :igura 1.2.!L refere5se ao relacionamento
entre idade de /omens )ari)el independente 5 UL e o correspondente ndice de
participao da fora de tra+al/o na industria J)ari)el dependente 5 VL, em pases
industrialiEados, em 11&3 J9daptado de 7eter, 116'L. 7este e.emplo o+ser)a5se uma
relao cur)ilnea entre as )ari)eis.
Ta+ela 1.2.2 Taman/o de lotes e n;mero de /oras 5 /omem
gastas na produo de cada lote.
Note J i L Taman/o do lote JUiL Ooras 5 /omem JViL Ooras5/omem
1 !3 6! V
2 23 $3
! &3 120 1$3
' 03 163
$ '3 06
& $3 130 133
6 &3 1!$
0 !3 &1
1 63 1'0 $3
13 &3 1!2
3 23 '3 &3 03
Taman/o do lote U
:igura 1.2.2 5 Relao estatstica entre V e

U, referente aos dados da ta+ela 1.2.2.
VQY de participao
133


13

03
63
0
3
16 22 26 !2 !6 '2 '6 $2 $6
Idade J anosL U
:igura 1.2.! 5 Relao estatstica cur)ilnea entre idade e ndice de participao da fora de tra+al/o
masculina na ind;stria, em pases industrialiEados, 11&3.
1.2.1 ? 'o(3eito *e 3om$o(e(te aleatArio ou erro (o& mo*elo& e&tat>&ti3o&
"onsidere o caso mais simples de regresso onde apenas uma )ari)el
independente * tratada e a funo de regresso e linear. % modelo pode ser esta+elecido
da seguinte formaI
V
i
Q
0
+
1
U
i
X
i
(1.2.1)
ondeI V
i
* o )alor da )ari)el resposta no i5*simo ensaio ou o+ser)ao

0
e
1
so par-metros
U
i
* uma constante, ou se8a, o )alor da )ari)el independente no i5*simo ensaio

i
* um erro aleat#rio com ,J
i
L Q 3 e
2
J
i
L Q ,J
i
2
L Q
2
P e os
i
so no
correlacionados de modo que a co)ari-ncia J
i
,
8
L Q3 para todo i, 8 i 8 P i Q 1,
2, .... n.
% modelo J1.2.1L * dito ser sim+(es, (inear nos +ar/meros e (inear na vari0ve(
inde+endene. ,le * RsimplesS porque tem apenas uma )ari)el independente, Rlinear nos
par-metrosS porque nen/um par-metro aparece em e.poente ou * multiplicado ou
di)idido por outro par-metro, e Rlinear na )ari)el independenteS porque, esta aparece
apenas ele)ada Z primeira potncia. % modelo que * linear nos par-metros e na )ari)el
independente * tam+*m c/amado modelo de primeira ordem.
+m$orta(te& 3ara3ter>&ti3a& *o mo*elo
aL % )alor o+ser)ado de V no i5*simo ensaio * a soma de dois componentesI J1L o termo
constante
0
+
1
U
i
, e J2L o termo aleat#rio
i
. Nogo V * uma )ari)el aleat#ria.
+L (esde que ,J
i
L Q 3, segue que ,JV
i
LQ ,J
0
+
1
U
i
X
i
L Q
0
+
1
U
i
X ,J
i
L Q

0
+
1
U
i
. 9ssim, a )ari)el resposta V
i
, quando o n)el de U no i5*simo ensaio * U
i
,)em de uma distri+uio de pro+a+ilidade cu8a m*dia *I
,JV
i
LQ
0
+
1
U
i
(1.2.2)
9ssim, diE5se que a funo de regresso para o modelo J1.2.1L * a e.presso J1.2.2L, 8
que a equao de regresso relaciona as m*dias das distri+uies de pro+a+ilidade de V
para qualquer dado U, com os n)eis de U.
cL % )alor o+ser)ado de V na i5*sima o+ser)ao, e.cede ou cai a+ai.o do )alor de
funo de regresso, de uma quantidade
i
c/amada termo do erro.
dL %s
i
so assumidos ter )ari-ncia constante
2
. ,nto, a )ari-ncia da )ari)el resposta
V
i
para qualquer U
i
*I
1

2
(ViL Q
2
(1.2.3)
9ssim, o modelo J1.2.1L assume que as distri+uies de pro+a+ilidade de V tem a mesma
)ari-ncia
2
qualquer que se8a o n)el da )ari)el independente U .
eL %s termos do erro so assumidos no correlacionados. 2ortanto, o resultado de
qualquer ensaio no tem nen/um efeito so+re o termo do erro para qualquer outro
ensaio, ou se8a ser positi)o ou negati)o, grande ou pequeno, etc. >endo no
correlacionados os termos do erro, tam+*m sero os V[s.
fL ,m resumo, o modelo J1.2.1L implica que as o+ser)aes da )ari)el resposta V
i
, )em
de distri+uies de pro+a+ilidade cu8as m*dias so ,JV
i
LQ
0
+
1
U
i
e cu8as )ari-ncias
so
2
, a mesma para todos os n)eis de U. 9dicionalmente, quaisquer duas o+ser)aes
V
i
e V
8
so no correlacionadas.
1.3 ? 2 mo*elo *e -e"re&&;o (a $o$ula8;o e (a amo&tra
Dm modelo de regresso * um meio formal de e.pressar duas caractersticas
essenciais de uma relao estatsticaI
aL 9 tendncia da )ari)el dependente V )ariar com a )ari)el ou )ari)eis
independentesP
+L 9 disperso das o+ser)aes em torno da cur)a de relacionamento estatstico entre as
)ari)eis.
,stas duas caractersticas so incorporadas num modelo de regresso
postulando5se queI
1L 7a populao de o+ser)aes associadas com o processo amostrado / uma
distri+uio de pro+a+ilidade de V para cada n)el de UP
2L 9s m*dias dessas distri+uies de pro+a+ilidade )ariam de uma maneira sistemtica
com U.
"onsidere o e.emplo da )ari)el dependente V, n;mero /oras 5 /omem e
)ari)el independente U, taman/o do lote de peas produEidas, discutido na seo 1.2.
2ara cada taman/o de lote e.iste uma postulada distri+uio de pro+a+ilidade de V. 9
figura 1.2.' J7eter, 116' 5 adaptadaL mostra esta distri+uio de pro+a+ilidade para
UQ!3, que * o taman/o do lote da primeira lin/a da ta+ela 1.2.2. % n;mero de /oras5
/omem, VQ6!, * )isto como uma seleo aleat#ria desta distri+uio de pro+a+ilidade
UQTaman/o do lote
63
$3
Nin/a de regresso
(istri+uio de pro+a+ilidade de V
!3
13
2ara U Q !3 ,JVL Q
0
+
1
J!3L
3
Ooras5/omem V
:igura 1.2.' Representao pictorial do modelo de regresso linear J7eter, 116'5adaptadaL
9 figura 1.2.' apresenta tam+*m as distri+uies de pro+a+ilidade de V para os
taman/os de lote UQ$3 e UQ63. 7ote que as m*dias das distri+uies de pro+a+ilidade
tem uma relao sistemtica com os n)eis de U. ,ste relacionamento sistemtico *
c/amado )&n.,o de re!ress,o de 1 em 2. % grfico da funo de regresso * c/amado
c&rva de re!ress,o. 7ote que na figura 1.2.' a funo de regresso * linear. Isto implica
que, neste e.emplo, o n;mero esperado Jm*diaL de /oras5/omem )aria linearmente com
o taman/o do lote.
9 priori, no / raEo para o n;mero de /oras5/omem relacionar5se linearmente
com o taman/o do lote. 9 figura 1.2.$ e.i+e outro poss)el modelo de regresso para o
e.emplo em curso. 7esta figura, a funo de regresso e cur)ilnea, refletindo economia
de escala com maiores taman/os de lotes, para o e.emplo da figura 1.2.'.
Modelos de regresso podem diferir na forma da funo de regresso, como
ilustram as figuras 1.2.' e 1.2.$. ,les podem tam+*m diferir quanto a forma das
distri+uies de pro+a+ilidade dos V[s, e ainda em outras maneiras. ,ntretanto, qualquer
que se8a a )ariao, o conceito da distri+uio de pro+a+ilidade de V, dado U, * a id*ia
formal para a disperso emprica na relao estatstica. >imilarmente, a cur)a de
regresso que descre)e a relao entre as m*dias das distri+uies de pro+a+ilidade de
V, e U, * a id*ia +sica para a tendncia geral de V )ariar com U sistematicamente na
relao estatstica.
%+ser)aoI 9s e.presses R)ari)el independenteS para U e R)ari)el dependenteS ou
R)ari)el respostaS para V no modelo de regresso * apenas con)eno. 7o /
implicao que V forosamente dependa de U. Dma forte relao estatstica, no
significa necessariamente uma relao causa5efeito. ,m algumas situaes, a )ari)el
independente na )erdade, * dependente da )ari)el resposta. Dm e.emplo * quando
estimamos a temperatura J)ari)el respostaL atra)*s da altura da coluna de merc;rio no
termFmetro J)ari)el independenteL. 7a )erdade, a altura da coluna de merc;rio * que
depende da temperatura.
V Q economia de escala
"ur)a de
regresso
(istri+uio de
pro+a+ilidade
de V
11
3 !3 $3 63 U
Taman/o do lote
:igura 1.2.$ 5 Representao pictorial do modelo de regresso cur)ilnea
Mo*elo& *e re"re&&;o 3om *ua& ou mai& @ari5@ei& i(*e$e(*e(te&
Modelos de regresso podem ter mais que uma )ari)el independente. Dm
e.emplo * a aplicao de anlise de regresso referente a &6 escrit#rios de uma
compan/ia financeira J7eter, 116' 5 adaptadoL. % modelo de regresso cont*m custos
operacionais diretos anuais como )ari)el resposta e quatro )ari)eis independentes 555
)alor m*dio dos empr*stimos JanualL, n;mero m*dio de empr*stimos JanualL, n;mero
total de no)os clientes e ndice de escala de salrios do escrit#rio. Muitos outros
e.emplos aparecem na literatura especialiEada de aplicaes de regresso en)ol)endo
duas ou mais )ari)eis independentes.
9s caractersticas das figuras 1.2.' e 1.2.$ de)em ser estendidas em mais
dimenses, quando / mais de uma )ari)el independente no modelo. "om duas
)ari)eis independentes, digamos U
1
e U
2
, a distri+uio de pro+a+ilidade de V para cada
com+inao JU
1
, U
2
L * assumida pelo modelo de regresso. 9 relao sistemtica entre
as m*dias dessas distri+uies de pro+a+ilidade e as )ari)eis independentes U
1
e U
2
, *
dada pela superfcie de regresso.
'o(&tru8;o *e mo*elo& *e re"re&&;o
7a construo de modelos de regresso em situaes prticas de interesse,
apenas um n;mero reduEido de )ari)eis independentes ou preditoras pode Jou de)eL ser
usado. Dm pro+lema central portanto, * a seleo de um Rmel/orS con8unto de )ari)eis
independentes a serem usadas num modelo de regresso. Dm fator preponderante na
escol/a de uma )ari)el independente a ser includa no modelo * considerar a
contri+uio na reduo da )ariao remanescente em V, quando outras )ari)eis
independentes, tentati)amente 8 foram includas no modelo. %utras consideraes so
import-ncia da )ari)el como um agente causal no processo so+ anlise, o grau com que
o+ser)aes possam ser o+tidas mais acuradamente, ou rapidamente, ou
economicamente, etc.
Forma fu(3io(al *a e=ua8;o *e re"re&&;o
9 escol/a da forma funcional da equao de regresso est relacionada a escol/a
das )ari)eis independentes. 9lgumas )eEes, o con/ecimento te#rico do processo pode
indicar uma apropriada forma funcional da equao de regresso. Teoria da
aprendiEagem, por e.emplo, pode indicar que a funo de regresso relacionando custo
unitrio de produo de um dado item, com o n;mero de )eEes que o item foi
produEido, de)e ter uma especfica forma, com propriedades particulares assint#ticas.
2orem, mais freqHentemente, a forma funcional da equao de regresso, no *
con/ecida Z priori, e tem que ser escol/ida ap#s os dados terem sido tomados e
analisados. 9ssim funes de regresso lineares e quadrticas so freqHentemente
satisfat#rias como primeiras apro.imaes das funes de regresso de natureEa
descon/ecida. Mesmo quando o con/ecimento te#rico re)ela que a forma da relao
funcional * mais comple.a que relaes lineares e quadrticas, estas podem ser usadas
12
geralmente com +oa apro.imao. 9 figura 1.2.&a ilustra um caso onde uma comple.a
funo de regresso pode ser raEoa)elmente apro.imada por uma equao de regresso
linear.
V V
JaL J+L
:igura 1.2.& 5 Dso de regresso linear para apro.imar funes de regresso mais comple.a
9 figura 1.2.&+ ilustra um e.emplo onde duas equaes de regresso linear
podem ser usadas para apro.imar uma equao de regresso mais comple.a.
4bra(":(3ia *o mo*elo
7a formulao de um modelo de regresso, usualmente * necessrio restringir
sua a+rangncia a algum inter)alo ou regio de )alores da )ari)el ou )ari)eis
independentes. 9 a+rangncia * determinada pelo delineamento da in)estigao ou pela
amplitude dos dados dispon)eis. 2or e.emplo, uma compan/ia estudando o efeito do
preo no )olume de )endas, in)estigou seis n)eis de preo )ariando de RW '.1$ a RW
&.1$. 7este caso, a a+rangncia do modelo de)e ser de pr#.imo de RW $.33 a pr#.imo
de RW 6,33. 9 forma da funo de regresso pode ser su+stancialmente diferente fora
dessa amplitude, e a in)estigao no fornece informaes da natureEa da relao
estatstica a+ai.o de RW '.1$ e acima de RW &.1$.
.&o& *a a(5li&e *e re"re&&;o
9nlise de regresso ser)e para trs grandes prop#sitosI 1L descrio, 2L controle
e !L predio. % estudo de uso de um trator numa faEenda, por e.emplo, atra)*s de
regresso pode ter carter apenas descriti)o. % e.emplo de custos operacionais dos
escrit#rios da compan/ia financeira citado na seo 1.!, pode ter prop#sitos de
administrao, controle, etc. 7a rea de neg#cios muitos e.emplos de anlise de
regresso so encontrados para estimar custos, pre)er )endas, etc. ,m cincias
+iol#gicas e ind;stria, anlise de regresso e +astante usada para estimao de produo
em diferentes processos e sistemas.
,m situaes prticas, os prop#sitos da anlise de regresso geralmente se
so+repem, ou se8a, a t*cnica pode ser usada para descrio, controle e pre)iso, ao
mesmo tempo.
1!
.m exem$lo
>upon/a que o modelo de regresso J1.2.1L referente a populao de onde foram
retirados os dados da ta+ela 1.2.2 se8a o seguinteI V
i
Q 1,$ X 2,1U
i
X
i
. 9 figura 1.2.2
apresenta a funo de regresso ,JVL Q 1,$ X 2,1U.
>upon/a que no i5*simo ensaio um lote de U
/
Q '$ unidades * produEido e o n;mero de
/oras5/omem * V
/
Q 130. 7este caso o )alor do erro *
i
Q X', pois, ,JV
i
L Q 1,$ X 2,1
J'$L Q 13', e 130 Q 13' X '.
1'
VQ Ooras5/omem
Vi Q 130
i Q X'

,JViL Q 13'
,JVL Q 1,$ X 2,1 JUL
3 2$ '$ U
Taman/o do lote
:igura 1.2.6 5 Ilustrao do modelo de regresso linear J1.2.1L
Bi"(ifi3a*o *o& $arCmetro& *e re"re&&;o
%s par-metros
0
e
1
no modelo J1.2.1L so c/amados coeficientes.
1
* a
inclinao da lin/a de regresso. ,le indica as trocas na m*dia da distri+uio de
pro+a+ilidade de V por acr*scimo unitrio em U. % par-metro
0
* o intercepto da lin/a
de regresso com o ei.o da ordenada. >e a amplitude do modelo inclui U Q 3,
0
fornece
a m*dia da distri+uio de pro+a+ilidade de V no ponto UQ3. Guando a amplitude do
modelo no inclui UQ3,
0
no tem um significado particular como termo separado do
modelo de regresso.
9 figura 1.2.0 ilustra o significado dos coeficientes do modelo de regresso
,JVL Q 1,$ X 2,1 U
VQ/oras5/omem

1
Q2,1
,JVL Q 1,$ X 2,1 U
$3 Incremento unitrio em U

0
9,5
3 13 23 !3 '3 U JTaman/o do loteL
:igura 1.2.0 5 >ignificado dos par-metros da regresso linear simples
-e"re&&;o @er&u& 3orrela8;o
1$
,streitamente relacionada, por*m conceitualmente diferente da anlise de
regresso, * a anlise de correlao, cu8o o+8eti)o +sico * medir a intensidade ou grau
de associao linear entre duas )ari)eis aleat#rias. % coeficiente de correlao
Jgeralmente representado pela letra do alfa+eto grego, L mede a intensidade da
associao linear entre as )ari)eis. 2or e.emplo, pode ser de interesse ac/ar a
correlao Jseu coeficienteL entre o /+ito de fumar e a ocorrncia de c-ncer de pulmo,
entre as notas em e.ames de ,statstica e Matemtica, entre as notas no col*gio e na
faculdade, etc. 7a anlise de regresso em princpio, no se estar interessado em medir
essa associao, mas sim, pre)er o )alor da )ari)el resposta com +ase nos )alores
fi.ados da )ari)el Jou )ari)eisL independente. 9ssim, na regresso pode ser de
interesse sa+er se * poss)el pre)er a nota m*dia rece+ida pelos alunos em uma pro)a de
,statstica com +ase na nota de uma pro)a de Matemtica, ou com +ase no n;mero de
/oras de estudo.
4ale a pena ressaltar algumas diferenas fundamentais entre regresso e
correlao. 7a anlise de regresso / uma assimetria na forma como as )ari)eis
dependente e independente so tratadas. >upe5se que a )ari)el dependente * aleat#ria
e segue uma distri+uio de pro+a+ilidade e a )ari)el Jou )ari)eisL independente tem
)alores fi.ados em amostragem repetida. T importante salientar que )ari)eis
independentes podem ser intrinsecamente aleat#rias, mas, para fins de anlise de
regresso admite5se que seus )alores so fi.ados por meio de amostragem repetida,
con)ertendo5se assim em fi.as. 2or outro lado, na anlise de correlao trata5se
quaisquer duas )ari)eis simetricamente, sem /a)er distino entre )ari)el dependente e
independente, sendo as duas )ari)eis consideradas aleat#rias, com distri+uio
+i)ariada.
Der&9e& alter(ati@a& *o mo*elo *e re"re&&;o
9lgumas )eEes * con)eniente escre)er o modelo J1.2.1L de modo diferente,
muito em+ora de forma equi)alente. >e8a U
3
uma identicamente igual a um. ,nto
J1.2.1L pode ser escrito como V
i
Q
0
U
3
+
1
U
i
X
i
, onde U
3
1.
%utra modificao algumas )eEes con)eniente * usar os des)ios da )ari)el
independente J U
i
5 2 L em lugar de U
i,
, onde 2 * a m*dia aritm*tica dos Ui. 2ara
dei.ar o modelo J1.2.1L no modificado, de)e5se escre)erI
V
i
Q
0
+
1
JU
i
5 2 L X
1
2 X
i

Q J
0
+
1 2 L

+
1
JU
i
5 2 L X
i

Q
0

+
1
JU
i
5 2 L X
i
Q
0

+
1
.
i
X
i
onde
0

Q J
0
+
1 2 L e .
i
Q U
i
5
2
1.4 - /a*o& *e 3orte& tra(&@er&ai& e *a*o& *e &Erie& tem$orai&
(ados empregados em anlise de regresso podem ser o-servaciona( o&
e3+erimena(. 9dicionalmente os dados podem ser classificados em s#ries em+orais e
cores ransversais 4cross-seciona( daa5. (iE5se que dados so o+ser)acionais quando
os )alores das )ari)eis independentes U
1
, U
2
,...., U
=
, no podem ser controlados, mas,
medidos sem erro. >e os )alores das )ari)eis independentes so esta+elecidos antes dos
)alores da )ari)el dependente V serem o+ser)ados, diE5se que os dados so
e.perimentais. Guando dados so o+ser)ados em ordem de tempo eles so denominados
dados de s*ries temporais. (ados de s*ries temporais geralmente consistem de
1&
o+ser)aes anuais, quadrimestrais, mensais, porem, qualquer outro perodo de tempo
pode ser usado. Guando os dados so o+ser)ados num ponto no tempo eles so
denominados cortes trans)ersais.
<eralmente, a quantidade de informao o+tida num estudo de regresso *
afetada pela escol/a apropriada do modelo de regresso, quantidade de dados coletados
e )alores das )ari)eis independentes que so empregadas. Guando os )alores de U
1
,
U
2
,...., U
=
, podem ser controlados, * )anta8oso empregar o delineamento de
e.perimento. ,mpregando5se um e.perimento delineado, pode5se aumentar a quantidade
de informao o+tida no estudo.
2 - 2 M2/EF2 /E -EG-EBB12 F+,E4- B+M!FEB
2.1 ? 'o(3eito& e $re&&u$o&to& &obre o& 3om$o(e(te& *o mo*elo *e re"re&&;o
% modelo de regresso linear * simples, quando en)ol)e apenas uma )ari)el
independente. 7a populao, a equao matemtica deste modelo * V
i
Q
0
+
1
U
i
X
i
com i Q 1, 2, ... . e ,JVL Q
0
+
1
U. 9ssume5se que os Vi so o+ser)aes de
distri+uies de pro+a+ilidade cu8as m*dias )ariam linearmente com as o+ser)aes da
)ari)el independente U. %s )alores Ui so considerados fi.os, ou se8a, medidos sem
erro. %s
i
so considerados )ari)eis aleat#rias no correlacionadas e identicamente
distri+udos com m*dia Eero e )ari-ncia
2
.
2.2 ? E&tima8;o $o(tual *o& $arCmetro&
%s par-metros do modelo V
i
Q
0
+
1
U
i
X
i
a serem estimados a partir de
dados o+ser)ados so portanto
0
,
1
e
2
. %s dados consistem de n pares de
o+ser)aes JUi, ViL. % m*todo dos mnimos quadrados apresentado na seo 2.2.1
pode ser usado para estimao dos par-metros. 2ara testes de /ip#teses e construo de
inter)alos de confiana para os par-metros e )alores estimados, pressupe5se o termo do
erro , uma )ari)el aleat#ria seguindo distri+uio normal de m*dia Eero e )ari-ncia
2
,
sim+olicamente,
i
H i.i.d. 7J3,
2
L. "om essa pressuposio, pode5se usar o m*todo da
m.ima )erossimil/ana para estimati)a dos par-metros, que sero tratados 2.2.2.
2.2.1 ? MEto*o *o& m>(imo& =ua*ra*o&
4 i*Eia b5&i3a *o mEto*o
2ara e)itar o crit*rio su+8eti)o na construo de cur)as de a8ustamento que se
adaptem ao con8unto de dados, * necessrio instituir uma definio de Rmel/or cur)a de
a8ustamentoS. 2ara conseguir essa definio considere a figura 2.2.1 J>piegel , 110'5
adaptadaL a+ai.o, onde os dados so representados pelos pontos JU
1
, V
1
L, JU
2
, V
2
L, ... ,
JU
n
, V
n
L. 2ara um dado )alor U, por e.emplo U
1
, /a)er uma diferena entre V
1
e o
)alor correspondente determinado na cur)a ". Representa5se esta diferena por (
1
,
geralmente denominada erro ou desvio, ou res%d&o, e pode ser positi)o, negati)o ou
nulo. >imilarmente, o+t*m5se os des)ios (
2
, (
!
, ... , (
n
, correspondentes a U
2
, U
!
, ... ,U
n
.
16
V

" (n


(!
(2
(1
U1 U2 Un U
:igura 2.2.1 5 Representao pictorial do m*todo dos quadrados mnimos
Dma medida da Rqualidade do a8ustamentoS da cur)a " aos dados o+ser)ados
JadernciaL * proporcionada pela quantidade G Q (
1
2
X(
2
2
X ...X(
n
2
. >e ela * pequena, o
a8ustamento * +om, se ela * grande, * inadequado. 9ssim, pode5se adotar a seguinte
definioI /e to*a& a& 3ur@a& =ue &e aIu&tam a um 3o(Iu(to *e $o(to&< a =ue tem a
$ro$rie*a*e *e a$re&e(tar o m>(imo @alor *e J K /
1
2
L/
2
2
L ...L/
(
2
E *e(omi(a*a a
mel#or 3ur@a *e aIu&tame(to. /iM-&e =ue uma 3ur@a =ue a$re&e(te e&&a
$ro$rie*a*e< aIu&ta o& *a*o& (o &e(ti*o *o& m>(imo& =ua*ra*o&< e E *e(omi(a*a
3ur@a *e m>(imo& =ua*ra*o&.
T costume empregar5se a definio acima quando U * a )ari)el independente e
V a )ari)el dependente. >e U for a )ari)el dependente, a definio * modificada,
considerando5se os des)ios /oriEontais, em )eE dos )erticais, o que resulta em uma troca
entre os ei.os dos U[s e V[s. ,stas duas definies geralmente conduEem a cur)as de
mnimos quadrados diferentes.
%s (
i
[s acima definidos so considerados )ari)eis aleat#rias, podendo ter
)ari-ncias constantes ou no. 9 o+teno da equao a8ustada com +ase numa amostra
de n pares U, V, consiste em minimiEar G. Guando a )ari-ncia * constante, e o m*todo *
aplicado conforme descrito acima sem modificao, ele * c/amado m%nimos 6&adrados
ordin0rios. Guando a )ari-ncia no * constante, ou se8a )aria nos diferentes n)eis de U,
* sugerido atri+uir pesos aos (
i
[s antes de minimiEar a quantidade G. 7este caso o
m*todo * denominado m%nimos 6&adrados +onderados ou !enera(i7ados %s pesos so
geralmente tomados como o in)erso das )ari-ncias.
<eralmente, a o+teno dos pesos para serem usados nos mnimos quadrados
ponderados requer o uso num primeiro estgio dos mnimos quadrados ordinrios. 7este
caso, a aplicao do m*todo * con/ecida como m%nimos 6&adrados em dois o& mais
es0!ios.
4$li3a8;o *o mEto*o (o 3a&o *e uma *i&tribui8;o 3om um )(i3o $arCmetro
7o caso de um ;nico par-metro , as o+ser)aes amostrais podem se assumidas
da forma V
i
Q f
i
JL X
i
, onde f
i
JL * uma funo con/ecida do par-metro e
i
so
)ari)eis aleat#rias, usualmente assumidas ter ,J
i
L Q 3. 7o m*todo dos quadrados
10
mnimos a soma de quadrados


n
i
i i
) 1 8
1
2
L\ J ]
* considerada. % estimador de
mnimos quadrados de * o+tido minimiEando a quantidade G em relao a . ,m
muitas inst-ncias os estimadores de mnimos quadrados so no tendenciosos e
consistentes.
4$li3a8;o *o mEto*o (o mo*elo *e re"re&&;o li(ear &im$le&
2ara o modelo V
i
Q
0
+
1
U
i
X
i
o m*todo dos mnimos quadrados consiste em estimar
a reta ,JV
i
LQ
0
+
1
U
i
cu8a soma dos quadrados das dist-ncias )erticais dos Vi[s a ela
se8a a menor poss)el. %u se8a, o m*todo consiste em estimar
0
e
1
que determinam a
reta de tal modo que

n
i
i i
1 1
1
2
L
^
J
se8a o menor poss)el.
i
1
^
* o estimador de ,JViL,
ou se8a o estimador da m*dia da distri+uio dos Vi[s. (enotando por e
i
o des)io Jou
resduoL da i5*sima o+ser)ao, ou se8a e
i
Q Vi 5
i
1
^
, o m*todo dos mnimos quadrados
consiste em determinar +
3
e +
1
Jestimadores de
0
e
1
L de modo que



n
i
i
n
i
i i
e 1 1
1
2
1
2
L
^
J
se8a o menor poss)el. ,m outras pala)ras, consiste em determinar os )alores +
3
e +
1
que
minimiEam



n
i
n
i
n
i
i i i i i
2 - - 1 1 1 e 8
1 1 1
2
1 3
2 2
L J L
^
J
. :aEendo
3
3

-
8
e
3
1

-
8
, o+t*m5
se o seguinte sistema de equaes linearesI


+
n
i
i
n
i
i
1 2 - n-
1 1
1 3
e


+
n
i
i i
n
i
i
n
i
i
1 2 2 - 2 -
1 1
2
1
1
3
. Resol)endo este sistema,
o+t*m5se


2
1
1
2
1
2
1
1 1
1
L J
L LJ J
L J 2 2
1 1 2 2
n
2
2
n
1 2
1 2
-
i
n
i
i i
n
i
i
n
i
i
n
i
n
i
n
i
i i
i i
e
2 - 1 -
1 3

(2.2.1)
>endo
n
1
1
n
i
i

1
e
n
2
2
n
i
i

1
. 9ssim
i
1
^
Q +
3
X +
1
U
i
2ode5se demonstrar que um estimador no tendencioso de
2
*
2
^
1
2
2

n
e
n
i
i

. Guando o
modelo de regresso for tratado so+ o enfoque da anlise de )ari-ncia, na seo 2.&, ser
apresentada outra alternati)a para a estimati)a de
2
.
11
Exer3>3io 2.2.1 C Ilustrao do a8uste de um modelo de regresso linear simples
%s dados a+ai.o referem5se a um e.perimento para a)aliar o efeito da
concentrao de oEFnio na produo de so8a, citado por Ra?lings, _.%P >. <. 2antula e
(. 9. (ic=e`. 9pplied Regression 9nal`sisI 9 Researc/ Tool 2
nd
>pringer54erlag, 7V,
1110 J2gina $L. 98uste um modelo de regresso linear simples da forma J1.2.1L aos
dados.
Ta+ela 2.2.1 2roduo de +iomassa JgKplantaL de plantas de so8a e concentrao de
%EFnio JppmL.
i X Y X
2
Y
2
XY
i
1
^
e
i
e
i
2
1 0.02 242 0.0004 58564 4.84 247.56 -5.563 30.947
2 0.07 237 0.0049 56169 16.59 232.89 4.113 16.917
3 0.11 231 0.0121 53361 25.41 221.15 9.854 97.101
4 0.15 201 0.0225 40401 30.15 209.40 -8.404 70.627
Soma 0.35 911 0.0399 208495 76.99 911.09 0.0 215.597
Mdia 0.0875 227.75
Bolu8;o
% o+8eti)o deste e.erccio * ilustrar o a8uste de um modelo de regresso linear
simples da forma V
i
Q
0
+
1
U
i
X
i
com +ase em ' pares Jn Q 'L de dados. 9 )ari)el
independente U * a concentrao de %EFnio em ppm e a )ari)el dependente V * a
produo de +iomassa em gKplanta. % o+8eti)o da anlise estatstica * propor o modelo
de regresso linear simples para pre)er Je.plicarL a produo de +iomassa de plantas de
so8a em funo da concentrao de %EFnio. DtiliEando5se as e.presses 2.2.1, o+te)e5se
para os dados acima apresentados +
3
Q 2$!.'! e +
1
Q 521!,$!. 9 equao de regresso
a8ustada * portanto
i
1
^
Q 2$!.'! C 21!.$!U
i
.
2ara uma concentrao de %EFnio de 3.13 ppm por e.emplo, o )alor m*dio da
produo de +iomassa estimada pelo modelo *
i
1
^
Q 2$!.'! C 21!.$!J3.13L Q 22'.30.
Exer3>3io 2.2.2. C Ilustrao do a8uste de um modelo de regresso linear simples
%s dados do e.emplo 1.2.! apresentados na ta+ela 1.2.2 sero usados para
ilustrar o uso do >9> J>tatistical 9nal`sis >`stemL no a8uste de um modelo de regresso
linear simples. % programa para o+teno das estimati)as dos par-metros do modelo de
regresso linear simples * apresentado na figura 2.2.1.
options ls=78 nodate nocenter;
data a;
input x y @@;
cards;
30 73 20 50 60 128 80 170 40 87 50 108 60 135 30 69 70 148 60 132
;
23
run;
proc reg;
model y=x;
run;uit;
:igura 2.2.1 C 2rograma >9> J7,T,R3!$.>9>L para a8uste de um modelo de regresso linear simples
aos dados da ta+ela 1.2.2.
% resultado da e.ecuo do programa >9> da figura 2.2.1 encontra5se na figura
2.2.2, onde as estimati)as dos par-metros
0
,


1
e
2
, esto em negrito, ou se8a, +
3
Q
13,33333, +
1
Q 2,33333 e s
2
Q 6,$3333, sendo s
2
a estimati)a de
2
. 9 equao do
modelo de regresso linear simples a8ustado *
i
1
^
Q 13.33 C 2.33U
i
.
!"e #$% &rocedure
'odel( ')*$+1
*ependent ,aria-le( y
.nalysis o/ ,ariance
0um o/ 'ean
0ource *1 0uares 0uare 1 ,alue &r 2 1
'odel 1 13600 13600 1813333 430001
$rror 8 60300000 7.50000
5orrected !otal 9 13660
#oot '0$ 2373861 #60uare 039956
*ependent 'ean 110300000 .d7 #60 039951
5oe// ,ar 2348965
&arameter $stimates
&arameter 0tandard
,aria-le *1 $stimate $rror t ,alue &r 2 8t8
9ntercept 1 10.00000 2350294 4300 030040
x 1 2.00000 0304697 42358 430001
:igura 2.2.2 C Resultado JeditadoL da e.ecuo do programa da figura 2.2.1.
2.2.2 ? MEto*o *a m5xima @ero&&imil#a(8a
4 i*Eia b5&i3a *o mEto*o< (o 3a&o *e uma *i&tribui8;o 3om um )(i3o $arCmetro
M.ima )erossimil/ana * um m*todo geral de o+ter estimadores. DtiliEa da
distri+uio con8unta de pro+a+ilidade das o+ser)aes da amostra. Guando a
distri+uio con8unta de pro+a+ilidade * )ista como uma funo dos par-metros a
estimar, dadas as o+ser)aes de uma particular amostra, ela e c/amada funo de
)erossimil/ana. >upon/a que este8a sendo amostrado uma populao cu8a funo de
21
pro+a+ilidade fJV, L en)ol)a um par-metro . %+tidas o+ser)aes independentes V
1
,
V
2
, ..., V
n
, a funo con8unta de pro+a+ilidade das o+ser)aes amostrais *I
gJV
1
, V
2
, ...,V
n
L Q

n
i
i
1 )
1
L P J
.
Guando esta funo de pro+a+ilidade con8unta * )ista como uma funo de , dadas as
o+ser)aes da amostra, ela e c/amada funo de )erossimil/ana, NJL Q

n
i
i
1 )
1
L P J
. 9 ma.imiEao de NJL em relao a produE o estimador de m.ima )erossimil/ana
de . >o+ condies +astantes gerais, estimadores de m.ima )erossimil/ana so
consistentes e suficientes.
4$li3a8;o *o mEto*o (o mo*elo *e re"re&&;o li(ear &im$le&
"onsiderando5se para o modelo V
i
Q
0
+
1
U
i
X
i
, os
i
independentes e
distri+udos normalmente com m*dia Eero e )ari-ncia
2
tem5seI
2
2
1
2
1
L J

,
_


e ) e a funo de )erossimil/ana *I
2
1 3
2
1
1
2
, 1 3
2
1
L , P , J

,
_




i i
2 1
n
i
e * 3 9

( )
2
1 3
1
2
1
2
2 2
, 1 3
L 2 J L , P , J

,
_



i i
n
i
2 1
n
e * 3 9
%s )alores de
0
,


1
e
2
que ma.imiEam NJ
0
,
1
,
2
P .,` L so os estimadores de
m.ima )erossimil/ana. T mais con)eniente tra+al/ar com o logaritmo de NJ
0
,
1
,
2
P
.,` L e isto pode ser feito porque tanto NJ
0
,
1
,
2
P .,` L como ln]NJ
0
,
1
,
2
P .,` L\ so
ma.imiEadas para os mesmos )alores de
0
,


1
e
2
. 9ssim,


n
i
i i
2 1
n n
* 3 9
1
2
1 3
2
2 2
, 1 3
L J
2
1
ln
2
L 2 lnJ
2
L , P , J ln

n
i
i i
2 1
* 3 9
1
1 3
2
3
2
1 3
L J
1 L , P , , J ln


n
i
i i i
2 1 2
* 3 9
1
1 3
2
1
2
1 3
L J
1 L , P , , J ln


n
i
i i
2 1
n * 3 9
1
2
1 3
' 2
2
1 3
L J
2
1
2
L , P , , J ln
2


Igualando as deri)adas a Eero e procedendo as de)idas simplificaes c/ega5se ao


seguinte sistemaI
22


n
i
i i
2 1
1
1 3
3 L
a a
J


n
i
i i i
2 1 2
1
1 3
3 L
a a
J


n
i
i i
n 2 1
1
2 2
1 3
a
L
a a
J
cu8a soluo forneceI
3 3
a
- ,
1 1
a
- e
n
2 1
n
i
i i

1
2
1 3
2
L
a a
J
a

, como
estimadores de m.ima )erossimil/ana de
0
,


1
e
2
, sendo +
3
e +
1
os estimadores de
mnimos quadrados de
0
,


1
, respecti)amente )istos na seo 2.2.1.
2.3 E&tima8;o *a @ariC(3ia *o& termo& *o erro.
9 )ari-ncia
2
dos termos do erro
i
do modelo de regresso precisa ser estimada
para )rios propostos como propriedades distri+ucionais dos estimadores e preditores.
E&tima8;o $o(tual *e
2
+- !ara uma &im$le& $o$ula8;o
"onsidere a priori o pro+lema de o+ter >
2
, o estimador de
2
numa simples populao a
partir dos des)ios das o+ser)aes V
i
de sua m*dia 1 ele)ados ao quadrado e
somando,

n
i
i
1 1
1
2
L J
, c/amada soma de quadrados. 9 soma de quadrados e di)idida
pelos graus de li+erdade associados a ela. ,ste n;mero * n51 porque 1 grau de
li+erdade * perdido pelo fato de se usar 1 em lugar de . % estimador resultante *I

1
L J
1
2
2

n
1 1
:
n
i
i
,
que * um estimador no tendencioso de
2
de uma populao infinita. ,ste estimador *
geralmente c/amado de quadrado m*dio porque * uma soma de quadrados di)idida
pelo apropriado n;mero de graus de li+erdade.
++-!ara o mo*elo *e re"re&&;o li(ear &im$le&
9 l#gica do desen)ol)imento do estimador de
2
aqui * a mesma do item
anterior. Nem+re5se que
2
JViL
Q
2
JiL
Q
2
. 9qui * tam+*m necessrio calcular uma
soma de quadrados de des)ios, por*m, considerando5se que V
i
)em de diferentes
distri+uies Jdiferentes m*diasL dependendo do n)el de U
i
. 9qui o des)io de uma
2!
o+ser)ao V
i
de)e ser calculado em relao a sua correspondente m*dia estimada,
i
1
^
. 9ssim, os des)ios so os resduos e
i
Q V
i
5
i
1
^
e a apropriada soma de quadrados
denominada soma de quadrados de resduos *I
>oma de quadrados de resduos J>GResduoL Q



n
i
n
i
i i i i
2 - - 1 1 1
1 1
2
1 3
2
L J L
^
J
, ou
tam+*m c/amada soma de quadrados dos erros. 9 soma de quadrados de resduos tem n
5 2 graus de li+erdade associados a ela Jn Q n;mero de pares U, VL. (ois graus de
li+erdade so perdidos porque
3
e
1
so estimados para o+ter
i
1
^
. 9ssim, o apropriado
quadrado m*dio denominado quadrado m*dio de resduo ou quadrado m*dio do erro
denotado por GMResduo *I
GMResduo Q
2
L
^
J
2
Re
1
2

n
1 1
n
s%d&o :8
n
i
i i
2ode ser demonstrado que o quadrado m*dio de resduo acima definido * um estimador
no tendencioso de
2
, ou se8a ,JGMResduoL Q
2
. Dm estimador do des)io padro *
a raiE quadrada positi)a do quadrado m*dio do resduo.
2.4 !ro$rie*a*e& *o& e&tima*ore& *o mo*elo aIu&ta*o
!ro$rie*a*e& *o& e&tima*ore&
iL Dm estimador
^
de um par-metro * no tendencioso se ,J
^
L Q P
iiL Dm estimador
^
de um par-metro * consistente se
3 L b
^
Jb
lim


P
n

para qualquer c 3P
iiiL
^
* um estimador suficiente de se a funo de pro+a+ilidade con8unta
condicional das o+ser)aes amostrais dado
^
no depende do par-metro P
i)L
^
* um estimador de )ari-ncia mnima de se para qualquer outro estimador
d
2
L J
2
L
^
J
d


para todo
d
.
%+ser)a5se as seguintes propriedades so+re o modelo a8ustadoI
aL
3
1

n
i
i
e
P
+L

n
i
n
i
i i
1 1
1 1
^
P
cL

n
i
i i
e 2
1
3
P
dL

n
i
i i
e 1
1
3
^
P
eL 9 reta a8ustada passa pelo ponto L , J 1 2 P
fL

n
i
i i
1 ; -
1
1
, sendo

n
i
i
i
i
2 2
2 2
;
1
2
L J
L J
P
2'
Dsando as propriedades a5f acima demonstra5se que ,J+
3
L Q
3
e ,J+
1
L Q
1
,ou se8a
+
3
e +
1
so estimadores no tendenciosos de
3
e
1
, respecti)amente.
2.N DariC(3ia e erro $a*r;o *o& e&tima*ore&
"onforme )isto na seo J2.'L, +
3
e +
1
so estimadores no tendenciosos de
0
e
1
respecti)amente , ou se8a, ,J+
3
L Q
0
e ,J+
1
LQ
1
. Nogo ,J
i
1
^
L Q
0
X
1
Ui. 9s
)ari-ncias de +
3
e +
1
so dadas por
2
1
2
2
2
L J
1
3

,
_

n
i
i
-
2 2
2
n
e

n
i
i
-
2 2
1
2
2
2
L J
1

, respecti)amente. Tam+*m
o+ser)a5se que a co)ari-ncia entre +
3
e +
1
*

n
i
i
2 2
2
- - Cov
1
2
2
1 3
L J
L , J

. 9
co)ari-ncia entre 1 e +
1
* nula. 9s estimati)as das )ari-ncias e co)ari-ncia de +
3
e
+
1
so o+tidas su+stituindo
2
por seu estimador, o quadrado m*dio do resduo.
%s resultados permitem mostrar facilmente que a )ari-ncia de
i
1
^
* dada porI
2
1
2
2
2
^
L J
L J 1

1
1
1
1
]
1

n
i
i
h
1
2 2
2 2
n
h
e seu estimador *I
sid&o 8<
2 2
2 2
n
:
n
i
i
h
1
h
Re
L J
L J 1
1
2
2
2
^
1
1
1
1
]
1

>o+ pressuposio dos


i
independentes e identicamente distri+udos com m*dia
Eero e )ari-ncia
2
, )erifica5se que +
3
ter distri+uio normal com m*dia
3
e )ari-ncia
2
1
2
2
2
L J
1
3

,
_

n
i
i
-
2 2
2
n
, +
1
ter distri+uio normal com m*dia
1
e )ari-ncia

n
i
i
-
2 2
1
2
2
2
L J
1

e
i
1
^
ter distri+uio normal com m*dia
3
X
1
U
i
e )ari-ncia
2
1
2
2
2
^
L J
L J 1

1
1
1
1
]
1

n
i
i
h
1
2 2
2 2
n
h
2.6 2 e(fo=ue *a a(5li&e *e @ariC(3ia (o mo*elo *e re"re&&;o
2$
2ara o modelo de regresso linear a )ariao total da )ari)el dependente V pode
ser decomposta em duas partesI uma e.plicada pelo modelo de regresso a8ustado e
outra no e.plicada. 2ara a regresso linear simples Japenas uma )ari)el independente
UL a decomposio da )aria+ilidade total de V * geralmente apresentada conforme a
Ta+ela 2.&.1. 9 )aria+ilidade e.plicada * associada a soma de quadrados de regresso
com um grau de li+erdade. 9 )aria+ilidade de V no e.plicada * associada a soma de
quadrado de resduo ou soma de quadrado de erro.
Ta+ela 2.&.1 9nlise de )ari-ncia para o modelo de regresso linear simples.
"ausas de
)ariao
<raus de
li+erdade
>omas de
quadrados
Guadrados
m*dios
:
Regresso 1 >GRegresso GMRegresso
s%d&o 8<
!ress,o 8<
Re
Re
,rro
JResduoL
n C 2 >GResduo 9MResduo
Total n 5 1 >GTotal
2ara uma amostra n pares JU, VL, a soma de quadrados total associada a
)aria+ilidade total de V tem n51 graus de li+erdade e a soma de quadrados de resduo
tem n52 graus de li+erdade. %s quadrados m*dios so o+tidos di)idindo as somas de
quadrados pelos correspondentes graus de li+erdade.
9s somas de quadrados podem ser o+tidas atra)*s das seguintes e.pressesI
n
1
1 1 1 :8=oa(
n
i
i
n
i
i
n
i
i
2
1
1
2
1
2
L J

,
_

,
_


n
i
i
n
i
i i
i i
3
* 3
* 3 - !ress,o :8
1
2
2
1
1
Re
sendo
1 1 * 2 2 3
i i i i
e

2
1
2
L
^
J Re
i i
n
i
i
1 1 e s%d&o :8
. 2ode ser )erificado que


+
n
i
i i
n
i
i
n
i
i
1 1 1 1 1 1
1
2
1
2
1
2
L
^
J L
^
J L J
>GTotal Q >GRegresso X >GResduo
2ode5se demonstrar que as esperanas matemtica das somas de quadrados e
quadrados m*dios so e.pressas comoI
2
1
2 2
1
L 1 J L J +

n 3 :8=oa( E
n
i
i
e
2
1
2 2
1
L J +

n
i
i
3 :8<ode(o E
"omo >GResduo Q >GTotal C >GModelo
,J>GResduoL Q ,J>GTotalL C ,J>GModeloL, ou se8a, ,J>GResduoL Q Jn52L
2
2&
% quadrado m*dio de resduo * definido como a soma de quadrados de resduo di)idida
por n52. 9ssim, o+ser)a5se que a esperana do quadrado m*dio do resduo *
2
, ou se8a,
o quadrado m*dio do resduo * um estimador no tendencioso de
2
.
9tra)*s do teorema de "oc/ran demonstra que as somas de quadrados de
regresso e de resduo di)ididas por
2
so independentes e distri+uem como
2
Jqui5
quadradoL com 1 Jno modelo de regresso linear simplesL e n52 graus de li+erdade
respecti)amente. 9dicionalmente, so+ condies de O
3
I
1
Q 3 J/ip#tese nula ou de no
e.istir regresso de U em VL )erdadeira, o quociente GMRegressoKGMResduo
distri+ui5se como : central J: de >nedecorL com 1 e n52 graus de li+erdade.
"onsequentemente a estatstica : Q JGMRegressoKGMResduoL * apropriada para o
seguinte teste de /ip#teseI
O
3
I
1
Q 3 )ersus O
1
I
1
3
% crit*rio de teste * o seguinteI re8eita5se O
3
em fa)or de O
1
J/ip#tese alternati)a ou de
e.istncia de regresso de U em VL, ao n)el de signific-ncia se, : :
J,1,n52 L
, onde :
J,1,n5
2 L
* o percentil da distri+uio :5>nedecor, com 1 e n52 graus de li+erdade, ta+ulada
nos li)ros te.tos de ,statstica, ou o+tida nos Rsoft?areS estatsticos.
Exer3>3io 2.6.1 Ilustrao da o+teno da anlise de )ari-ncia para o modelo de
regresso linear simples.
%+ten/a o quadro da anlise de )ari-ncia conforme a ta+ela 2.&.1 utiliEando os
dados do e.erccio 2.2.2 da seo J2.2L.
Bolu8;o
2ara a e.ecuo manual da anlise de )ari-ncia, * con)eniente a estruturao de
uma ta+ela da seguinte formaI
i JUiL JViL Ui
2
Vi
2
UidVi
i
1
^
ei Uidei
i
1
^
dei
ei
2
1 !3 6! 133 $!21 2113 63 ! 13 213 1
2 23 $3 '33 2$33 1333 $3 3 3 3 3
! &3 120 !&33 1&!0' 6&03 1!3 52 5123 52&3 '
' 03 163 &'33 20133 1!&33 163 3 3 3 3
$ '3 06 1&33 6$&1 !'03 13 5! 5123 5263 1
& $3 130 2$33 11&&' $'33 113 52 5133 5223 '
6 &3 1!$ !&33 1022$ 0133 1!3 $ !33 &$3 2$
0 !3 &1 133 '6&1 2363 63 51 5!3 563 1
1 63 1'0 '133 2113' 13!&3 1$3 52 51'3 5!33 '
13 &3 1!2 !&33 16'2' 6123 1!3 2 123 2&3 '
>oma $33 1133 20'33 1!'&&3 &1033 1133 3 3 3 &3
i
JVi5
1
L
2
J 1 1
i

^
L
2
.i `i
i
*^
.i
2
`i
2
2
^
i
*
.id`i
1 1!&1 1&33 523 5!6 5'3 '33 1!&1 1&33 6'3
2 !&33 !&33 5!3 5&3 5&3 133 !&33 !&33 1033
! !2' '33 13 10 23 133 !2' '33 103
' !&33 !&33 !3 &3 &3 133 !&33 !&33 1033
$ $21 '33 513 52! 523 133 $21 '33 2!3
26
& ' 3 3 52 3 3 ' 3 3
6 &2$ '33 13 2$ 23 133 &2$ '33 2$3
0 1&01 1&33 523 5'1 5'3 '33 1&01 1&33 023
1 1''' 1&33 23 !0 '3 '33 1''' 1&33 6&3
13 '0' '33 13 22 23 133 '0' '33 223
>oma 1!&&3 1!&33 3 3 3 !'33 1!&&3 1!&33 &033
9 aplicao das f#rmulas para o+teno das somas de quadrados, quadrados m*dios e :
aos dados do e.erccio 2.2.2 produE os resultados apresentados na ta+ela 2.&.2 de
anlise de )ari-ncia.
Ta+ela 2.&.2 9nlise de )ari-ncia para os dados do e.erccio 2.2.2.
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
5ausas de %raus de 0oma de ;uadrados
<aria=>o li-erdade uadrados m?dios 1 &6<alor
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
#egress>o 1 13600 13600@0 1813@33 40@0001
$rroAresBduo 8 60 7@5
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
!otal 9 13660
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
9 figura 2.2.2 da seo J2.2L apresenta um quadro de anlise de )ari-ncia Jcom
terminologia em inglsL o+tido atra)*s do 2R%" R,< do >9>.
2.7 E&tima8;o $or i(ter@alo *e 3o(fia(8a e te&te *e #i$Ate&e& &obre o mo*elo *e
re"re&&;o.
7a seo J2.&L foi colocado que o quociente GMRegressoKGMResduo
distri+ui5se como : com 1 e n52 graus de li+erdade. "onseqHentemente a estatstica : Q
JGMRegressoKGMResduoL pode ser usada para testar a /ip#tese de ausncia de
regresso de U so+re V JO
3
I
1
Q 3 L contra a /ip#tese alternati)a de e.istncia de
regresso JO
1
I
1
3 L. 7esta seo ser apresentado outro enfoque para testar /ip#teses
e construir inter)alos de confiana para
0
,
1
, ,JVL Jresposta mediaL e para no)as
o+ser)aes V
/
2.7.1 'o(&tru8;o *e i(ter@alo& *e 3o(fia(8a e te&te *e #i$Ate&e& &obre o&
$arCmetro& *a e=ua8;o *e re"re&&;o
T poss)el demonstrar que tanto
3
3 3
-
:
-
como
1
1 1
-
:
-
distri+uem como t5
>tudent com n52 graus de li+erdade. 9ssim, a distri+uio t5>tudent pode ser usada para
testar /ip#teses e construir inter)alos de confiana para
0
e
1
. Inter)alos de confiana
podem tam+*m ser construdos para ,JVL. Inter)alos a J15L . 133Y so da formaI
iL para
3
I
3
2 P
2
3 -
n
: -

,
_

20
iiL para
1
I
1
2 P
2
1 -
n
: -

,
_

onde

,
_

2 P
2
n

* o J1 5 K2L . 133 percentil da distri+uio t5>tudent, ou se8a


2
2 P
2

'

,
_

n
= P
.
3
-
:
e
1
-
:
so o+tidos e.traindo a raiE quadrada das )ari-ncias
de +
3
e +
1
, respecti)amente apresentadas na seo J2.$L.
9 distri+uio t5>tudent pode ser usada par testar /ip#teses so+re os par-metros

0
e
1
.
iL Testes de /ip#teses para
1
a um n)el de signific-ncia I
aL Teste +ilateralI O
3
I
1
Q 3 )ersus O
1
I
1
3
9 estatstica apropriada *I
1
3
1
-
:
-

. Re8eita5se O
3
se b t b t
K2Pn52
.
+L Teste unilateralI O
3
I
1
3 )ersus O
1
I
1
c 3
9 estatstica apropriada *I
1
3
1
-
:
-

. Re8eita5se O
3
se t t
Pn52
.
cL Teste unilateralI O
3
I
1
3 )ersus O
1
I
1
e 3
9 estatstica apropriada *I
1
3
1
-
:
-

. Re8eita5se O
3
se t 5 t
Pn52
.
iiL Testes de /ip#teses para
0
a um n)el de signific-ncia I

% procedimento para testar as /ip#teses O


3
I
0
Q 3 )ersus O
1
I
0
3, O
3
I
0
3
)ersus O
1
I
0
c 3 e O
3
I
0
3 )ersus O
1
I
0
e 3 * anlogo ao caso de
1
,
utiliEando5se a estatstica
3
3
3
-
:
-

.
Exer3>3io 2.7.1 Ilustrao da "onstruo de inter)alos de confiana e teste de /ip#teses
so+re os par-metros da equao de regresso.
DtiliEando os dados do e.erccio 2.2.2 e figura 2.2.2 da seo J2.2L, construir
inter)alos a J15L . 133Y Q1$Y de confiana para
0
, e
1
testar as /ip#teses O
3
I
0
Q 3
)ersus O
1
I
0
3 e O
3
I
1
Q 3 )ersus O
1
I
1
3 considerando5se o n)el de signific-ncia
Q 3.3$
Bolu8;o
iL Inter)alos de confianaI
aL para
0
21
9plicando a f#rmula
3
2 P
2
3 -
n
: -

,
_

, onde t
3.32$P0
Q 2.!3&, 8 que n Q 13 e Q 3.3$,
temos 13.333 t J2.!3&LJ2.$321'L, que resulta nos seguintes limites para o inter)alo de
confianaI J'.2202P 1$.6610L
+L para
1
9plicando a f#rmula
1
2 P
2
1 -
n
: -

,
_

com t
3.32$P0
Q 2.!3&, 8 que n Q 13 e Q 3.3$,
temos
2.333 t J2.!3&LJ3.3'&16L, resultando nos seguintes limites para o inter)alo de confianaI
J1.0116P 2.130!L.
iiL Testes de /ip#teses
2ara testarI O
3
I
0
Q 3 )ersus O
1
I
0
3, a estatstica apropriada *
t Q J13.3333K2.$321'L Q '.33
2ara testarI O
3
I
1
Q 3 )ersus O
1
I
1
3, a estatstica apropriada *
t Q J2.33333K3.3'&16L Q '2.$0
7o referido e.emplo temos n Q 13, logo o )alor crtico para o procedimento de teste *
t
3.32$P0
Q 2.!3&. (esde que as estatsticas t o+ser)adas t Q '.33 e t Q '2.$0 so maiores do
que o )alor crtico, 2.!3&, re8eita5se O
3
nos dois testes. %+ser)e que a figura 2.2.2
fornece os n)eis de signific-ncia Jp5)alorL e.atos para os dois testes, sendo Q 3.33'3 e
Q 3.3331 para os testes referentes a
0
e
1
, respecti)amente
2.7.2 'o(&tru8;o *e i(ter@alo *e $re*i8;o $ara a re&$o&ta mE*ia *a*o um
$arti3ular @alor *a @ari5@el i(*e$e(*e(te
(e acordo com os resultados da seo J2.$L, um inter)alo a J15L . 133Y de
confiana para a resposta m*dia ,JV
i
L Q
3
X
1
U
i
* o+tido porI
1
n
: 1
^
2 P
2
^

,
_

, onde

,
_

2 P
2
n

* o J1 5 K2L . 133 percentil da distri+uio t5>tudent e


1
:
^ * o erro padro de
i
1
^
apresentado na seo 2.$
Exer3>3io 2.7.2I Ilustrao da "onstruo de inter)alo de pre)iso para a resposta m*dia
dado um particular )alor da )ari)el independente
DtiliEando os dados do e.erccio 2.2.2 e figura 2.2.2 da seo J2.2L, construir um
inter)alo a J15L . 133Y Q1$Y de confiana para ,JV
/
L dado U
/
Q $$.
Bolu8;o
!3
>u+stituindo U
/
Q $$ na equao a8ustada o+t*m5se
i
1
^
Q 13 X 2 . $$ Q 123.
9dicionalmente temos $3 2 e


n
i
i
2 2
1
2
!'33 L J
que su+stitudos na e.presso da
)ari-ncia de
i
1
^
temos
03$1 . 3 $ . 6
!'33
L $3 $$ J
13
1
2
2
^

,
_


+
h
1
s
e o des)io padro de
016! . 3 03$1 . 3
2
^ ^

h h
1 1
s s
. 9plicando a e.presso
1
n
: 1
^
2 P
2
^

,
_

, o solicitado
inter)alo de confiana *I 123 t J2.!3&LJ3.016!L, cu8os limites so J116.1!P 122.36L
2.7.3 'o(&tru8;o *e i(ter@alo *e $re@i&;o $ara uma (o@a ob&er@a8;o *a*o um
$arti3ular @alor *a @ari5@el i(*e$e(*e(te
2ara um particular )alor de U, digamos U
/
, o )alor pre)isto pela equao de
regresso a8ustada para uma no)a o+ser)ao V
/
* dado por
h h
2 - - 1
1 3
^
+ .
(emonstra5se que a m*dia de
h
1
^
* ,J
h
1
^
L Q
3
X
1
U
/
. %+ser)e que, apesar da mesma
designao usada na seo J2.6.2L aqui
h
1
^
tem uma conotao diferente. 9 )ari-ncia de
h
1
^
tem dois componentesI um deles * a )ari-ncia de
h
1
^
Jpredio da m*diaL e outro *
a )ari-ncia de uma dada o+ser)ao em torno de sua m*dia ,JVL, assumida ser
2
.
9ssim, a )ari-ncia de uma no)a o+ser)ao estimada atra)*s da equao de regresso
a8ustada *I
2
1
2
2
2
^
L J
L J 1
1
1
1
1
1
]
1

+ +

n
i
i
h
1
2 2
2 2
n
h
. 9 estimati)a da )ari-ncia de
h
1
^
* o+tida su+stituindo

2
por seu estimador e um inter)alo a J15L . 133Y de confiana para V
/
* dado porI
h
1
n
h
: 1
^
2 P
2
^

,
_

, sendo

,
_

2 P
2
n

o J1 5 K2L . 133 percentil da distri+uio t5>tudent.


Exer3>3io 2.7.3I Ilustrao da "onstruo de inter)alo de pre)iso para uma no)a
o+ser)ao dado um particular )alor da )ari)el independente.
DtiliEando os dados do e.erccio 2.2.2 e figura 2.2.2 da seo J2.2L, construir
inter)alos a J15L . 133Y Q1$Y de confiana para uma no)a o+ser)ao V
/
dado U
/
Q
$$.
Bolu8;o
>u+stituindo U
/
Q $$ na equao a8ustada o+t*m5se
i
1
^
Q 13 X 2 . $$ Q 123.
>u+stitudos os resultados amostrais na e.presso da )ari-ncia de
i
1
^
temos
!3$1 . 0 $ . 6
!'33
L $3 $$ J
13
1
1
2
2
^

,
_


+ +
h
1
s
e o des)io padro de
!1
0011 . 2 !3$1 . 0
2
^ ^

h h
1 1
s s
. 9plicando a e.presso
1
n
: 1
^
2 P
2
^

,
_

, o solicitado
inter)alo de confiana *I 123 t J2.!3&LJ2.0011L, cu8os limites so J11!.!$P 12&.&$L
.&o *e O&oft%areP e&tat>&ti3o& (o aIu&te *e mo*elo& *e re"re&&;o
9 figura 2.6.1 apresenta um programa >9> J>tatistical 9nal`sis >`stemL mais
ela+orado do que aquele da figura 2.2.1 para a8uste de um modelo de regresso linear
simples aos dados do e.erccio 2.2.2 da seo 2.2. % relat#rio estatstico resultante da
e.ecuo do programa da figura 2.6.1 encontra5se na figura 2.6.2. %+ser)e que dois
)alores da )ari)el independente U, '$ e $$ foram inseridos no programa com o o+8eti)o
de o+ter )alores preditos erro padro e inter)alos de confiana para a )ari)el
dependente V, naqueles n)eis de U. 4ale ressaltar que o formato dos relat#rios dos
programas de computador )aria +astante de um pacote estatstico para outro. ,m alguns
programas os resultados da anlise de )ari-ncia so apresentados numa ta+ela com as
lin/as e colunas +em identificadas, conforme apresentada neste te.to. %utros pacotes
como MI7IT9A, >T9TI>TI"9, >T9T<R92OI">, etc. fornecem apenas os n;meros
essenciais para o a8uste, testes e diagn#sticos so+re o modelo.
options nodate nocenter ls=78;
data a;
input x y;
la-el x=tam do lote
y=Cum de "oras6"omem;
cards;
30 73
20 50
60 128
80 170
40 87
50 108
60 135
30 69
70 148
60 132
45 3
55 3
;
run;
proc reg data=a;
model y = x D p clm cli cl- alp"a=0305;
output out=a1
p=y"at
r=res
run;
goptions reset=glo-al gunit=pct
c-acE=F"ite colors=A-lacE -lue green redG
"title=6 "text=3 /text=Hap/ -order;
sym-ol1 interpol=r1 ci=-lue <alue=dot "eig"t=3 c<=red;
proc gplot data=a1;
title I#egressao linear simplesI;
plot Ay y"atGJx D o<erlay;
run;
!2
uit;
:igura 2.6.1 2rograma >9> J7,T,3!$9.>9>L para a8uste de um modelo de regresso linear simples
aos dados do e.erccio 2.2.2.
!!
!"e #$% &rocedure
'odel( ')*$+1
*ependent ,aria-le( y Cum de "oras6"omem
.nalysis o/ ,ariance
0um o/ 'ean
0ource *1 0uares 0uare 1 ,alue &r 2 1
'odel 1 13600 13600 1813333 430001
$rror 8 60300000 7350000
5orrected !otal 9 13660
#oot '0$ 2373861 #60uare 039956
*ependent 'ean 110300000 .d7 #60 039951
5oe// ,ar 2348965
&arameter $stimates
&arameter 0tandard
,aria-le +a-el *1 $stimate $rror t ,alue &r 2 8t8
9ntercept 9ntercept 1 10300000 2350294 4300 030040
x tam do lote 1 2300000 0304697 42358 430001
!"e #$% &rocedure
'odel( ')*$+1
*ependent ,aria-le( y Cum de "oras6"omem
)utput 0tatistics
*ep ,ar &redicted 0td $rror
)-s y ,alue 'ean &redict 95K 5+ 'ean
1 7330000 7030000 132776 6730538 7239462
2 5030000 5030000 136539 4631862 5338138
3 12830000 13030000 039852 12737282 13232718
4 17030000 17030000 136539 16631862 17338138
5 8730000 9030000 039852 8737282 9232718
6 10830000 11030000 038660 10830029 11139971
7 13530000 13030000 039852 12737282 13232718
8 6930000 7030000 132776 6730538 7239462
9 14830000 15030000 132776 14730538 15239462
10 13230000 13030000 039852 12737282 13232718
11 3 10030000 038973 9739308 10230692
12 3 12030000 038973 11739308 12230692
)utput 0tatistics
)-s 95K 5+ &redict #esidual
1 6330313 7639687 330000
2 4236225 5733775 0
3 12332885 13637115 6230000
4 16236225 17733775 0
5 8332885 9637115 6330000
6 10333765 11636235 6230000
7 12332885 13637115 530000
8 6330313 7639687 6130000
9 14330313 15639687 6230000
10 12332885 13637115 230000
11 9333544 10636456 3
12 11333544 12636456 3
:igura 2.6.2 Relat#rio da e.ecuo do programa >9> apresentado na figura 2.6.1.
!'
:igura 2.6.! Ilustrao grfica do a8uste do modelo do e.erccio 2.2.2.
2.7.4 ,o89e& *e i(fer:(3ia &imultC(ea &obre o& $arCmetro& e a li(#a *e re"re&&;o
-e"i;o el>$ti3a *e 3o(fia(8a $ara 0 e 1
!$
"onsidere o modelo Vi Q
0

+
1
JUi 5
2
L X i com
0

Q
0
+
1 2
, cu8a funo de
regresso estimada * L J
^
1
d
3
2 2 - - 1
i i
+ com +
0

Q +
0
+ +
1 2
Q
1
. 2ara
i 7J3,
2
L e i, 8 independentes temos
L 1 , 3 J
d
3
d
3
d
3
d
3
d
3
> ?
n
- -
-

, logo
2
1
2
2
2 d
3
d
3
L J

?
- n
Tam+*m
L 1 , 3 J
L J
1
2
1 1 1 1
1
> ?
2 2
- -
n
i
i
-

, logo
2
1
2
2
2
1 1
1
2
L J L J

?
- 2 2
n
i
i
+
0

Q
1
e +1 so independentes, logo +

2
2 d
3
d
3
L J

- n
2
2
2
2
1 1
1
2
L J L J

- 2 2
n
i
i
2ode5se demonstrar que
2
2
2
Re

n
s%d&o :8

e * independente de +3 e +1. (esde que +3


d
* uma
funo de +3 e +1 segue que
2
Re

s%d&o :8
* independente de +3
d
e de +1.
>e
2 2
2 1
e
n n
so independentes ento
2 1
2
2
1
2
,
2
1
n @n
n
n
n
n

, logo
2 , 2
2 2
2
1 1
1
2
2
2 d
3
d
3
2
Re
2
L J L J
L J

n
n
i
i
@
n
s%d&o :8
- 2 2
- n

>implificando a e.presso acima temos


2 , 2
2
1 1
1
2 2 d
3
d
3
Re 2
L J L J L J

n
n
i
i
@
s%d&o 8<
- 2 2 - n
>u+stituindo +3
d
e 3
d
por +3 e 3 temos
2 P 2
2
1 1
1
2
1 1
1
3 3
2
3 3
Re 2
L J L J L J 2 L J

+ +

n
n
i
i
n
i
i
@
s%d&o 8<
- 2 - - 2 - n
9 e.presso acima permite escre)er
!&

,
_

+ +



1
Re 2
L J L J L J 2 L J
2 P 2 P
2
1 1
1
2
1 1
1
3 3
2
3 3
n
n
i
i
n
i
i
@
s%d&o 8<
- 2 - - 2 - n
P
(esde que esta declarao de pro+a+ilidade * )lida para todos os )alores de 3 e 1, uma regio a J15 L
. 133Y de confiana simult-nea para 3 e 1 * dada porI
2 P 2 P
2
1 1
1
2
1 1
1
3 3
2
3 3
Re 2
L J L J L J 2 L J

+ +

n
n
i
i
n
i
i
@
s%d&o 8<
- 2 - - 2 - n


% con8unto JfamliaL de coeficientes a J15 L . 133Y de confiana indica que com amostragem
repetiti)a a regio de confiana conter am+os 3 e 1 em J15 L . 133Y dos casos. 9 regio de
confiana consiste de todos os pontos J3 P 1L que satisfaa a inequao acima.
Exer3>3io 2.7.4 Ilustrao da "onstruo de uma regio de confiana simult-nea para 3
e 1.
DtiliEando os dados do e.erccio 2.2.2 e figura 2.2.2 da seo J2.2L, construir uma regio a J15
L . 133Y Q13Y de confiana para 3 e 1.
Bolu8;o
9 equao de regresso a8ustada no referido e.emplo foi
i
1
^
Q 13 X 2Ui sendo o GMResduo Q
6.$, $33
1

n
i
i
2 , 20'33
1
2

n
i
i
2 e :3.13P2P0 Q !.11. 9 fronteira da regio de confiana * o+tida
su+stituindo estes )alores em sua e.presso e o sinal RS por RQS. 9ssim temosI
11 . !
L $ . 6 J 2
L 2 J 20'33 L 2 LJ 13 LJ $33 J 2 L 13 J 13
2
1 1 3
2
3

+ +
"olocando 3 Q 13 tem5se 11 . !
L $ . 6 J 2
L 2 J 20'33
2
1

, ou se8a, uma equao do segundo grau em 1


da forma 1
2
5 '1 X !.110!66 Q 3 cu8as raEes so 1.1& e 2.3'. 9ssim, os dois pontos limites soI J13P
1.1&L e J13P 2.3'L. (e maneira anloga encontra5se os outros pontos da fronteira da regio elptica. ,sta
regio con8unta de confiana indica que 1 est na amplitude 1.00 a 2.12 e 3 est na )iEin/ana de
'.33, se 1 esti)er em seu limite superior e cerca de 1& se 1 esti)er em seu limite inferior e 3 e 1 tem
inter5relao in)ersa.
1
2.12
2.33
!6
1.00
!.6& 13.3 1&.2' 3
:igura 2.6.1 Ilustrao da regio elptica a 13Y de confiana para 3 e 1 do e.erccio
2.6.'.
9 regio de confiana pode ser usada para testes simult-neos de /ip#teses so+re J3P 1L.
>upon/a que um engen/eiro de produo declare para o e.emplo em curso que a funo de regresso
tem 3 Q 1!.33 e 1 Q 2.13. (esde que o ponto J1!.33P 2.13L no pertence a regio simult-nea de
confiana, de)e5se concluir que ao n)el de Q 3.13 de signific-ncia que 3 1!.33 ou 1 2.13 ou 3
1!.33 e 1 2.13. %+ser)e que o engen/eiro estaria correto quanto aos )alores indi)iduais de 3 e 1,
por*m, a particular com+inao J1!.33P 2.13L no * confirmada pelos dados, pois, na fronteira da regio
elptica construda, 3 Q 1!.33 implica em 1 Q 1.11 e 1 Q 1.10.
+(ter@alo& *e 3o(fia(8a &imultC(eo& *e Qo(ferro(i
Regies elpticas de confiana so eficientes, mas, muitas )eEes so difceis de o+ter,
especialmente no caso de regresso m;ltipla. 9ssim, uma alternati)a para construo de inter)alos de
confiana simult-nea * o procedimento de Aonferroni. 9 id*ia * construir inter)alos de confiana
ordinrios a coeficiente de confiana 1 5 K=, quando = inter)alos so construdos, ou se8a dese8a5se
construir um con8unto de inter)alos que cu+ram simultaneamente = par-metros.
2ara o caso do modelo de regresso linear simples, se 3 e 1 so estimados separadamente com
inter)alos de confiana de 1$Y, a inequao de Aonferroni garante uma famlia de inter)alos
simult-neos de confiana de no mnimo 13Y de que am+os os inter)alos +aseados naquela amostra
este8am corretos. 9ssim pode5se facilmente usar a inequao de Aonferroni para o+ter uma famlia de
coeficientes de confiana de pelo menos J15 L133Y para estimar 3 e 1 simultaneamente, construindo5
se inter)alos de confiana separados para 3 e 1 a coeficientes de confiana 1 5 K2. 9 famlia de
inter)alos a
J15 L133Y de confiana Jsimult-neosL para 3 e 1 *I
1 1 3 3
1 1 1 3 3 3
e
- - - -
B: - B: - B: - B: - + +
, onde A Q t
K'P n52
Exer3>3io 2.7.N Ilustrao da "onstruo de inter)alos simult-neos de confiana
JAonferroniL para 3 e 1.
DtiliEando os dados do e.erccio 2.2.2 e figura 2.2.2 da seo J2.2L, construir inter)alos a J15 L
. 133Y Q13Y de confiana simult-neos para 3 e 1.
Bolu8;o
7o e.emplo em curso temos $321' . 2
3

-
s , 3'&16 . 3
1

-
s , n Q 13 e Q 3.13, logo t3.32$P
0 Q 2.!3&. 9ssim os inter)alos de confiana indi)iduais soI
2ara
0
9plicando a f#rmula
3
2 P
2
3 -
n
: -

,
_

, temos 13.333 t J2.!3&LJ2.$321'L, que resulta nos seguintes


limites para o inter)alo de confianaI J'.2202P 1$.6610L
!0
2ara
1
9plicando a f#rmula
1
2 P
2
1 -
n
: -

,
_

, temos 2.333 t J2.!3&LJ3.3'&16L, resultando nos seguintes


limites para o inter)alo de confianaI J1.0116P 2.130!L.
9ssim, os inter)alos a J15L . 133Y Q13Y de confiana simult-neos JfamliaL para 3 e 1 soI
J'.2202 3 1$.6610L e J1.0116 1 2.130!L.
"omentriosI
>e = estimati)as por inter)alo so dese8adas com coeficiente de confiana simult-neo 15 *
suficiente construir cada inter)alo indi)idual a um coeficiente de confiana 1 5 K2=.
7o * necessrio que todos os inter)alos de confiana ten/am o mesmo coeficiente de confiana.
2or e.emplo, um inter)alo a 12Y de confiana para 3 e outro a 10Y de confiana para 1
geralmente asseguram inter)alos simult-neos a pelos menos 13Y para 3 e 1.
Faixa *e 3o(fia(8a $ara a li(#a *e re"re&&;o ? E(R) K 0 L 17
<eralmente * de interesse o+ter uma fai.a ou +anda a J15L . 133Y de confiana simult-nea
para a lin/a de regresso C ,JVL Q 3 X 1U de modo que se possa )isualiEar em que regio, onde a
inteira lin/a de regresso est situada. @or=ing e Ootelling desen)ol)eram uma f#rmula para construir
uma +anda /iper+#lica a J15L . 133Y de confiana. ,ste enfoque * con/ecido como procedimento de
@or=ing5Ootelling e a fai.a ou +anda /iper+#lica a J15L . 133Y de confiana * construda atra)*s da
seguinte e.pressoI
h h
1
h h
1
h
A: 1 2 A: 1
^ 1 3 ^
^ ^
+ +
, sendo @
2
Q 2:
P 2P n52 e
h
1
:
^ * o erro padro de
h
1
^
conforme
definido na seo J2.$L. 9 fai.a ou +anda de confiana * construda aplicando esta e.presso a um
n;mero suficiente de )alores de U.
Exer3>3io 2.7.6 Ilustrao da "onstruo de fai.a de confiana para ,JVL Q 3 X 1U
%s dados seguintes referem5se ao )alor do dep#sito inicial J)ari)el independente UL em cadernetas
de poupana de uma instituio financeira e n;mero de contas a+ertas J)ari)el dependente VL. 9o
a+rir a conta o cliente rece+ia um prmio cu8o )alor era funo do )alor do dep#sito inicial. %
o+8eti)o do modelo de regresso a ser a8ustado * descre)er a relao entre as duas )ari)eis e pre)er o
n;mero de contas a+ertas em funo do )alor do prmio oferecido.
Ui 6$ 6$ 133 133 12$ 12$ 1$3 1$3 16$ 16$ 233 233
Vi '2 20 112 1!& 1&3 1$3 1'! 1&1 1$& 12' 12' 13'
"onstruir uma fai.a a 1$Y de confiana para a lin/a de regresso ,JVL Q 3 X 1U
Bolu8;o: 2ara o e.emplo temos :
3.3$P2P13
Q '.13, logo
0&!& . 2 L 13 . ' J 2 A
. 9 figura
2.6.2 refere5se a um programa >9> para a8uste do modelo de regresso linear simples e
construo de uma fai.a a 1$Y de confiana para ,JVL Q
3
X
1
U utiliEando5se os
dados do e.erccio 2.6.&. 9s figuras 2.6.! e 2.6.' apresentam os resultados JeditadosL da
e.ecuo do programa da figura 2.6.2.
options ls=78 nodate nocenter;
data a;
input x y;
label x=tam do dep inicial
y=Num de contas abertas;
cards;
75 42
75 28
!1
100 112
100 136
125 160
125 150
150 143
150 161
175 156
175 124
200 124
200 104
;
run;
proc reg data=a;
model y = x ss1 ss2 co!b corrb p r d" in#luence;
output out = a1
p = y$at
r = resid
stdp = stdp
stdr = stdr
run;
data a2;
set a1;
sy$at=s%rt&&0'0833333(&&x)137'5*++2*21875*+1563'05714*;
9 figura 2.6.2 2rograma >9> J7,T,R11'.>9>L para a8uste do modelo de regresso
linear simples e construo de uma fai.a a 1$Y de confiana para ,JVL Q
3 X 1U utiliEando5se os dados do e.erccio 2.6.&.
li=y$at)2'8636+sy$at;
ls=y$at(2'8636+sy$at;
run;
proc print data=a2;run;
goptions reset=global gunit=pct
cbac,="$ite colors=&blac, blue green red*
$title=6 $text=3 #text=-ap# border;
symbol1 interpol=r1 ci=blue !alue=dot $eig$t=3 c!=red;
proc gplot data=a2;
title .Numero de contas abertas / dep inicial.;
plot &y y$at lils*+x o!erlay;
run;
%uit;
9 figura 2.6.2 J"ontinuaoL
'odel( ')*$+1
*ependent ,aria-le( L Cum de contas a-ertas
.nalysis o/ ,ariance
0um o/ 'ean
0ource *1 0uares 0uare 1 ,alue &ro-21
'odel 1 5531342857 5531342857 33539 030893
$rror 10 15630357143 1563305714
5 !otal 11 21162300000
#oot '0$ 39353552 #6suare 032614
*ep 'ean 120300000 .d7 #6s 031875
53,3 32394626
&arameter $stimates
&arameter 0tandard ! /or M0(
,aria-le *1 $stimate $rror &arameter=0 &ro- 2 8!8
9C!$#5$& 1 503857143 38348613674 13321 032158
N 1 03502857 0326730889 13881 030893
'3
*ep ,ar &redict 0td $rr 0td $rr 0tudent
)-s L ,alue &redict #esidual #esidual #esidual
1 4230000 8835714 203233 64635714 333966 613371
2 2830000 8835714 203233 66035714 333966 613783
3 11230 10131 153190 1038571 363501 03297
4 13630 10131 153190 3438571 363501 03955
5 16030 11337 113892 4632857 373705 13228
6 15030 11337 113892 3632857 373705 03962
7 14330 12633 113892 1637143 373705 03443
8 16130 12633 113892 3437143 373705 03921
9 15630 13839 153190 1731429 363501 03470
10 12430 13839 153190 61438571 363501 603407
11 12430 15134 203233 62734286 333966 603808
12 10430 15134 203233 64734286 333966 613396
)O0 N L LM.! 0!*& #$09* 0!*#
1 75 42 883571 2032329 64635714 3339659
2 75 28 883571 2032329 66035714 3339659
:iguras 2.6.! Resultados JeditadosL da e.ecuo do programa >9> da figura 2.6.2
3 100 112 1013143 1531900 1038571 3635010
4 100 136 1013143 1531900 3438571 3635010
5 125 160 1133714 1138920 4632857 3737046
6 125 150 1133714 1138920 3632857 3737046
7 150 143 1263286 1138920 1637143 3737046
8 150 161 1263286 1138920 3437143 3737046
9 175 156 1383857 1531900 1731429 3635010
10 175 124 1383857 1531900 61438571 3635010
11 200 124 1513429 2032329 62734286 3339659
12 200 104 1513429 2032329 64734286 3339659
)O0 0!P*$C! #0!P*$C! 0LM.! +9 +0
1 61337112 61344351 2032329 3036324 1463510
2 61378330 62304860 2032329 3036324 1463510
3 0329745 0328344 1531900 5736447 1443641
4 0395497 0395033 1531900 5736447 1443641
5 1322759 1326370 1138920 7936604 1473768
6 0396237 0395844 1138920 7936604 1473768
7 0344330 0342474 1138920 9232318 1603340
8 0392069 0391300 1138920 9232318 1603340
9 0346965 0345055 1531900 9533590 1823355
10 60340703 60338939 1531900 9533590 1823355
11 60380753 60379236 2032329 9334895 2093368
12 61339636 61347644 2032329 9334895 2093368
:igura 2.6.! "ontinuao
'1
:igura 2.6.' fai.a a 1$Y de confiana para ,JVL Q 3 X 1U utiliEando5se os dados do
e.erccio 2.6.&.
9 ta+ela 2.6.1 apresenta os dados para construo da fai.a de confiana apresentada na figura 2.6.$
o+tidas usando a planil/a de clculo ,U",N.
'2
Ta+ela 2.6.1 (ados para construo da fai.a a 1$Y de confiana para os dados do
e.erccio 2.6.&, o+tidos atra)*s do ,U",N
U V Uf2 Vf2 UdV V/at ei >`/at Inf1$ >up1$
6$ '2 $&2$ 16&' !1$3 00.$61 5'&.$61 23.2!! !3.&!2 1'&.$13
6$ 20 $&2$ 60' 2133 00.$61 5&3.$61 23.2!! !3.&!2 1'&.$13
133 112 13333 12$'' 11233 131.1'! 13.0$6 1$.113 $6.&'$ 1''.&'1
133 1!& 13333 10'1& 1!&33 131.1'! !'.0$6 1$.113 $6.&'$ 1''.&'1
12$ 1&3 1$&2$ 2$&33 23333 11!.61' '&.20& 11.012 61.&&3 1'6.6&0
12$ 1$3 1$&2$ 22$33 106$3 11!.61' !&.20& 11.012 61.&&3 1'6.6&0
1$3 1'! 22$33 23''1 21'$3 12&.20& 1&.61' 11.012 12.2!2 1&3.!'3
1$3 1&1 22$33 2$121 2'1$3 12&.20& !'.61' 11.012 12.2!2 1&3.2!2
16$ 1$& !3&2$ 2'!!& 26!33 1!0.0$6 16.1'! 1$.113 1$.!$1 102.!$$
16$ 12' !3&2$ 1$!6& 21633 1!0.0$6 51'.0$6 1$.113 1$.!$1 102.2$$
233 12' '3333 1$!6& 2'033 1$1.'21 526.'21 23.2!! 1!.'13 231.!&0
233 13' '3333 1301& 23033 1$1.'21 5'6.'21 23.2!! 1!.'13 231.!&0
1&$3 1''3 2'06$3 11!1&2 231333 1''3.33 3.333
:igura 2.6.' fai.a a 1$Y de confiana para ,JVL Q 3 X 1U utiliEando5se os dados do
e.erccio 2.6.&. construda com o ,U",N.
+(ter@alo& *e 3o(fia(8a &imultC(ea $ara S @alore& *a E(R#) K 0 L 17#
Muitas )eEes * de interesse a construo de inter)alos de confiana simult-nea para um n;mero
= de n)eis da )ari)el independente U. (ois procedimentos podem ser seguidos para construo de
inter)alos simult-neos de confiana para ,JV/L estimados a partir de = )alores da )ari)el independente
U/ C o procedimento de @or=ing5Ootelling e o de Aonferroni.
a) 2 $ro3e*ime(to *e TorSi("-otelli("
% procedimento apresentado para a construo da fai.a ou +anda de confiana simult-nea para
a lin/a de regresso * )lido para todo U/. ,nto ser tam+*m )lido para = particulares )alores de U/,
ou se8a, os inter)alos so construdos atra)*s da e.presso
'!
3
$3
133
1$3
233
2$3
$3 133 1$3 233 2$3
h h
1
h h
1
h
A: 1 2 A: 1
^ 1 3 ^
^ ^
+ +
, sendo @
2
Q 2:
P 2P n52 e
h
1
:
^ * o erro padro de
h
1
^
conforme
definido na seo J2.$L.
Exer3>3io 2.7.6 Ilustrao da "onstruo de inter)alos simult-neos de confiana
= )alores da ,JV/L Q 3 X 1U/, pelo enfoque de @or=ing5Ootelling.
DtiliEando os dados do e.erccio 2.2.2 e figura 2.2.2 da seo J2.2L, construir inter)alos a J15 L . 133Y
Q 13Y de confiana simult-neos para ,JV/L considerando U/ assumindo os )alores !3, '$, $$ e 03, pelo
enfoque de @or=ing5Ootelling.
Bolu8;o
7o e.erccio 2.2.2 temos n Q 13, assim, para inter)alos a J1 5 L . 133Y Q 13Y :
P2Pn52 Q :3.13P2P0 Q '.'&.
9ssim temos @
2
Q &.22. Dsando as e.presses de
h
1
^
e
h
1
:
^ apresentadas nas sees 2.2 e 2.$
respecti)amente e as e.presses dos inter)alos simult-neos de confiana do procedimento de @or=ing5
Ootelling desta seo, aplicados aos dados do e.erccio em curso, c/ega5se aos seguintes resultadosI
U/
h
1
^
h
1
:
^ @
h
1
:
^
h
1
^
5 @
h
1
:
^ P
h
1
^
X @
h
1
:
^
!3 63 1.266& !.10&' &&.01P 6!.10
'$ 133 3.016! 2.2!61 16.6&P 132.2'
$$ 123 3.016! 2.2!61 116.6&P 122.2'
03 163 1.&$!1 '.12'0 1&$.00P 16'.12
b) 2 $ro3e*ime(to *e Qo(ferro(i
% enfoque de Aonferroni discutido em sees anteriores na estimao simult-nea de 3 e 1 *
um procedimento geral. 2ara construir uma famlia de inter)alos de confiana para a resposta m*dia
,JVL a diferentes n)eis de U, construi5se os usuais inter)alos de confiana para uma simples resposta
m*dia ,JV/L a8ustando o requerido coeficiente de confiana para produEir a famlia de inter)alos de
confiana simult-nea.
>e ,JV/L de)e ser estimado para = n)eis de U a uma famlia de coeficientes de
J15L . 133Y confiana os inter)alos de confiana de Aonferroni soI
h h
1
h h
1
h
B: 1 2 B: 1
^ 1 3 ^
^ ^
+ +
, onde
2 P
2

n
;
B

Exer3>3io 2.7.7 Ilustrao da "onstruo de inter)alos simult-neos de confiana


= )alores da ,JV/L Q 3 X 1U/, pelo enfoque de Aonferroni.
DtiliEando os dados do e.erccio 2.2.2 e figura 2.2.2 da seo J2.2L, construir inter)alos a J15 L
. 133Y Q 13Y de confiana simult-neos para ,JV/L dado U/ assumindo os )alores !3, '$, $$ e 03, pelo
enfoque de Aonferroni.
Bolu8;o
7o e.erccio 2.2.2 temos n Q 13, assim, para inter)alos a J15L . 133Y Q 13Y
temos
2 P
2

n
;
B

Q t153.312$P 0 Q 2.6$1$. 9s e.presses de


h
1
^
e
h
1
:
^ apresentadas nas sees 2.2 e
2.$ respecti)amente e a e.presso dos inter)alos simult-neos de confiana pelo enfoque de Aonferroni
desta seo, aplicadas aos dados do e.erccio em curso, c/ega aos seguintes resultadosI
U/
h
1
^
h
1
:
^ A
h
1
:
^
h
1
^
5 A
h
1
:
^ P
h
1
^
X A
h
1
:
^
''
!3 63 1.266& !.$1$! &&.'0P 6!.$1
'$ 133 3.016! 2.'&01 16.$!P 132.'1
$$ 123 3.016! 2.'&01 116.$!P 122.'6
03 163 1.&$!1 '.$$36 1&$.'$P 16'.$$
'ome(t5rio&:
7este e.emplo os inter)alos de confiana de ?or=int5Ootelling so ligeiramente mais precisos
Jmenores amplitudesL do que os de Aonferroni. ,m outros casos quando o n;mero de inter)alos *
pequeno os de Aonferroni so mais precisos. 2ara grandes famlias Jele)ado n;mero de inter)alosL o
procedimento de @or=ing5Ootelling sempre fornece inter)alos mais precisos, porque o )alor de @ no
depende do n;mero de inter)alos, enquanto que A aumenta a medida que o n;mero de inter)alos na
famlia cresce. 7a prtica, ap#s definio do n;mero de inter)alos pode5se calcular @ e A e )erificar
qual deles fornece um con8unto de inter)alos simult-neos mais preciso. Tanto o procedimento de
@or=ing5Ootelling quanto o de Aonferroni para estimao de resposta m*dia fornecem o limite inferior
de confia+ilidade, ou se8a, o con8unto de inter)alos * de pelo menos
J1 5 L133Y. 9 raEo * porque pode5se demonstrar que a inequao de Aonferroni fornece o limite
inferior e o enfoque de @or=ing5Ootelling * )lido para toda lin/a de regresso. 9s )eEes no se sa+e a
priori para quais n)eis da )ari)el independente U se dese8a construir inter)alos de confiana para
,JVL. 7estes casos, recomenda5se a utiliEao do enfoque de @or=ing5Ootelling.
!re@i&;o &imultC(ea *e S (o@a& ob&er@a89e&
9gora ser considerado a pre)iso de = no)as o+ser)aes Jem = tentati)as independentesL da
)ari)el resposta V, em = diferentes n)eis da )ari)el independente U. (ois procedimentos sero
considerados C % procedimento de >c/eff* e o de Aonferroni, para a construo de inter)alos a J1 5
L133Y de confiana simult-nea.
a) 2 e(fo=ue *e &3#effE
7este procedimento, os inter)alos simult-neos a J1 5 L133Y de confiana para = no)as
o+ser)aes so e.pressos comoI
h h
1
h h
1
h
:s 1 1 :s 1
^ ^
^ ^
+
, sendo >
2
Q =:
P =P n52 e
h
1
s
^ * o erro padro da estimati)a da no)a
o+ser)ao
h
1
^
.
b) 2 e(fo=ue *e Qo(ferro(i
7o procedimento de Aonferroni, os inter)alos simult-neos a J1 5 L133Y de confiana para =
no)as o+ser)aes so o+tidos porI
h h
1
h h
1
h
Bs 1 1 Bs 1
^ ^
^ ^
+
, onde
2 P
2

n
;
B

e
h
1
s
^ * o erro padro da estimati)a da no)a
o+ser)ao
h
1
^
.
"omo no caso da construo de inter)alos para a resposta m*dia, aqui tam+*m pode5se calcular
> e A e escol/er o procedimento que fornecer inter)alos mais precisos.
Exer3>3io 2.7.U Ilustrao da "onstruo de inter)alos simult-neos de confiana
= no)as o+ser)aes da )ari)el dependente V
DtiliEando os dados do e.erccio 2.2.2 e figura 2.2.2 da seo J2.2L, construir inter)alos a J15 L
. 133Y Q 1$Y de confiana simult-neos para ! no)as o+ser)aes independentes V/ dado U/
assumindo os )alores !3, $$ e 03. "onsidere os procedimentos de >c/eff* e de Aonferroni e apresente os
resultados para o enfoque que apresentar inter)alos mais precisos.
'$
Bolu8;o
7o e.erccio 2.2.2 temos n Q 13, assim, para inter)alos a J15L . 133Y Q 1$Y
construdos pelo enfoque de >c/eff* temos,
>
2
Q !:3.3$P !P 0 Q !J'.36L Q 12.21 que resulta em > Q !.'1.
2elo enfoque de Aonferroni temos
2 P
2

n
;
B

Q t3.330P 0 Q !.3'.
Nogo de)e5se escol/er o enfoque de Aonferroni. 9s e.presses de
h
1
^
e
h
1
s
^ apresentadas nas sees
2.2 e 2.$ respecti)amente e a e.presso dos inter)alos simult-neos de confiana pelo enfoque de
Aonferroni desta seo, aplicadas aos dados do e.erccio em curso, c/ega aos seguintes resultadosI
U/
h
1
^
h
1
s
^ A
h
1
:
^
h
1
^
5 A
h
1
:
^ P
h
1
^
X A
h
1
:
^
!3 63 !.32110 1.10&02 &3.0P 61.2
$$ 123 2.00106 0.6&300 111.2P 120.0
03 163 !.1112& 1.62$6$ 1&3.!P 161.6
"om um coeficiente de confiana simult-neo de pelo menos 3.1$, pode5se afirmar que o
n;mero de /oras C /omem gastas para a produo trs particulares lotes de taman/os !3, $$ e 03
estaro dentro dos limites acima esta+elecidos.
'ome(t5rio&:
Tanto no procedimento de >c/eff* como no de Aonferroni, tanto > quanto A crescem quanto =
aumenta. Isto no ocorre com inferncia simult-nea so+re a resposta m*dia, onde apenas A cresce.
Guando = cresce muito geralmente > e A tornam to grandes que os inter)alos de confiana construdos
tornam sem uso prtico.
2.U 2 3oefi3ie(te *e *etermi(a8;o e a bo(*a*e *o aIu&te
7esta seo sero apresentadas algumas medidas descriti)as da associao entre as )ari)eis U
e V no modelo de regresso
2 3oefi3ie(te *e *etermi(a8;o
9 soma de quadrados total J>GTotalL )ista na seo J2.&L mede a )ariao nas o+ser)aes Vi,
quando no se considera a )ari)el independente U. %u se8a a >GTotal mede a incerteEa de se pre)er V
quando U no * considerado. >imilarmente, a soma de quadrados de resduo J>GResduoL mede a
)ariao em Vi, ou a incerteEa de se pre)er V quando um modelo de regresso utiliEando U como
)ari)el independente * empregado. Dma medida natural do efeito de U na reduo da )ariao de V, ou
se8a, da incerteEa de pre)er V *I
:8=oa(
s%d&o :8
:8=oa(
!ress,o :8
:8=oa(
s%d&o :8 :8=oa(
r
Re
1
Re Re
2

9 medida r
2
* c/amado coe)iciene de deermina.,o. (esde que 3 >GResduo >GTotal, segue que 3
r
2
1.
2ode5se interpretar r
2
como a proporo da reduo na )ariao total dos V associada com o uso
da )ari)el independente U. 9ssim, quanto maior for o r
2
, maior * a reduo na )ariao total de V pela
introduo da )ari)el independente U.
%s )alores limites de r
2
ocorrem nas seguintes situaesI
1L >e todas as o+ser)aes caem so+re a lin/a de regresso a8ustada, >GResduo Q 3 e
r
2
Q 1. 7este caso a )ari)el independente U e.plica toda a )ariao das o+ser)aes
Vi. Isto s# ocorre no caso de relao matemtica entre as )ari)eis.
2L >e a inclinao da lin/a de regresso a8ustada * +1 Q 3, de modo que 1 1
i

^
,
>GResduo Q >GTotal e r
2
Q 3. 7este caso no e.iste nen/uma relao entre U e V
'&
nos dados amostrais e a )ari)el independente U nada contri+ui para reduo da
)ariao das o+ser)aes Vi.
7a prtica, * pouco pro))el que r
2
se8a 3 ou 1. <eralmente ele assume algum )alor entre estes
dois limites. Guanto mais pr#.imo de 1 maior se diE ser o grau de associao entre as )ari)eis U e V.
9lgumas )eEes recomenda5se o uso do r
2
a8ustado para os graus de li+erdade Jr
2
aL, ao in)*s do
r
2
. 7o caso do modelo de regresso linear simples o r
2
a * e.presso como
L 1 J
2
2
1
2 2
r r r
n a

,ste a8uste no r
2
* mais importante para o caso de regresso linear m;ltipla. 2ara a regresso
linear simples o impacto no a8uste * pequeno, especialmente quando o r
2
est pr#.imo de 1.
2 3oefi3ie(te *e 3orrela8;o
9 raiE quadrada de r
2
I r Q t
2
r
* c/amado coeficiente de correlao. % sinal mais ou menos
* aplicado ao r de acordo com o sinal da inclinao J+1L da lin/a a8ustada de regresso, sendo positi)o se
+1 for positi)o e negati)o, no caso de +1 negati)o. 9ssim a amplitude de r *I 51 r 1. T importante
mencionar que para r
2
diferente de 3 ou de 1, )erifica5se r
2
e b r b raEo pela qual / uma tendncia no
uso de r ao in)*s de r
2
especialmente nas reas de neg#cios e economia, por dar impresso de uma
relao mais forte entre U e V.
7o e.erccio 2.2.2 da seo J2.2L, o+ser)ou5se >GTotal Q 1!&&3 e >GResduo Q &3. Nogo r
2
Q
1!&&3
&3 1!&&3
Q 3.11&. 2ode5se diEer ento com +ase no coeficiente de determinao que a )ariao no
n;mero de /oras C /omem JVL * reduEida em 11.&Y quando o taman/o do lote JUL * considerado.
% coeficiente de correlao para os dados deste e.emplo *I r Q X 11& . 3 Q X3.110. 7este caso
o r * positi)o pelo fato de +1 ter sido positi)o.
Dma f#rmula direta para o clculo de r sem o procedimento da anlise de )ari-ncia *I

n
i
i
n
i
i
n
i
i i
1 1 2 2
1 1 2 2
r
1
2
1
2
1
L J L J
L LJ J
Q

,
_

,
_

,
_

,
_

n
i
n
i
i
i
n
i
n
i
i
i
n
i
n
i
i i
n
i
i i
n
1
1
n
2
2
n
1 2
1 2
1
2
1 2
1
2
1 2
1 1
1
J
Dma importante relao entre +1 e r * a seguinteI
+1 Q

n
i
i
n
i
i
2 2
1 1
r
1
2
1
2
L J
L J
7ote que +1 Q 3 quando r Q 3 e )ice5)ersa. 9ssim, r Q 3 implica numa lin/a /oriEontal de regresso
a8ustada e )ice5)ersa.
% )alor assumido por r
2
numa dada amostra tende a ser afetado pelo espaamento das
o+ser)aes U. Isto * decorrente da e.presso de r
2
, como a raEo entre duas somas de quadrados. 9
soma de quadrados de resduos no * afetada sistematicamente pelo espaamento dos )alores de U, 8
que no modelo de regresso linear simples
2 2

i
1
para todos os n)eis de U. ,ntretanto, )alores
mais espaados de U na amostra tendem a aumentar a disperso dos V[s o+ser)ados em torno de sua
m*dia o que implica na ele)ao da soma de quadrados total. "onsequentemente, quanto maior for o
espaamento dos U[s, maior tender ser o r
2
.
'6
9 soma de quadrado de regresso * geralmente c/amada R)ariao e.plicadaS em V. 9 soma
de quadrados de resduos * c/amada R)ariao no e.plicadaS e a soma de quadrados total de g)ariao
totalS. % coeficiente de determinao r
2
* ento interpretado em termos da proporo da )ariao total de
V que foi Re.plicadaS por U. InfeliEmente esta terminologia * as )eEes tomada literalmente e portanto
errada. (e)e ser ressaltado que num modelo de regresso no / nen/uma implicao de que V dependa
necessariamente de U, num sentido causal ou e.planat#rio.
Dm )alor de r ou de r
2
relati)amente pr#.imo de 1 algumas )eEes * tomado como uma
indicao de que inferncias suficientemente precisas so+re V podem ser feitas a partir do con/ecimento
de U. 9 utilidade da relao de regresso depende muitas )eEes da amplitude dos inter)alos de confiana
e predio e de uma particular necessidade de preciso, que )aria de uma aplicao para outra. 9ssim,
nen/uma simples medida pode ser tomada como um indicador da utilidade da relao de regresso.
Modelos de regresso no cont*m nen/um par-metro a ser estimado por r ou r
2
, ,stes
coeficientes so simplesmente medidas descriti)as do grau de relacionamento entre U e V nas
o+ser)aes amostrais que podem ou no ser ;teis em alguma inst-ncia.
2.V 4(5li&e *e re&>*uo&
Guando um modelo de regresso tal como o modelo de regresso linear simples * selecionado
para uma aplicao, no * poss)el a priori, assegurar que o modelo escol/ido * apropriado para aquela
aplicao. 9lgumas ou di)ersas caractersticas do modelo tais como linearidade da funo de regresso
ou normalidade dos termos do erro pode no ser apropriada para uma particular amostra. 9ssim, *
importante e.aminar a qualidade do modelo para aqueles dados, antes da e.ecuo de outras anlises
so+re aquele modelo. 7esta seo sero discutidos alguns m*todos grficos simples e alguns testes
estatsticos formais, para a)aliar as qualidades do modelo de regresso a8ustado. 9 seo ser concluda
com algumas t*cnicas que podem faEer o modelo de regresso linear apropriado, quando os dados no
esto de acordo com as pressuposies esta+elecidas para o a8uste do modelo. 7esta seo ser enfatiEado
o modelo de regresso linear simples, por*m, a id*ia +sica aplica a outros modelos de regresso.
2.V.1 /efi(i8;o e $ro$rie*a*e& *o& re&>*uo&
Dm resduo ei, * definido como a diferena entre o )alor o+ser)ado e o )alor o+tido pelo modelo
a8ustado, ou se8a,
ei Q Vi 5
i
1
^
% resduo ei, de)e ser entendido como o erro o+ser)ado, em distino do )erdadeiro erro descon/ecido i
no modelo de regressoI
i Q Vi C ,JViL
2ara o modelo de regresso linear simples os i so assumidos )ari)eis aleat#rias independentes com
m*dia Eero e )ari-ncia constante
2
. >e o modelo for apropriado para a amostra em considerao, os
resduos o+ser)ados i de)em refletir as propriedades assumidas para os i. ,sta * a id*ia +sica para a
anlise de resduo, uma ferramenta altamente ;til para o e.ame da qualidade do modelo a8ustado.
a) !ro$rie*a*e& *o& re&>*uo&
"onforme a seo J2.'L a m*dia dos n resduos ei *I
3
1

n
e
e
n
i
i
. 9ssim, desde que a
m*dia dos ei * sempre Eero ela no fornece nen/uma informao se os )erdadeiros erros i tem )alor
esperado Eero, ,Ji L Q 3.
7uma particular amostra, a )ari-ncia dos n resduos ei * definida comoI
'0
s%d&o 8<
n
s%d&o :8
n
e
n
e e
i i
Re
2
Re
2 2
L J
2 2


, para o modelo de regresso
linear simples.
>e o modelo a8ustado * o apropriado o GMResduo * um estimador no tendencioso da
)ari-ncia dos termos do erro
2
.
b) -e&>*uo& $a*ro(iMa*o&
2or con)enincia analtica os resduos padroniEados
s%d&o 8<
e
r
i
i
Re

so algumas )eEes usados na anlise de resduos. 9s )eEes so encontrados na literatura padroniEaes


da formaI
s%d&o 8< h
e
r
ii
i
i
Re L 1 J

ou ainda
L J
d
Re L 1 J
i ii
i
i
s%d&o 8< h
e
r

, onde
GMResduoJ5iL * um estimador de
2
e.cluindo5se a i5*sima o+ser)ao e /ii * e.presso como
2
1
2
2
1
1 1
L J
L J 1

,
_

2
i
n
i
i
i
ii
:
2 2
n n
2 2
2 2
n
h
, sendo
1
L J
1
2

n
2 2
:
n
i
i
2
r
d
i * geralmente encontrado na literatura com o nome de resduo R8ac=nifeS.
3) ,;o i(*e$e(*:(3ia *o& re&>*uo&
% fato de 3
1

n
i
i
e e 3
1

n
i
i i
e 2 , gera dependncia entre os ei mesmo quando os i so
independentes.
/efeito& *o mo*elo *e re"re&&;o =ue $o*em &er e&tu*a*o& atra@E& *a a(5li&e *e re&>*uo&
1L 9 regresso no * linearP
'1
2L %s erros no tem )ari-ncia constanteP
!L %s erros no so independentesP
'L % modelo a8usta +em mas uma ou poucas o+ser)aes so discrepantes ou influentesP
$L %s erros no seguem distri+uio normalP
&L Dma ou mais )ari)eis independentes importantes no esto includas no modelo.
2.V.2 4(5li&e "r5fi3a *o& re&>*uo&
7esta seo sero apresentadas algumas maneiras informais em que grficos de resduos podem
ser analisados )isualmente para o+ter informaes se um ou mais dos seis tipos de pro+lemas
apresentados na seo anterior esto presentes ap#s o a8uste de um modelo de regresso linear simples.
1) ,;o li(eari*a*e *a fu(8;o *e re"re&&;o
>e a funo de regresso linear * apropriada ou no para os dados so+ estudo, pode ser
in)estigado atra)*s do diagrama de disperso dos dados JV )ersus UL e a funo a8ustada so+reposta no
mesmo grfico. 9dicionalmente pode5se traar o diagrama de disperso dos
Vi ei
J+L
JaL







U U
Vi ei
JdL

JcL





U U
:igura 2.1.1 Ilustrao de no linearidade no modelo de regresso linear simples. JaL e J+L modelo
linear inadequado. JcL e JdL modelo linear adequado.
Guando o modelo de regresso linear simples a8usta +em aos dados, os )alores o+ser)ados
distri+uem aleatoriamente em torno da lin/a de regresso a8ustada no grfico de V )ersus U. 7um
diagrama de ei )ersus Ui os pontos distri+uem aleatoriamente em torno de Eero quando o modelo de
regresso linear simples * apropriado. %s casos JaL e J+L da figura 2.1.1 ilustram o a8uste de um modelo
de regresso linear simples inadequado. _ os casos JcL e JdL da mesma figura mostram o a8uste de um
modelo de regresso linear simples adequado aos dados.
$3
Dma maneira formal de testar a linearidade do modelo de regresso * atra)*s da decomposio
da soma de quadrados de resduo em duas componentes C % erro puro e a falta de a8uste e em seguida
proceder o teste atra)*s da distri+uio :5>nedecor. ,ste assunto ser tratado na seo 2.1.!.
2) 2& erro& (;o tem @ariC(3ia 3o(&ta(te
Dm grfico dos resduos ei )ersus a )ari)el independente U * apropriado para a)aliar a
const-ncia dos termos do erro. Guando a disperso dos resduos cresce a medida que U cresce, / indcio
de )ari-ncia dos termos do erro no constante. Tam+*m, e indicati)o de )ari-ncia no constante, o
decrescimento da disperso dos resduos quando a )ari)el independente cresce.
Tam+*m, pode5se usar o diagrama de disperso de ei )ersus
1
^
, com a mesma interpretao do
grfico de ei )ersus U.
ei ei J+L
JaL







U
1
^
:igura 2.1.2 Ilustrao de )ari-ncia dos termos do erro no constante no modelo de
regresso linear simples.
9 figura 2.1.2 ilustra casos de )ari-ncia no constante, nos termos do erro do modelo de
regresso linear simples.
Teste estatstico formal para a /eterogeneidade de )ari-ncia pode ser efetuado da seguinte
maneiraI
aL (i)ide5se a s*rie de pares de o+ser)aes U, V ar+itrariamente em duas partes iguais, a8usta5se duas
equaes de regresso e testa as )ari-ncias atra)*s da estatstica :
+L Testa a correlao dos Rran=sS entre os )alores a+solutos do ei e da )ari)el independente
3) 2& termo& *o erro (;o &;o i(*e$e(*e(te&
Guando os erros so independentes, espera5se os resduos flutuarem aleatoriamente em ralao
a lin/a ei Q 3 nos diagramas de ei )ersus U e ei )ersus tempo. % presena de padro nestes diagramas *
indicati)o de dependncia nos erros. 2resena de padro pode ser muita altern-ncia ou pouca altern-ncia
dos resduos em ralao a lin/a ei Q 3, nos diagramas. (ependncia nos erros ocorre geralmente em
dados tomados numa seqHncia de tempo, em decorrncia de aprendiEagem do operador, mudana
gradual em equipamentos, etc. 9 dependncia dos erros pode ser )ista como falta de uma )ari)el
importante no modelo. T importante salientar que algumas )eEes o diagrama de ei )ersus U aparece sem
nen/um padro indicando que os erros so independentes e no diagrama de ei )ersus tempo padres
tornam5se e)identes. 9ssim, / casos que os grficos de ei )ersus tempo so mais eficientes para a
a)aliao da independncia dos termos do erro do que ei )ersus Ui.
ei ei
J+L
$1

JaL
3 3




U na seqHncia de tempo U na seqHncia de tempo
:igura 2.1.! Ilustrao de casos de erros dependentes no modelo de
regresso linear simples.
9 figura 2.1.! ilustra casos de dependncia dos erros do modelo de regresso linear. 2adres no
diagrama de ei )ersus U pode no ser a causa de dependncia dos erros. <eralmente os padres so
causados por modelo a8ustado inadequadamente como, declarao da equao no apropriada ou falta de
uma )ari)el independente importante no modelo. %s diagramas de ei )ersus tempo so mais
apropriados para identificao de dependncia dos erros.
9 independncia dos erros pode ser testada estatisticamente atra)*s do teste de (ur+in5@atson,
ou outros teste dispon)eis na literatura.
4) 2 mo*elo aIu&ta bem ma&< uma ou $ou3a& ob&er@a89e& &;o *i&3re$a(te& ou i(flue(te&
4alores discrepantes J RoutliersSL so o+ser)aes e.tremas. 7um diagrama dos resduos
padroniEados JriL )ersus U eles aparecem geralmente quatro ou mais )eEes o des)io padro unitrio, ou
se8a quatro unidades ou mais, distantes da lin/a ei Q3. 9ssim, uma o+ser)ao com ri ' * um potencial
)alor discrepante, e )alores de ri 2 indicam que as correspondentes o+ser)aes so )alores influentes e
merecem ateno. 9 figura 2.1.' ilustra uma o+ser)ao que pode ser um )alor discrepante ou )alor
influente.
4alores discrepantes apresentam dificuldades no processo de modelagem porque tem forte
impacto so+re a equao a8ustada e podem implicar num modelo mal a8ustado. 2or outro lado, )alores
discrepantes podem le)ar significante informao, como por e.emplo interao com )ari)eis
importantes omitidas no modelo. Dm )alor discrepante s# de)e ser descartado se /ou)er e)idncia de
que ele representa um registro errado, um clculo errado, mau funcionamento de um equipamento ou a
certeEa de uma influncia estran/a ao processo ou sistema.
ei )alor influente ou discrepante






U na seqHncia de tempo
:igura 2.1.' Ilustrao da presena de um )alor influente ou discrepante no modelo de
regresso linear simples.
Testes estatsticos para )alores discrepantes podem ser efetuados da seguinte maneiraI
1L 98usta5se o modelo de regresso com n51 pares de dadosP
$2
2L (etermina5se a pro+a+ilidade de em n pares de o+ser)aes um des)io da lin/a de regresso Jou um
des)io da lin/a ei Q 3L ser to grande quanto aquele o+ser)ado.
N) 2& erro& (;o &e"uem *i&tribui8;o (ormal
7o a8uste de modelos de regresso, * suficiente que os termos do erro se8a apro.imadamente
normais. 9fastamento acentuado da distri+uio normal pode ser in)estigado )isualmente atra)*s de
uma s*rie de grficos de resduos. Dma maneira * construir um /istograma dos resduos e o+ser)ar se /
um grande afastamento da normalidade. %utra possi+ilidade * )erificar se cerca de &0Y dos resduos
padroniEados ri esto dentro da amplitude C1 a X1, ou se cerca de 13Y esto na amplitude C1.&' a X1.&'.
7o caso de pequenas amostras pode5se usar as correspondentes estatsticas t e a distri+uio t5>tudent.
%utra alternati)a * o uso de grficos normal de pro+a+ilidade.
9 anlise do modelo quanto a normalidade dos termos do erro * geralmente mais difcil do que
outras pressuposies. ,m primeiro lugar )ariaes do acaso pode le)ar a concluses erradas quando
algu*m estuda a natureEa da distri+uio de pro+a+ilidade especialmente no caso de pequenas amostras.
,m segundo lugar quando outras pressuposies so )ioladas, a distri+uio dos resduos pode ser
afetada. 2or e.emplo, os resduos podem aparecer no normalmente distri+udos quando uma funo de
regresso no apropriada * usada ou quando a )ari-ncia dos termos do erro no * constante. 9ssim, *
recomend)el que se in)estigue primeiro outras pressuposies antes de considerar o pro+lema da
normalidade dos resduos.
4rios testes estatsticos so encontrados na literatura para testar a normalidade de )ari)eis
aleat#rias, como os testes de aderncia de qui5quadrado, Bolmogoro)5>mirno) e Nilifors. %utros testes
para normalidade so >/apiro5@il=s e >/apiro5:rancia. ,stes testes geralmente esto dispon)eis nos
pacotes estatsticos.
6) .ma ou mai& @ari5@ei& i(*e$e(*e(te& im$orta(te& (;o e&t;o i(3lu>*a& (o mo*elo
(esde que o+ser)aes este8am dispon)eis, os resduos de)em ser e.i+idos graficamente contra
outras )ari)eis independentes omitidas do modelo que possam ter efeito significante so+re a )ari)el
resposta. 2adres o+ser)ados nestes grficos podem indicar a necessidade de incluso de uma ou mais
)ari)eis independentes no modelo.
9 figura 2.1.$ ilustra um caso de omisso de )ari)el independente importante para o modelo
de regresso. 9 referida figura representa os grficos de resduos para um modelo de regresso linear
simples onde a )ari)el dependente V * o n;mero de itens produEidos num processo de fa+ricao e a
)ari)el independente U * a idade do operrio. 9p#s o a8uste do modelo considerou5se uma segunda
)ari)el independente tipo de mquina usada no processo de produo. % grfico a da referida figura
demonstra que o modelo de regresso linear simples a8ustado parece adequado. 2or*m, quando os
resduos so e.i+idos graficamente para os diferentes tipos de mquina, o+ser)a5se que na mquina 9 a
)ari)el resposta * su+estimada e na mquina A, superestimada. Recomenda5se neste caso a incluso da
)ari)el tipo de mquina no modelo.
ei ei
JaL J+L Mquina 9







Idade do operrio U Idade do operrio U
ei
JcL Mquina A

$!





Idade do operrio U
:igura 2.1.$ Ilustrao da omisso de uma )ari)el independente importante no modelo
de regresso linear.
%+ser)aes
1L %s pro+lemas com o modelo de regresso linear acima mencionados podem aparecer com+inados.
2ortanto em situaes prticas podem aparecer diagramas que se8am uma com+inao das formas acima
apresentadasP
2L 9 anlise grfica * )isual por*m, e.istem testes estatsticos formais para au.iliar a tomada de decisoP
!L 9 anlise de resduo aplica5se a modelos de regresso mais comple.os
'L Teste estatstico de aleatoriEao pode ser feito para assegurar5se de que os resduos distri+uem5se
aleatoriamente em torno da lin/a ei Q 3, nos grficos. Dm teste +astante con/ecido para este fim * o teste
das fileiras ou RrunS teste encontrado em muitos te.tos de ,statstica.
2.V.3 Te&te F $ara li(eari*a*e
7esta seo ser apresentado um teste estatstico formal para determinar se o modelo de
regresso linear simples * apropriado, ou se8a, se as )ari)eis V e U se relacionam de uma forma linear.
,ste teste assume que todas as pressuposies so+re o modelo, e.ceto a linearidade, esto satisfeitas. %u
se8a, assume que os V[s so independentes, normalmente distri+udos e as distri+uies dos V[s tem a
mesma )ari-ncia
2
, em qualquer n)el de U.
2ara aplicao do teste de linearidade, * necessrio que e.ista repetio das o+ser)aes V[s em
um ou mais n)eis de U. Repeties nos n)eis de U podem ser o+tidas atra)*s do plane8amento amostral
ou em e.perimentos delineados.
2ara efetuar o teste de linearidade considere = n)eis da )ari)el independente U e que o
modelo Vi Q 3 X 1Ui X i pode ser escrito como Vi8 Q 3 X 1Ui X i8 com i Q 1, 2, ..., = e 8 Q 1, 2, ..., ni,
ou se8a, em cada n)el i de U e.iste ni o+ser)aes de V. % e.erccio 2.6.& * um caso tpico onde o teste
de linearidade pode ser efetuado. 7aquele e.emplo tem5se = Q & e n1 Q n2 Q ... Q n& Q 2.
9 id*ia +sica para testar a linearidade do modelo de regresso * atra)*s da
decomposio da soma de quadrados de resduo em duas componentes C % erro puro e a falta de a8uste e
em seguida proceder o teste atra)*s da distri+uio :5>nedecor. % quadro da anlise de )ari-ncia com a
decomposio da soma de quadrados de resduo fica da seguinte formaI
Ta+ela 2.1.1 9nlise de )ari-ncia com decomposio da >GResduo para o teste de
linearidade no modelo de regresso linear simples.
"ausas de <raus de >omas de Guadrados :
)ariao li+erdade quadrados m*dios
Regresso 1 >GRegresso GMRegresso
s%d&o 8<
!ress,o 8<
Re
Re
h,rro JResduoL n C 2 >GResduo GMResduoi
$'
:alta de a8uste = 5 2 >G:98uste GM:98uste
8<EP&ro
8<@AB&se
,rro puro n C = >G,2uro GM,2uro
Total n C 1 >GTotal

2bte(8;o *a& &oma& *e =ua*ra*o& *e falta *e aIu&te e erro $uro
"onforme mencionado anteriormente, a id*ia +sica para testar a linearidade do modelo de
regresso * decompor a soma de quadrados de resduo em duas componentes C % erro puro e a falta de
a8uste e em seguida testar a falta de a8uste atra)*s de um teste :. "onsidere a figura 2.6.' referente ao
e.erccio 2.6.&, onde no n)el = Q1 de U tem5se V11 Q '2 e V12 Q 20, sendo portanto a m*dia o+ser)ada
da )ari)el resposta neste ponto de U, !$ e o )alor estimado pela equao a8ustada 00.$6. 9 diferena !$
5 00.$6 Q 5$!.$6 refere a falta de a8uste e as diferenas '2 5 !$ Q 6 e 20 5 !$ Q 56 referem a erro puro.
7o caso geral, a e.presso dos ei[s para cada o+ser)ao e a seguinteI
ei8 Q JVi8 5
i
1
^
L Q JVi8 5
. i
1 L X J
. i
1 5
i
1
^
L
,le)ando am+os os mem+ros desta equao ao quadrado e somando em todas as i,8 o+ser)aes temos
Jei8L
2
Q JVi8 5
i
1
^
L
2
Q ]JVi8 5
. i
1 L X J
. i
1 5
i
1
^
L\
2


;
i
n
B
i
1 1
Jei8L
2
Q


;
i
n
B
i
1 1
JVi8 5
i
1
^
L
2
Q


;
i
n
B
i
1 1
]JVi8 5
. i
1 L X J
. i
1 5
i
1
^
L\
2
(esen)ol)endo o quadrado e os somat#rios da e.presso acima c/ega5se aI


;
i
n
B
i
1 1
Jei8L
2
Q


;
i
n
B
i
1 1
JVi8 5
. i
1 L
2
X

;
i 1
ni J
. i
1 5
i
1
^
L
2
%u se8a,
>GResduo Q >G,2uro X >G:98uste. 9s e.presses para as somas de quadrados de erro puro e falta de
a8uste soI
>G,2uro Q


;
i
n
B
i
1 1
JVi8 5
. i
1 L
2
e >G:98uste Q

;
i 1
ni J
. i
1 5
i
1
^
L
2
%nde
. i
1 * a m*dia dos V[s no i5*simo n)el de U, ou se8a as o+ser)aes foram somadas em 8 e a soma
di)idida por ni.
%s quadrados m*dios so o+tidos da maneira usual, di)idindo5se as somas de quadrados pelos
correspondentes graus de li+erdade.
2ara testar a /ip#tese de linearidade
O3I ,JVL Q 3 X 1U )ersus OaI ,JVL 3 X 1U,
utiliEa5se a estatstica
: Q
8<EP&ro
8<@AB&se
Re8eita5se O3 em fa)or de Oa ao n)el de signific-ncia se : :JP =52P n5=L
%s graus de li+erdade associados ao erro puro so o+tidos, considerando5se que cada n)el i de U fornece
ni C1 <N. 9ssim, o n;mero de graus de li+erdade do erro puro *I
$$
; n n
;
i
i

1
L 1 J . % n;mero de graus de li+erdade associados Z falta de a8uste pode ser o+tido por
diferena, sendo Jn C 2L C Jn C =L Q = C2.
Exer3>3io 2.V.1 Ilustrao do teste : para linearidade
Testar a linearidade do modelo de regresso linear simples a8ustado no e.erccio 2.6.&.
Bolu8;o
7a figura 2.6.! podemos o+ter a >GRegresso Q $$!1.'20$6 e >GResduo Q 1$&!3.$61'!.
Inicialmente )amos o+ter as somas de quadrados de falta de a8uste e erro puro e a estatstica : para testar
a linearidade manualmente, utiliEando as f#rmulas apresentadas no incio desta seo.
7este e.emplo temos n Q 12, = Q & J& n)eis de UI 6$, 133, ..., 233L e n1 Q n2 Q ...Q n& Q 2,
portanto i Q 1, 2, ..., & e 8 Q 1, 2. % primeiro passo * o+ter os totais, m*dias e )ari-ncias de V em cada
n)el de U. 9ssim temosI
V1. Q 63, V2. Q 2'0, V!. Q !13, V'. Q !3', V$. Q 203 e V&. Q 220 e as correspondentes m*dias !$, 12', 1$$,
1$2, 1'3 e 11'. Dsando a e.presso de )ari-ncia amostral o+temosI s1
2
Q 10, s2
2
Q 200, s!
2
Q $3, s'
2
Q
1&2, s$
2
Q $12 e s&
2
Q 233. 9 soma de quadrados de erro puro * o+tida somando estas )ari-nciasI
>G,2uro Q 10 X 200 X ... X 233 Q 1!13
9 soma de quadrados de falta de a8uste *I
>G:98uste Q >GResduo C >G,2uro Q 1$&!3.$61'! C 1!13 Q 1'!23.$61'!
%utra alternati)a de o+ter a soma de quadrados de falta de a8uste * a seguinteI
>e8a V.. Q 1''3 Q soma de todas as o+ser)aes Vi8 e o fator de correo " Q V..
2
K12 Q 1''3
2
K12 Q 162033
Dma soma de quadrados de regresso mais falta de a8uste * o+tida porI
>GJRegresso X :alta de a8usteL Q ]J63
2
X 2'0
2
X ... X 220
2
LK2\ C "
Q J!0$!3'K2L C 162033 Q 110$2.
>G:98uste Q >GJRegresso X :alta de a8usteL C >GRegresso Q 110$2 5 $$!1.'20$6
Q 1'!23.$61'!.
% quadro da anlise de )ari-ncia da figura 2.6.! pode ser recomposto com as somas de quadrados de
erro puro e falta de a8uste, para aplicao do teste de linearidade da seguinte maneiraI
5ausa de %raus de 0oma de uadrado 1 p6<alor
<aria=>o li-erdade uadrado m?dio
#egress>o 1 5531342857 5531342857 33539 030893
#esBduo 10 15630357143 1563305714
1alta de a7uste 4 14320357143 3580314286 163398 030022
$rro puro 6 1310300000 218333333
!otal 11 21162300000
9 estatstica : para testar a /ip#tese de linearidade
O3I ,JVL Q 3 X 1U )ersus OaI ,JVL 3 X 1U,
* : Q JGM:98usteKGM,2uroL Q 1&.!10. (esde que 2h:'P& 1&.!10i Q 3.3322 quando O3 * )erdadeira,
de)e5se re8eitar a /ip#tese de linearidade ao um n)el de signific-ncia de $Y, pois, :J3.3$P'P&L Q '.$!. 4ale
ressaltar que quando o teste para O3I 1 Q 3 )ersus OaI 1 3 foi feito utiliEando a estatstica : Q
JGMRegressoKGMResduoL Q !.$!1 no se re8eitou O3 ao n)el de signific-ncia $Y, 8 que 2h:1P13
!.$!1i Q 3.301! quando O3 * )erdadeira J:J3.3$P1P13L Q '.1&L. >e o mesmo teste for feito usando a estatstica
: Q JGMRegressoKGM,2uroL Q 2$.!!$ O3 ser re8eitada ao n)el de signific-ncia de $Y, 8 que 2h:1P&
2$.!!$i Q 3.332', quando O3 * )erdadeira J:J3.3$P1P&L Q $.11L. ,ste ;ltimo teste * mais apropriado, por que
$&
a /ip#tese de linearidade para o relacionamento entre as )ari)eis foi re8eitada. 7este caso o quadrado
m*dio de erro puro * um mel/or estimador de
2
do que o quadrado m*dio do resduo.
%s pacotes estatsticos geralmente apresentam opes de se o+ter o teste para falta de a8uste no
modelo de regresso linear simples. 7a figura 2.1.& * apresentado um programa >9> J2R%" <NML
para o+teno das somas de quadrados e quadrados m*dios para erro puro e falta de a8uste e teste de
linearidade para os dados do e.erccio 2.1.1.
options ls=78 nodate nocenter;
data a;
input x y @@;
la-el x=tam do dep inicial
y=Cum de contas a-ertas;
/a=x;
cards;
75 42 75 28 100 112 100 136 125 160 125 150
150 143 150 161 175 156 175 124 200 124 200 104
;
run;
proc glm data=a;class /a;
model y = x /a;
run;
uit;
:igura 2.1.& 2rograma >9> J7,T,11'9.>9>L para o teste de linearidade dos dados do
e.erccio 2.1.1.
9 figura 2.1.6 apresenta o resultado da e.ecuo do programa >9> da figura 2.1.&.
!"e %+' &rocedure 6 5lass +e<el 9n/ormation
5lass +e<els ,alues
/a 6 75 100 125 150 175 200
Cum-er o/ o-ser<ations 12
!"e %+' &rocedure
*ependent ,aria-le( y Cum de contas a-ertas
0um o/
0ource *1 0uares 'ean 0uare 1 ,alue &r 2 1
'odel 5 19852300000 3970340000 18319 030014
$rror 6 1310300000 218333333
5orrected !otal 11 21162300000
:igura 2.1.6 Resultado JeditadoL da e.ecuo do programa >9> da figura 2.1.&.
#60uare 5oe// ,ar #oot '0$ y 'ean
03938097 12331342 14377611 12030000
0ource *1 !ype 9 00 'ean 0uare 1 ,alue &r 2 1
x 1 5531342857 5531342857 25333 030024
/a 4 14320357143 3580314286 16340 030022
$6
0ource *1 !ype 999 00 'ean 0uare 1 ,alue &r 2 1
x 0 0300000 3 3 3
/a 4 14320357143 3580314286 16340 030022
:igura 2.1.6 J"ontinuaoL.
Me*i*a& reme*ia*ora& - Tra(&forma89e& (a& @ari5@ei&
9p#s o diagn#stico, se o modelo a8ustado no parecer satisfat#rio / duas alternati)as a seguirI
aL escol/er um modelo mais apropriado ou +L proceder transformaes nas )ari)eis. ,scol/er um
modelo mais adequado significa propor uma forma diferente de relacionamento entre as )ari)eis, tentar
outras ou adicionar )ari)eis independentes ao modelo. % pro+lema de adicionar )ari)eis
independentes ao modelo ser tratado como regresso m;ltipla. % pro+lema de dependncia dos erros *
geralmente contornado utiliEando modelos que considera a correlao entre os erros. 9s transformaes
so geralmente recomendadas para os casos de no linearidade da funo de regresso e /eterogeneidade
da )ari-ncia dos erros e sero tratadas a seguir.
Tra(&forma89e& $ara li(eariMa8;o *o mo*elo
9s transformaes logartmicas so geralmente eficientes para este fim. "omo e.emplo,
considere o modelo
Vi Q 31
Ui
i
onde i * uma )ari)el aleat#ria com m*dia 1 e )ari-ncia constante.
9 transformao Vj Q logV resulta no modelo
Vij Q 3 X 1Ui X ij, sendo
3 Q log3, 1 Q log 1 e ij Q logi.
%+ser)e que ,JVL Q 31
U

9s transformaes logartmicas so recomendadas sempre que lienariEem o diagrama de
disperso, independente de um modelo ter sido proposto ou no.
%utras transformaes logartmicas soI
Vi Q 3 X 1Uij X i, onde Uj Q logU
Vij Q 3 X 1Uij X ij, sendo Vij Q logVi, Uij Q logUi e ij Q logi
,sta ;ltima transformao * usada em aplicaes econFmicas onde U * preo de um +em e V * a
quantidade demandada. 7esta aplicao 1 * a elasticidade da demanda Jou consumoL, ou se8a * a
)ariao percentual na quantidade demandada Jou consumidaL por )ariao percentual unitria no preo
do +em.
Tam+*m as )eEes * aplicada para lineariEao do modelo, a transformao recproca da formaI
Vj Q 1KV, para lineariEar o modelo
i i
i
2
1
+ +

1 3
1
Uj Q 1KU, para lineariEar o modelo
i
i
2
1

+ +
1
3
9lgumas )eEes utiliEa5se com+inaes de transformaes logartmica e recproca da forma
$0

,
_

1
1
log j
1
1 para lineariEar o modelo
L J
1 3
1
1
+ +
+

2
e
1
Tra(&forma89e& =ue e&tabiliMam a @ariC(3ia *o& erro&
>o+ condies de /eterocedasticidade da )ari-ncia dos termos do erro os estimadores de
mnimos quadrados ordinrios +3 e +1 so no tendenciosos e consistentes, por*m, no so de )ari-ncia
mnima. T importante ressaltar que no normalidade significante dos erros * geralmente ligada a
/eterocedasticidade de )ari-ncia dos mesmos. Dm caso geralmente encontrado * o fato dos erros Je
tam+*m os VjsL serem distri+udos segundo a distri+uio de 2oison onde a )ari-ncia dos erros cresce
quando os )alores da )ari)el independente U crescem, ou se8a,
V a 2oiJ`,L
2
JL
U
2
ou equi)alentemente
JL
U
7estes casos a transformao
1 1 j
, no s# esta+iliEa a )ari-ncia dos erros como tam+*m mel/ora
a normalidade.
,m muitas aplicaes de ,conomia encontra5se a situao
2
JL
Q BU
2
, onde B * um
fator de proporcionalidade. 9s transformaes recprocas apropriadas para
se o+ter estimadores no tendenciosos, consistentes e de )ari-ncia mnima
nestes casos, para o modelo V
i
Q
3
X
1
U
i
X
i
so as seguintesI
i
i
i
2
1
1 j
,
i
i
2
2
1
j
e
i
i
i
2

j
, que le)am ao modelo
V
i
j Q
3
j X
1
jUij X
i
j, com
3
j Q
1
e
1
j Q
3
.
T fcil )erificar que c/ega5se a V
i
j Q
3
j X
1
jUij X
i
j, multiplicando5se
V
i
Q
3
X
1
U
i
X
i
por 1KU
i
.
Mnimos quadrados ordinrios so+re o modelo V
i
j Q
3
j X
1
jUij X
i
j,
produEem estimadores no tendenciosos, consistentes e de )ari-ncia mnima
para os par-metros
3
j e
1
j. (emonstra5se tam+*m facilmente que a
)ari-ncia dos
i
j ser constante.
9 equao a8ustada ser da formaI
j j j j
^
1 3
2 - - 1 +
, onde as lin/as so
para denotar que a equao aplica5se aos )alores transformados das
)ari)eis. 2ara o+ter o modelo com as )ari)eis originais multiplica5se
j j j j
^
1 3
2 - - 1 +
por U
i
e o+t*m5se
2 - - 1
1 3
^
+
, com +
3
Q +
1
j e +
1
Q +
3
j.
2.10 ? 2& m>(imo& =ua*ra*o& $o(*era*o&
% m*todo de mnimos quadrados usados para a8ustar o modelo Vi Q 3 X 1Ui X i da seo 2.2.1
* denominado mnimos quadrados ordinrios e fornece estimadores no tendenciosos de )ari-ncia
mnima para os par-metros do modelo, se as o+ser)aes so independentes e apresentam )ari-ncias
constantes. O muitas situaes prticas, entretanto, onde estas duas propriedades no so )erificadas.
$1
7esta seo ser discutido o uso de mnimos quadrados ponderados que * mais apropriado para os casos
em que a )ari-ncia dos erros no * constante. Dm enfoque para resol)er este pro+lema * a transformao
de dados. %utra alternati)a * usar mnimos quadrados ponderados que fornecem estimati)as no
tendenciosas de )ari-ncia mnima, se pesos constantes apropriados forem especificados para cada termo
da soma de quadrados a ser minimiEada. % peso para o i5*simo termo de)e ser proporcional ao in)erso
da )ari-ncia da o+ser)ao daquele termo, ou se8a, pode se atri+uir como peso para o i5*simo termo, a
quantidade @i Q BK
2
i.
O situaes tam+*m em que
2
* proporcional a U
2
ou equi)alentemente * proporcional a U, ou se8a,
o+ser)a5se
2
JiL Q BUi
2
onde B * um fator de proporcionalidade. 7estas condies os estimadores
mnimos quadrados ponderados dos par-metros so o+tidos minimiEando a quantidade G Q @iJVi C +3
C +1UiL
2
onde
2
1
i
i
C2
A
Igualando as deri)adas parciais de G em relao a +3 e +1 da e.presso acima o+t*m5se o seguinte
sistema de equaes normaisI


+
n
i
n
i
i
i
i
n
i
i
2
1
2
-
2
-
1 1
2
1
1
2
3
1 1


+
n
i
i
i
n
i
i
2
1
n-
2
-
1
1
1
3
1
9s estimati)as o+tidas pelos mnimos quadrados ponderados tem menor )ari-ncia amostral do que as de
mnimos quadrados ordinrios. 2ode se demonstrar que o uso dos mnimos quadrados ponderados neste
caso, * equi)alente a se proceder a seguinte transformao nas )ari)eisI
i
i
i
2
1
1
j
e
i
i
2
2
1
j

Exer3>3io 2.10.1 C Ilustrao do uso de transformaes recprocas e mnimos quadrados


ponderados
%s dados seguintes J7,T,R k @9>>,RM977, 116'L referem5se a taman/os de canteiros JUL e custos
de instalao JVL para o+ras de construo ci)ilI
Ui 2.1! 1.21 11.33 &.33 $.&3 &.11 2.16 !.!$ 13.!1 1.13 '.!& 0.33
Vi 1$.$ 11.1 &2.& !$.' 2'.1 20.1 1$.3 2!.2 '2.3 13.3 23.3 '6.$
98ustar um modelo de regresso linear simples aos dados utiliEando mnimos quadrados ordinrios,
mnimos quadrados ponderados com pesos
2
1
i
i
C2
A
e mnimos quadrados ordinrios com a
transformao
i
i
i
2
1
1
j
e
i
i
2
2
1
j

para estimati)as dos par-metros. "ompare e comente as estimati)as dos par-metros nos trs casos.
Bolu8;o
i Ui Vi Uif2 UijQ1KUi 1KUif2 VijQViKUi ViKUif2 Uijf2 UijVij
1 2.1! 1$.$ '.$!&1 3.'&1$ 3.223' 6.2663 !.'1&' 3.223' $2.1$'6
2 1.21 11.1 1.'&'1 3.02&' 3.&0!3 1.16!& 6.$01' 3.&0!3 0'.1$'1
! 11.33 &2.& 121.3333 3.3131 3.330! $.&131 3.$16' 3.330! !2.!0&'
' &.33 !$.' !&.3333 3.1&&6 3.3260 $.1333 3.10!! 3.3260 !'.0133
&3
$ $.&3 2'.1 !1.!&33 3.160& 3.3!11 '.''&' 3.61'3 3.3!11 11.6636
& &.11 20.1 '6.6'01 3.1''6 3.3231 '.3&&& 3.$00$ 3.3231 1&.$!63
6 2.16 1$.3 0.0231 3.!!&6 3.11!' $.3$3$ 1.633$ 3.11!' 2$.$36&
0 !.!$ 2!.2 11.222$ 3.210$ 3.3011 &.12$' 2.3&6! 3.3011 '6.1&30
1 13.!1 '2.3 136.1$21 3.31&2 3.331! '.3'2! 3.!011 3.331! 1&.!'3&
13 1.13 13.3 1.2133 3.1311 3.02&' 1.3131 0.2&'$ 3.02&' 02.&''&
11 '.!& 23.3 11.331& 3.221' 3.3$2& '.$062 1.3$21 3.3$2& 21.3'23
12 0.33 '6.$ &'.3333 3.12$3 3.31$& $.1!6$ 3.6'22 3.31$& !$.2$!1
>omas &!.32 !!$.!3 '$'.!2'2 !.0616 2.3106 62.1002 20.31&6 2.3106 '&1.!&2'
9 ta+ela acima fornece os seguintes )alores para o sistema de equaes normaisI
2.3106+3 X !.0616+1 Q 20.31&6
!.0616+3 X 12+1 Q 62.1002 cu8a soluo *I +3 Q $.&$63 e +1 Q '.113&
7a figura 2.13.1 * apresentado um programa >9> para o a8uste do modelo de regresso linear
simples atra)*s dos mnimos quadrados ordinrios, ponderados e transformaes.
options ls=78 nocenter nodate;
JJ $stimati<as pelos minimos uadrados ordinarios JJ;
data a;
input x y;
x2=xJJ2;
xl=1Dx;
yl=yDx;
pe=1Dx2;
la-el x=tam do canteiro
y=custo de instalacao
xl=x trans/ormado
yl=y trans/ormado;
cards;
2313 1535
1321 1131
11300 6236
6300 3534
5360 2439
6391 2831
2397 1530
3335 2332
10339 4230
1310 1030
4336 2030
8300 4735
;run;
proc reg;
model y = x D clm;
title I'inimos uadrados ordinariosI;
run;
JJ $stimati<as pelos minimos uadrados ponderados6iml JJ;
data :null:;
proc iml;
x = Q 230987 338717 @
338717 12 R;
y = Q 2830967@7231882 R;
xin<=in<AxG;
-eta=xin<Jy;
print S$stimati<as pelos minimos uadrados ponderados60.0D9'+S@ xin< -eta;
uit;
proc reg data=a;
model y = x Dclm;
Feig"t pe;
title I$stimati<as pelos minimos uadrados ponderados60.0D#$%I;
&1
run;
JJ .7uste do modelo trans/ormando as <aria<eis JJ;
proc reg data=a;
model yl = xl;
title I$stimati<as com <aria<eis trans/ormadasI;
run;
:igura 2.13.1 2rograma >9> J7,T,R1!!.>9>L para resoluo do e.erccio 2.13.1.
7a figura 2.13.2 * apresentado o resultado JeditadoL da e.ecuo do programa >9> da figura
2.13.1.
'inimos uadrados ordinarios
!"e #$% &rocedure
'odel( ')*$+1
*ependent ,aria-le( y custo de instalacao
.nalysis o/ ,ariance
0um o/ 'ean
0ource *1 0uares 0uare 1 ,alue &r 2
1
'odel 1 2515311291 2515311291 73300
430001
$rror 10 344353626 34345363
5orrected !otal 11 2859364917
#oot '0$ 5386972 #60uare 038795
*ependent 'ean 27394167 .d7 #60 038675
5oe// ,ar 21300705
&arameter $stimates
&arameter 0tandard
,aria-le +a-el *1 $stimate $rror t ,alue
9ntercept 9ntercept 1 4322895 3325174 1330
x tam do canteiro 1 4351528 0352847 8354
&arameter $stimates
,aria-le +a-el *1 &r 2 8t8
9ntercept 9ntercept 1 032226
x tam do canteiro 1 430001
'inimos uadrados ordinarios
!"e #$% &rocedure
'odel( ')*$+1
*ependent ,aria-le( y custo de instalacao
)utput 0tatistics
*ep ,ar &redicted 0td $rror
)-s y ,alue 'ean &redict 95K 5+ 'ean #esidual
1 1535000 1338465 233649 835772 1931158 136535
2 1131000 936924 237264 336176 1537672 134076
3 6236000 5338970 334784 4631465 6136474 837030
4 3534000 3133206 137400 2734437 3531975 430794
5 2439000 2935145 137044 2537168 3333122 6436145
6 2831000 3534295 139077 3131790 3936800 6733295
7 1530000 1736393 230797 1330055 2232731 6236393
&2
8 2332000 1933551 139701 1439656 2337447 338449
9 4230000 5131427 332008 4430109 5832744 6931427
10 1030000 931957 237722 330190 1533725 038043
11 2030000 2339155 137587 1939968 2738343 6339155
12 4735000 4033511 232317 3533785 4533238 731489
:igura 2.13.2 Resultado JeditadoL da e.ecuo do programa >9> da figura 2.13.1.
0um o/ #esiduals 0
0um o/ 0uared #esiduals 344353626
&redicted #esidual 00 A&#$00G 586320863
'inimos uadrados ordinarios
$stimati<as pelos minimos uadrados ponderados60.0D9'+
N9C, O$!.
131771239 603379789 53656997
603379789 032058692 431905004
$stimati<as pelos minimos uadrados ponderados60.0D#$%
!"e #$% &rocedure
'odel( ')*$+1
*ependent ,aria-le( y custo de instalacao
Teig"t( pe
.nalysis o/ ,ariance
0um o/ 'ean
0ource *1 0uares 0uare 1 ,alue &r 2
1
'odel 1 85330147 85330147 107377
430001
$rror 10 7391508 0379151
5orrected !otal 11 93321655
#oot '0$ 0388967 #60uare 039151
*ependent 'ean 13338756 .d7 #60 039066
5oe// ,ar 6364548
&arameter $stimates
&arameter 0tandard
,aria-le +a-el *1 $stimate $rror t ,alue
9ntercept 9ntercept 1 5365685 0396524 5386
x tam do canteiro 1 4319055 0340366 10338
&arameter $stimates
,aria-le +a-el *1 &r 2 8t8
9ntercept 9ntercept 1 030002
x tam do canteiro 1 430001
$stimati<as pelos minimos uadrados ponderados60.0D#$%
!"e #$% &rocedure
'odel( ')*$+1
*ependent ,aria-le( y custo de instalacao
)utput 0tatistics
&!
Teig"t *ep ,ar &redicted 0td $rror
)-s ,aria-le y ,alue 'ean &redict 95K 5+ 'ean
1 032204 1535000 1435827 036248 1331906 1539749
2 036830 1131000 1037274 036654 932447 1232101
3 03008264 6236000 5137529 337463 4334056 6031002
4 030278 3534000 3038002 137862 2638203 3437801
5 030319 2439000 2931239 136355 2534798 3237681
6 030209 2831000 3436136 231349 2938568 3933704
:igura 2.13.2 J"ontinuaoL

7 031134 1530000 1831028 037638 1634009 1938047
8 030891 2332000 1936952 038639 1737703 2136201
9 03009263 4230000 4931967 335036 4133901 5730033
10 038264 1030000 1032665 036838 837429 1137900
11 030526 2030000 2339277 131866 2132838 2635715
12 030156 4735000 3931813 235594 3334786 4438840
0um o/ #esiduals 0
0um o/ 0uared #esiduals 7391508
&redicted #esidual 00 A&#$00G 10332205
C)!$( !"e a-o<e statistics use o-ser<ation Feig"ts or /reuencies3
$stimati<as com <aria<eis trans/ormadas
!"e #$% &rocedure
'odel( ')*$+1
*ependent ,aria-le( yl y trans/ormado
.nalysis o/ ,ariance
0um o/ 'ean
0ource *1 0uares 0uare 1 ,alue &r 2
1
'odel 1 27318541 27318541 34335
030002
$rror 10 7391508 0379151
5orrected !otal 11 35310049
#oot '0$ 0388967 #60uare 037745
*ependent 'ean 6301569 .d7 #60 037520
5oe// ,ar 14378912
&arameter $stimates
&arameter 0tandard
,aria-le +a-el *1 $stimate $rror t ,alue &r 2 8t8
9ntercept 9ntercept 1 4319055 0340366 10338 430001
xl x trans/ormado 1 5365685 0396524 5386 030002
:igura 2.13.2 J"ontinuaoL
3. 2 mo*elo *e re"re&&;o li(ear m)lti$la
3.1. Tratame(to matri3ial *o mo*elo *e re"re&&;o li(ear. E=ua89e& (ormai&
9 regresso linear simples * muito utiliEada de)ido Z sua simplicidade. ,ntretanto em muitas
situaes a e.plicao de um fenFmeno atra)*s de apenas uma )ari)el independente pode no ser
&'
satisfat#rio, pois essa )ari)el ser apenas uma das )rias componentes influenciando na )ariao da
resposta estudada.
7estes casos de)e5se propor um modelo en)ol)endo mais de uma )ari)el independente,
c/amado de modelo de regresso m;ltipla. 9 teoria para anlise de regresso linear m;ltipla *
semel/ante Z desen)ol)ida para regresso linear simples, mas por uma questo de eficincia no que diE
respeito a representao dos dados, o uso de matriEes * imprescind)el.
% modelo de regresso linear m;ltipla pode ser descrito comoI
Vi Q 3 X 1 U1 i X 2 U2 i X ... X = U= i X i
ou matricialmente comoI
R Q 7 X
ondeI R Q )etor de dimenso J n . 1 L com os )alores da )ari)el respostaP

7 Q matriE de constantes, de dimenso J n . =X1 L, com as = )ari)eis
independentes e coluna do interceptoP

Q )etor de erros Jaleat#rioL de dimenso Jn . 1L.
9ssim R

1
]
1
1
1
1
1
1
V
V
V
n
1
2
.
.
7

1
]
1
1
1
1
1
1
1
1
1
11 1=
21 2
U U
U U
U U
=
n1 n=
. .
. .
. . . . .
. . . . .
. .

1
]
1
1
1
1
1
1

1
2
.
.
n
.
e * um )etor de par-metros da forma W Q ]3 1 2 ... =\
"omo na regresso linear simples, para o+teno das estimati)as de mnimos quadrados Jou de
m.ima )erossimil/anaL dos par-metros e analises de )ari-ncia de)e5se o+ter as equaes normais para
o caso de regresso m;ltiplaI
2 &i&tema *e e=ua89e& (ormai&
2ara o+teno do sistema de equaes normais, escre)endo5se os somat#rio dos i
2
como uma
funo dos )alores o+ser)ados e dos par-metros a serem estimados Jou dos estimadoresL, c/ega5se aI
J K
i

J i L
2
Q [ Q JR57L[JR57LQR[R 5 R[ 7 5 J7L[R X J7L[J7L
Q R[R 5 R[7 5 [7[R X [7[7 Q R[R 5 2[7[R X [7[7 .
7ote queI R[ 7 resulta em um n;mero. Nogo R[ 7 Q [ 7[ R .
(iferenciando com respeito a

8
Q 52 7[R X 2 7[7 b
e 7[7 b Q 7[R.
9s equaes pro)enientes dessa igualdade so equaes normais anlogas Zquelas
apresentadas na seo 2.2.1.
3.2 'o(3eito& e $re&&u$o&to& &obre o& 3om$o(e(te& *o mo*elo
&$
7o enfoque deste te.to, modelo de regresso linear m;ltipla admite que a relao entre a
)ari)el dependente V e as )ari)eis independentes U[s * linear e aditi)a, ou se8a, no * admitido
interao entre as )ari)eis independentes, logo, elas no de)em aparecer no modelo na forma de
produto, em e.poente, etc.
9dmite5se para os termos do erro do modelo ,J i L Q 3 e 4ar ]i \ Q
2
+< sendo + Q matriE
identidade. "onseqHentemente tem5se, ,JVL Q 3 X 1 U1 i X 2 U2 i X ... X = U= i e 4ar JVi L Q
2
+.
3.3 E&tima8;o $o(tual *o& $arCmetro& *o mo*elo. 2 teorema *e Gau&&-MarSo@
(o sistema de equaes normais, 7[7 b Q 7[R conclui5se que
b Q J7[7L
51
7[R .
e o )etor de o+ser)aes *
1
^
K 7b.
(efinindo o )etor de resduos Jerros o+ser)adosL e Q R -
1
^
< e[e pode ser escrito comoI
e[e Q R[R 5 2 b[ 7[R X b[ 7[7 b Q >GR,>I(D% J>oma de quadrados de resduoL.
%+ser)e que se as colunas de 7[7 no forem linearmente independentes /a)er pro+lemas no
clculo de J7[7L
51
, pois no e.istir uma ;nica matriE in)ersa nesta situao.

% produto das matriEes 7[e 7 resulta em
7[7 Q
1
1
1
1
1
1
1
1
]
1




.
. .
. . . . .
. . . . .
. .
. .
2
1
1
2
1 1
1
i
i;
i
i i;
i
i;
i
i; i
i
i
i
i
i
i;
i
i
2 2 2 2
2 2 2 2
2 2 n
onde .i= Q i5*sima o+ser)ao da =5*sima )ari)el.
%s elementos diagonais da matriE 7[7 so o n;mero de o+ser)aes Jprimeiro elementoL e as somas
dos quadrados dos elementos das colunas da matriE 7 e os elementos fora da diagonal so as somas dos
produtos cruEados dos elementos das colunas de 7. 9 matriE acima * sim*trica e ser sempre definida
positi)a.

Tam+*m, 7[R Q
V
U V
U V
i
i
i1 i
i
i= i
i

1
]
1
1
1
1
1
1
1
.
.
.
&&
7o caso do modelo de regresso linear simples o+ser)a5se as seguintes formas para as matriEes 7[7<
J7[7L
51
e 7[RI
7[7 K
1
1
1
1
]
1

n
i
i
n
i
i
n
i
i
2 2
2 n
1
2
1
1
, J7[7L
51
Q
1
1
1
1
]
1

n 2
2 2
2 2 n
n
i
i
n
i
i
n
i
i
n
i
i
1
1 1
2
1
2
L J
1
e
7[R Q
1
1
1
1
]
1

n
i
i i
n
i
i
1 2
1
1
1
!ro$rie*a*e& *o mo*elo aIu&ta*o
9 teoria de regresso linear supe que os erros o+tidos a partir da modelagem tem m*dia Eero
e,

1
^
Q 7 b Q 7 J 7[7L
51
7[R Q R

ondeI Q 7 J7[7L
51
7[.

9 matriE J/atL * uma matriE determinada pelos )alores Ui[s e satisfaE regras importantes
em anlise de regresso, tais comoI
J1L simetria J [ Q L
J2L idempotncia J. Q L .

(enotando o )etor de resduos por e P
%+ser)a5se que e Q R 5
1
^
Q R 5 R Q J + 5 L R

1L e 4ar] e \ Q 4ar] J + 5 L R \ Q 4ar ]J + 5 L J 7 X L\
Q 4ar ] 7 5 7 X J + 5 L \
Q 4ar ] 7 5 7 J7[7L
51
7[7 X J + 5 L \
Q 4ar ] J + 5 L \ Q J + 5 L 4ar ] \ J + 5 L[
Q
2
J + 5 L
2ode5se demonstrar que
2L 7We Q 0
!L
1
^
We Q 3
!ro$rie*a*e& *o& e&tima*ore& *e M>(imo& Jua*ra*o&
(a e.presso de b nota5se que as estimati)as dos coeficientes da regresso so funes lineares
da )ari)el dependente R com os coeficientes dados por J7[7L
51
7[ .
Tam+*m,
,] b \ Q , ] J7[7L
51
7[R \ Q J7[7L
51
7[ ,] R \ Q J7[7L
51
7[7

e sa+e5se que J7[7L
51
J7[7L Q +, logo ,] b \ Q
&6
2ara o clculo da )ari-ncia de b JmatriE de )ari-ncias e co)ari-nciasL * importante recordar a
seguinte propriedade de funes linearesI
>upondo que .Q4R,
4ar ] . \ Q , h ] . 5 , J . L \ . ] . 5 , J . L \[ i
e su+stituindo 4 R por . o+t*m5se
4ar ] . \ Q , h ] 4 R 5 , J 4 R L \ . ] 4 R 5 , J 4 R L \[ i
Q , h 4 ] R 5 , J R L \ . ] R 5 , J R L \[ 4[ i
Q 4 , h ] R 5 , J R L \ . ] R 5 , J R L \[ i 4[
Q 4 4ar ] R \ 4[ P
logo 4ar ] b \ Q 4ar ] J7[7L
51
7[R \ Q ] J7[7L
51
7[ \ 4ar ] R \ ] J7[7L
51
7[ \[

Q ] J7[7L
51
7[ \ . ] J7[7L
51
7[ \[ 4ar ] R \
Q J7[7L
51
J7[7L J7[7L
51

2
Q J7[7L
51

2
%+ser)a5se que J7[7L
51
* uma matriE sim*trica e portanto sua matriE transposta * ela mesma.
9s co)ari-ncias das estimati)as dos par-metros do modelo de regresso linear m;ltipla so
dadas pelos elementos da matriE J7[7L
51
multiplicados por
2
. (esta forma "i8 Q J7[7L
51
i8 onde os
ndices RiS e R8S denotam respecti)amente lin/a e coluna da matriE in)ersa, representa a co)ari-ncia
entre os estimadores dos par-metros. 7o caso de i Q 8 o+t*m5se a )ari-ncia .
,ntoI
4ar ] +8 \ Q
2
"8 8
"o) ] +i , +8 \ Q
2
" i8
2ara o )etor
1
^
tem5se os seguintes resultadosI
4arJ
1
^
L Q 4arJ7b) K 4arJ7(7W7)
-1
7WR) K 7(7W7)
-1
7W4arJRL Q
2

2ara pre)iso de no)as o+ser)aes tem5seI
h
1
^
Q U/b o que implica em 4arJ
h
1
^
L Q 4arJU/bL Q 4arJ
1
^
L X 4arJV/) K
2
X +
2

Q J X +L
2

9 figura !.!.1 cont*m um programa >9> no 2R%" IMN para a8uste de um modelo de regresso linear
simples usando a notao matricial. 9 e.tenso deste programa para o modelo de regresso linear
m;ltipla * direta.
&0
options ls=78 nodate;
data um;
input x y;
cards;
75 28
75 42
100 112
100 136
125 160
125 150
150 151
150 143
175 156
175 124
200 104
200 124
;
proc reg;
title I.nalise de regressao no proc regI;
model y=x D p clm cli;
run;
proc iml;
use um;
start regress;
read all <arQxR into x1;
read all <arQyR into y;
71=7A12@1G;
72=7A12G;
x=7188x1;
i12=iA12G;
x1x=xUJx;
x1y=xUJy;
print@S.nalise de regressao no proc iml6'atriHes6. S@ 71 72 x1x y;
x1xin<=in<Ax1xG;
n=nroFAxG;
glres=nroFAxG6ncolAxG;
-eta"at=x1xin<Jx1y;
"=xJx1xin<JxU;
y"at="Jy;
resid=y6y"at;
sres=ssAresidG;
mres=sresDglres;
stot=ssAy6sumAyGDnG;
r2=Astot6sresGDstot;
sreg=yUJA"6A1DnGJ72GJy;
print@ S .nalise de regressao no proc iml6.C),.6. S@stot sreg sres
mres r2;
dp-eta=srtA<ecdiagAx1xin<GJmresG;
t=-eta"atDdp-eta;
/=sregDmres;
pro-=16pro-/A/@1@glresG;
print@ S.nalise de regressao no proc iml6$stims e in/ers6. S@ -eta"at
dp-eta t / pro-;
print@ y y"at resid;
:igura !.!.1 2rograma >9> J7,T,11'A.>9>L para a8uste de modelo de regresso
Ninear utiliEando a lge+ra matricial.
&1
/inis" regress;
reset noprint;
run regress;
uit;
data :null:;
proc iml;
x = Q 1 75 @
1 75 @
1 100 @
1 100 @
1 125 @
1 125 @
1 150 @
1 150 @
1 175 @
1 175 @
1 200 @
1 200 R;
y = Q 28@42@112@136@160@150@151@143@156@124@104@124 R;
xpxi=in<AtAxGJxG;
-eta=xpxiJAtAxGJyG;
y"at=xJ-eta;
resid=y6y"at;
712=7A12@12@1G;
n=nroFAxG;
gle=n6ncolAxG;
/co=A1DnGJAtAyGJ712JyG;
stot=tAyGJy6/co;
sreg=tA-etaGJtAxGJy6/co;
sres=tAyGJy6tA-etaGJtAxGJy;
print@ S.nalise de regressao no proc iml6$st e .C),.6OS@ y"at resid
-eta stot sreg sres;
uit;
:igura !.!.1 J"ontinuaoL
2 teorema *e Gau&&-MarSo@
Guando a forma da distri+uio dos termos do erro i, no * especificada no * poss)el e.aminar a
l+ondadel dos estimadores Jsuficincia, )ari-ncia mnima, etc.L de 3 e 1 e especialmente funes deles.
2orem, algumas funes podem ser e.aminadas, como por e.emplo b J)etor estimador de L como as
funes lineares dos Vijs. Guando os i so distri+udos normalmente bQJUjUL
51
UjV tem menor )ari-ncia
que qualquer outro estimador no tendencioso, linear ou no. Guando os i no so normalmente
distri+udos isto no pode ser afirmado. 2or*m quando b * uma funo linear do tipo /JV1, V2, ... , VnL, o
Teorema de <auss5Mar=o) assegura )ari-ncia mnima para b mesmo quando os i no so normalmente
distri+udos, ou se8a, so estimadores lineares no tendenciosos de )ari-ncia mnima. ,ste tipo de
estimador aparece nos te.tos de Inferncia ,statstica com a sigla M,N74 JMel/ores ,stimadores
Nineares no )iesadosL. ,m resumo, o Teorema de <auss5Mar=o) pode ser enunciado da seguinte formaI
Dadas as hi+"eses do mode(o c(0ssico de re!ress,o (inear, os esimadores de m%nimos
6&adrados, na c(asse dos esimadores (ineares n,o viesados, em vari/ncia m%nima, o& seBa, s,o
<E9>E.

2ro)aI
63
7o modelo de regresso linear simples * fcil mostrar que ,J+3L Q 3 e ,J+1L Q 1. 2ara mostrar
que estes estimadores so tam+*m de )ari-ncia mnima na classe de todos os estimadores lineares no
tendenciosos, considere o estimador de mnimos quadrados de 1, +1 Q =iVi, sendo

n
i
i
i
n
i
i
i
i
3
3
2 2
2 2
;
1
2
1
2
L J

mostrando que +1 * uma m*dia ponderada dos Vijs com =i ser)indo de pesos
(efine5se um estimador linear alternati)o de 1 comoI +1
d
Q ?iVi onde ?i so pesos no
necessariamente iguais a =i. ,nto,
,J+1
d
L Q ?i,JViL Q ?iJ3 X 1UiL Q 3 ?i X 1?i Ui
2ara +1
d
ser no tendencioso * necessrio que se ten/a ?i Q 3 e ?i Ui Q 1
9 )ari-ncia de +1
d
* o+tida porI
4arJ+1
d
L Q 4arJ?iViL Q ?i
2
4arJViL Q
2
?i
2

Q

,
_

,
_

2
2 2
2
i
i
i
i
i
3
3
3
3
F

,
_

,
_

,
_

,
_


2 2
2
2
2
2
2
2
2
2
i
i
i
i
i
i
i
i
i
i
3
3
3
3
F
3
3
3
3
F
Q

,
_

,
_

2
2
2
2
2
1
i i
i
i
3 3
3
F J% ;ltimo termo desaparece pelo fato de se
ter ?i Q 3 e ?i Ui Q 1L.
"omo o ;ltimo termo da e.presso acima * uma constante, a )ari-ncia de +1
d
pode ser
minimiEada, manuseando o primeiro termo, que escrito como funo de ?i ser mnimo para

2
i
i
i
3
3
F
. 9ssim, a )ari-ncia de +1
d
na ;ltima e.presso acima se reduE a
4arJ+1
d
L Q

2
2
i
3

Q 4arJ+1L.
9ssim, com os pesos ?i Q =i que so os pesos de mnimos quadrados, a )ari-ncia do estimador
linear +1
d
* igual a )ari-ncia do estimador de mnimos quadrados +1. "aso contrrio 4arJ+1
d
L c 4arJ+1L,
ou se8a, se /ou)er um estimador linear no tendencioso de )ari-ncia mnima de ele de)e ser o
estimador de mnimos quadrados.
Dma pro)a mais geral do Teorema de <auss 5 Mar=o) pode ser o+tida considerando o modelo
de regresso linear em notao matricial, ou se8a o modelo da forma R Q 7 X , descrito na seo !.1.
>e8a B
-1
Q (7X7)
-1
e 4 Dma matriE de constantes qualquer p . n e
b
Y
Q 4R. %+ser)e que b
d
* uma funo linear qualquer de R que de)e ser assumida como um estimador
de . >er portanto necessrio especificar os elementos de 4 de modo que b
Y
se8a o mel/or estimador
linear no tendencioso de . >e8a 4 Q B
-1
7XXQ. (esde que B
-1
7X * con/ecida, ser ento necessrio
encontrar Q para especificar 4.
2ara no tendenciosamente tem5seI
,Jb
Y
L Q ,J4R) Q ]JB
-1
7XXQ)E(R)\ Q ]JB
-1
7XXQ) 7\ Q X Q7
2ara ser no tendencioso * necessrio que ,Jb
Y
L Q o que requer Q7 Q 3 para todo . 9ssim, no
tendenciosidade requer Q7 Q 3, ou se8a, Q Q 3 e conseqHentemente
4 Q B
-1
7X
2ara a propriedade lmel/orl J)ari-ncia mnimaL * necessrio determinar a matriE Q que
minimiEe a )ari-ncia de bi
d
para i Q 1, 2, ..., p su8eita a restrio Q7 Q 3. 2ara esta anlise considere a
co)ari-ncia
"o)Jb
Y
L Q ,] Jb
Y
5 LJ b
Y
5 Lj \ Q ,h]JB
-1
7XXQ)R - \ ]JB
-1
7XXQ)R - \j i.
>u+stituindo R por 7 X e usando Q7 Q 3, o+t*m5se
61
"o)Jb
Y
L Q ,h]JB
-1
7XX7B
-1
XQXQX X B
-1
7XXQX XQX7B
-1
i Q
2
JB
-1
X QQXL
>e8a QQX Q G Q JgiiL. ,nto "o)Jb
Y
L Q
2
JB
-1
X GL. %s elementos da diagonal de "o)Jb
Y
L so as
correspondentes )ari-ncias dos +i
d
. 2ara minimiEar cada )arJ+i
d
L de)e5se minimiEar cada elemento da
diagonal de co)Jb
Y
L. (esde que
2
e B
-1
so constantes * necessrio apenas determinar a matriE G de
modo que cada elemento de sua diagonal se8a mnimo. Mas G K QQX * semipositi)a definida, portanto gii
3. 9ssim, os elementos da diagonal de co)J+
d
L so mnimos quando gii Q 3 para i Q 1, 2, ..., p. >e Q Q
J+ii L ento gii Q

n
B
iB
-
1
2
. 2ortanto, se gii Q 3 para todo i * )erdade que +i8 Q 3 para todo i e 8. Isto implica
que Q Q 3. 9 condio Q Q 3 * compat)el com a condio de no tendenciosidade, Q7 Q 3. 2ortanto, 4
Q B
-1
7X e b
Y
Q b. Isto completa a pro)a do Teorema de <auss 5 Mar=o).
3.4 Exem$lo& *e a$li3a8;o *e re"re&&;o m)lti$la
Exer3>3io 3.3.1 Ilustrao do a8uste de um modelo de regresso linear m;ltipla com duas )ari)eis
independentes
Dma compan/ia )ende determinado creme de +eleEa numa cadeia de lo8as
instaladas em 1$ municpios de um estado J,.emplo de 7eter et. al. 116', pgina 2!$L.
9 compan/ia est interessada na pre)iso de )endas em grosas J)ari)el dependente V 5
1 grosaQ12 d;EiasL por municpio em funo da populao J)ari)el independente U1
em 1333 /a+itantesL e da renda per capita J)ari)el independente U2 C em d#laresL do
municpio. 9 "ompan/ia dispe dos seguintes dados tomados em 1$ municpios em
perodo recenteI
%+ser)a
o JiL
4endas JVL 2opulao
em 1333 /a+
JU1L
Renda per
capitaJU2L
V ao
quadrado
U1
2
U2
2
U1dU2 U1dV U2dV
1 1&2 26' 2'$3 2&2'' 6$36& &332$33 &61!33 ''!00 !1&133
2 123 103 !2$' 1''33 !2'33 13$00$1& $0$623 21&33 !13'03
! 22! !6$ !032 '1621 1'3&2$ 1''$$23' 1'2$6$3 0!&2$ 0'60'&
' 1!1 23$ 20!0 161&1 '232$ 03$'2'' $01613 2&0$$ !61660
$ &6 0& 2!'6 ''01 6!1& $$30'31 2310'2 $6&2 1$62'1
& 1&1 2&$ !602 20$&1 6322$ 1'!3!$2' 13322!3 ''60$ &!11$0
6 01 10 !330 &$&1 1&3' 13'03&' 21'60' 61!0 2'!&'0
0 112 !!3 2'$3 !&0&' 130133 &332$33 030$33 &!!&3 '63'33
1 11& 11$ 21!6 1!'$& !032$ '$&&6&1 '1&61$ 22&23 2'6012
13 $$ $! 2$&3 !32$ 2031 &$$!&33 1!$&03 211$ 1'3033
11 2$2 '!3 '323 &!$3' 10'133 1&1&3'33 1620&33 130!&3 131!3'3
12 2!2 !62 ''26 $!02' 1!0!0' 11$10!21 1&'&0'' 0&!3' 13263&'
1! 1'' 2!& 2&&3 236!& $$&1& 636$&33 &266&3 !!10' !0!3'3
1' 13! 1$6 2300 13&31 2'&'1 '!$16'' !2601& 1&161 21$3&'
1$ 212 !63 2&3$ ''1'' 1!&133 &60&32$ 1&!0$3 60''3 $$22&3
>omas 22$1 !&2& '''20 !1'136 13&6&1' 1!13&!'20 11'11101 &'6136 631&&11
98ustar um modelo de regresso linear m;ltipla aos dados, interpretar os resultados, e a)aliar a
qualidade do modelo a8ustado.
7a figura !.!.2 encontra5se um programa >9> para a8uste do modelo solicitado
no e.erccio !.!.1.
options ls=78 nodate;
62
data a;
input y x1 x2;
la-el y=<endas em grosas
x1=tam pop em 1000
x2=renda percapita;
cards;
162 274 2450
120 180 3254
223 375 3802
131 205 2838
67 86 2347
169 265 3782
81 98 3008
192 330 2450
116 195 2137
55 53 2560
252 430 4020
232 372 4427
144 236 2660
103 157 2088
212 370 2605
;
run;
proc reg;
model y = x1 x2 D ss1 ss2 co<- xpx i p r;
interc( test intercept=0;
:igura !.!.2 programa >9> J7,T,R2!$.>9>L para a8uste do modelo solicitado no
e.erccio !.!.1.
test x1=0;
test x2=0;
test x1=0@ x2=0;
output out = a1
p = y"at
r = resid
run;
proc reg;
model y=;
run;
proc reg;
model y=x1;
run;
proc reg;
model y=x2;
run;
proc reg;
model y=x1 x2 D noint;
run;
goptions reset=glo-al gunit=pct
c-acE=F"ite colors=A-lacE -lue green redG
"title=6 "text=3 /text=Hap/ -order;
sym-ol1 interpol=rl ci=-lue <alue=dot "eig"t=3 c<=red;
proc gplot data=a1;
title I#egressao linear multiplaI;
plot residJx1;
6!
plot residJx2;
plot residJy"at;
run;
uit;
data a2;
la-el y=<endas
x1=tam pop
x2=renda percapita;
do x1=50 to 450 -y 10;
do x2=2000 to 4100 -y 20;
y=3345261V03496Jx1V030092Jx2;
output;
end;
end;
run;
proc g3d data=a2;
plot x2Jx1=y;
run;
uit;
:igura !.!.2 JcontinuaoL.
9 figura !.!.! cont*m a sada resultante do programa >9> da figura !.!.2
0$e 123 4rocedure ) 5odel6 578291
5odel :rossproducts /./ /.; ;.;
<ariable 9abel =ntercept x1
=ntercept =ntercept 15 3626
x1 tam pop em 1000 3626 1067614
x2 renda percapita 44428 1141>181
y !endas em grosas 225> 647107
5odel :rossproducts /./ /.; ;.;
<ariable 9abel x2 y
=ntercept =ntercept 44428 225>
x1 tam pop em 1000 1141>181 647107
x2 renda percapita 13>063428 70>661>
y !endas em grosas 70>661> 3>4107
0$e 123 4rocedure ) 5odel6 578291
8ependent <ariable6 y !endas em grosas
/./ =n!erse? 4arameter 2stimates? and @@2
<ariable 9abel =ntercept x1
=ntercept =ntercept 1'2463484164 0'000212>664
x1 tam pop em 1000 0'000212>664 7'732>032)6
x2 renda percapita )0'000415671 )7'0302522)7
y !endas em grosas 3'45261278>> 0'4>6004>761
/./ =n!erse? 4arameter 2stimates? and @@2
<ariable 9abel x2 y
=ntercept =ntercept )0'000415671 3'45261278>>
6'
x1 tam pop em 1000 )7'0302522)7 0'4>6004>761
x2 renda percapita 1'>7718512)7 0'00>1>>080>
y !endas em grosas 0'00>1>>080> 56'88356555>
Analysis o# <ariance
@um o# 5ean
@ource 8B @%uares @%uare B <alue 4r C B
5odel 2 53845 26>22 567>'47 D'0001
2rror 12 56'88357 4'74030
:orrected 0otal 14 53>02
1oot 5@2 2'17722 1)@%uare 0'>>8>
8ependent 5ean 150'60000 AdE 1)@% 0'>>88
:oe## <ar 1'44570
:igura !.!.! Resultado da e.ecuo do programa >9> da figura !.!.2
4arameter 2stimates
4arameter @tandard
<ariable 9abel 8B 2stimate 2rror t <alue 4r C FtF
=ntercept =ntercept 1 3'45261 2'43065 1'42 0'180>
x1 tam pop em 1000 1 0'4>600 0'00605 81'>2 D'0001
x2 renda percapita 1 0'00>20 0'000>6811 >'50 D'0001
0$e 123 4rocedure ) 5odel6 578291
8ependent <ariable6 y !endas em grosas
4arameter 2stimates
<ariable 9abel 8B 0ype = @@ 0ype == @@
=ntercept =ntercept 1 340205 >'56437
x1 tam pop em 1000 1 53417 31815
x2 renda percapita 1 427'>>780 427'>>780
:o!ariance o# 2stimates
<ariable 9abel =ntercept x1 x2
=ntercept =ntercept 5'>080618212 0'00100>5241 )0'001>70405
x1 tam pop em 1000 0'00100>5241 0'0000366563 )3'3325482)6
x2 renda percapita )0'001>70405 )3'3325482)6 >'3724452)7
0$e 123 4rocedure ) 5odel6 578291
8ependent <ariable6 y !endas em grosas
7utput @tatistics
8ep <ar 4redicted @td 2rror @td 2rror @tudent
7bs y <alue 5ean 4redict 1esidual 1esidual 1esidual
1 162'0000 161'8>57 0'8425 0'1043 2'008 0'051>
2 120'0000 122'6673 0'80>> )2'6673 2'021 )1'320
3 223'0000 224'42>4 0'>3>3 )1'42>4 1'>64 )0'728
4 131'0000 131'2406 0'5>12 )0'2406 2'0>5 )0'115
5 67'0000 67'6>>3 0'>5>8 )0'6>>3 1'>54 )0'358
6 16>'0000 16>'684> 0'>160 )0'684> 1'>75 )0'347
7 81'0000 7>'731> 1'0581 1'2681 1'>03 0'666
8 1>2'0000 18>'6720 1'0716 2'3280 1'8>5 1'228
> 116'0000 11>'8320 0'8814 )3'8320 1'>>1 )1'>25
10 55'0000 53'2>05 1'125> 1'70>5 1'864 0'>17
11 252'0000 253'7151 1'1562 )1'7151 1'845 )0'>30
12 232'0000 228'6>08 1'2>53 3'30>2 1'750 1'8>1
13 144'0000 144'>7>3 0'6254 )0'>7>3 2'085 )0'470
14 103'0000 100'5331 0'8>52 2'466> 1'>85 1'243
15 212'0000 210'>381 1'15>1 1'061> 1'843 0'576
6$
0$e 123 4rocedure ) 5odel6 578291
0est =N021: 1esults #or 8ependent <ariable y
5ean
@ource 8B @%uare B <alue 4r C B
Numerator 1 >'56437 2'02 0'180>
8enominator 12 4'74030
:igura !.!.! J"ontinuaoL.
0$e 123 4rocedure ) 5odel6 578291
0est 2 1esults #or 8ependent <ariable y
5ean
@ource 8B @%uare B <alue 4r C B
Numerator 1 31815 6711'57 D'0001
8enominator 12 4'74030
0$e 123 4rocedure ) 5odel6 578291
0est 3 1esults #or 8ependent <ariable y
5ean
@ource 8B @%uare B <alue 4r C B
Numerator 1 427'>>780 >0'2> D'0001
8enominator 12 4'74030
0$e 123 4rocedure ) 5odel6 578291
0est 4 1esults #or 8ependent <ariable y
5ean
@ource 8B @%uare B <alue 4r C B
Numerator 2 26>22 567>'47 D'0001
8enominator 12 4'74030
0$e 123 4rocedure ) 5odel6 578291
8ependent <ariable6 y !endas em grosas
Analysis o# <ariance
@um o# 5ean
@ource 8B @%uares @%uare B <alue 4r C B
5odel 0 0 ' ' '
2rror 14 53>02 3850'1142>
:orrected 0otal 14 53>02
1oot 5@2 62'04>2> 1)@%uare 0'0000
8ependent 5ean 150'60000 AdE 1)@% 0'0000
:oe## <ar 41'2013>
4arameter 2stimates
4arameter @tandard
<ariable 9abel 8B 2stimate 2rror t <alue 4r C FtF
=ntercept =ntercept 1 150'60000 16'02106 >'40 D'0001
0$e 123 4rocedure ) 5odel6 578291
8ependent <ariable6 y !endas em grosas
:igura !.!.! J"ontinuaoL.
Analysis o# <ariance
6&
@um o# 5ean
@ource 8B @%uares @%uare B <alue 4r C B
5odel 1 53417 53417 1432'14 D'0001
2rror 13 484'88137 37'2>857
:orrected 0otal 14 53>02
1oot 5@2 6'10726 1)@%uare 0'>>10
8ependent 5ean 150'60000 AdE 1)@% 0'>>03
:oe## <ar 4'05528
4arameter 2stimates
4arameter @tandard
<ariable 9abel 8B 2stimate 2rror t <alue 4r C FtF
=ntercept =ntercept 1 22'7>220 3'72726 6'11 D'0001
x1 tam pop em 1000 1 0'52871 0'013>7 37'84 D'0001
0$e 123 4rocedure ) 5odel6 578291
8ependent <ariable6 y !endas em grosas
Analysis o# <ariance
@um o# 5ean
@ource 8B @%uares @%uare B <alue 4r C B
5odel 1 22030 22030 8'>> 0'0103
2rror 13 31872 2451'66>6>
:orrected 0otal 14 53>02
1oot 5@2 4>'51434 1)@%uare 0'4087
8ependent 5ean 150'60000 AdE 1)@% 0'3632
:oe## <ar 32'87805
4arameter 2stimates
4arameter @tandard
<ariable 9abel 8B 2stimate 2rror t <alue 4r C FtF
=ntercept =ntercept 1 )10'20751 55'14758 )0'1> 0'8560
x2 renda percapita 1 0'0542> 0'01811 3'00 0'0103
0$e 123 4rocedure ) 5odel6 578291
8ependent <ariable6 y !endas em grosas
N7026 No intercept in model' 1)@%uare is rede#ined'
Analysis o# <ariance
@um o# 5ean
@ource 8B @%uares @%uare B <alue 4r C B
5odel 2 3>4041 1>7020 38545'4 D'0001
2rror 13 66'447>3 5'11138
Gncorrected 0otal 15 3>4107
:igura !.!.! J"ontinuaoL.
1oot 5@2 2'26084 1)@%uare 0'>>>8
8ependent 5ean 150'60000 AdE 1)@% 0'>>>8
:oe## <ar 1'50122
4arameter 2stimates
4arameter @tandard
<ariable 9abel 8B 2stimate 2rror t <alue 4r C FtF
x1 tam pop em 1000 1 0'4>542 0'00627 78'>> D'0001
x2 renda percapita 1 0'01035 0'00054>56 18'83 D'0001
:igura !.!.! J"ontinuaoL.
66
60
:igura !.!.! J"ontinuaoL
:igura !.!.! J"ontinuaoL
61
:igura !.!.' Ilustrao do modelo a8ustado para o e.erccio !.!.1.
3.N 4(5li&e *e @ariC(3ia $ara o mo*elo *e re"re&&;o li(ear m)lti$la
"omo no caso do modelo de regresso linear simples aqui tam+*m a )ariao total da )ari)el
dependente V pode ser decomposta em duas partesI uma e.plicada pelo modelo de regresso a8ustado e
outra no e.plicada. 2ara o modelo de regresso linear m;ltipla com = )ari)eis independentesJ U1,
U2, ... U= L, a decomposio da )aria+ilidade total de V * geralmente apresentada conforme a Ta+ela
!.$.1. 9 )aria+ilidade e.plicada * associada a soma de quadrados de regresso com = graus de li+erdade.
9 )aria+ilidade de V no e.plicada * associada a soma de quadrado de resduo ou soma de quadrado de
erro com n 5 = graus de li+erdade. 9 )aria+ilidade total representada pela soma de quadrados total tem n
5 1 graus de li+erdade
Ta+ela !.$.1 ,squema da 97%49 para a regresso linear m;ltipla.
"ausas de <raus de >omas de Guadrados :
)ariao li+erdade quadrados m*dios
Regresso = >GReg GMReg JGMRegKGMResL
,rro JResduoL n C = 5 1 >GRes GMRes
Total n C 1 >GTotal
3.N.1 E&tima8;o *a @ariC(3ia *o& erro&
"omo no modelo de regresso linear simples, a estimao da )ari-ncia dos erros pode ser feita
atra)*s do enfoque da anlise de )ari-ncia, onde se )erifica a seguinte relao nas somas de quadradosI

>Gtotal Q >GReg X >GRes
por*m a e.presso dessas somas de quadrados so mais simples quando apresentadas nas seguintes
formas matriciaisI
>GRes Q eXe Q J R -
1
^
LXJ R 5
1
^
L Q JRX -
1
^
XL J R -
1
^
L Q RXR 5 RX
1
^
5
1
^
XR X
1
^
X
1
^
"onsiderando5se que
1
^
Q 7b, o+t*m5se, >GRes Q RXR 5 bX7XR Q RXJ+ 5 LR
7a e.presso da soma de quadrados de resduos acima tem5seI
RXR Q

n
i
i
1
1
2
Q >GTotal no corrigida
bX7XR Q >GRegresso no corrigida Q >GModelo Q >GRegresso X
2
..
1 n
IntroduEindo o fator de correo
>GM Q J1KnLRX11XR Q J1KnLRXZR Q
2
2
1
1
1 n 1
n
n
i
i

,
_

na e.presso >GRes Q RXR 5 bX7XR , o+t*m5se


>GRes Q ]RXR 5 J1KnLRXZR\ 5 ]bX7XR 5 J1KnLRXZR\
Q ]RX]+ 5 J1KnLZ\R 5 RX] 5 J1KnLZ\R , onde 1 * um )etor n . 1 com todos os elementos iguais a
1 de modo que 11X Q Z * uma matriE n . n com todos os elementos unitrios
03
]RX]+ 5 J1KnLZ\R Q

n
i
i
1 1
1
2
L J Q
n
1
1
n
i
i
n
i
i
2
1
1
2

,
_

Q >GTotal corrigida
RX] 5 J1KnLZ\R Q

n
i
i
1 1
1
2
L
^
J Q >GRegresso corrigida
]RX]+ 5 O\R Q

n
i
i i
1 1
1
2
L
^
J Q

n
i
i
e
1
2
Q >GResduo
2ode ser demostrado que o quadrado m*dio de resduo acima definido como
GMResduo Q
1 1
L
^
J
1
Re
1
2
1
2




; n
e
; n
1 1
; n
s%d&o :8
n
i
i
n
i
i i
* um estimador no tendencioso de
2
, ou se8a ,JGMResduoL Q
2
. Dm estimador do des)io padro *
a raiE quadrada positi)a do quadrado m*dio do resduo.
3.N.2 2 3oefi3ie(te *e *etermi(a8;o m)lti$lo e a bo(*a*e *o aIu&te
% coeficiente de determinao m;ltiplo R
2
Jou Ra
2
L mede a proporo da reduo na )ariao de
V quando se usa todas as )ari)eis independentes Ujs no modelo. 9ssim, o R
2
pode ser e.presso comoI
R
2
Q J>GRegK>GTotalL
7o caso de regresso m;ltipla * mais recomend)el o coeficiente de determinao a8ustado
dado porI
R
2
a Q R
2
C h=K]n5J=X1L\iJ15R
2
L ou

,
_

,
_


:8=oa(
sid&o :8
; n
n
G
a
Re
1
1
1
2
onde = * o n;mero de )ari)eis independentes no modelo.
9lguns te.tos definem o coeficiente de correlao m;ltiplo como a raiE quadrada positi)a de R
2
,
porem, no e.iste uma interpretao satisfat#ria para esta correlao.
3.N.3 'oefi3ie(te& *e *etermi(a8;o $ar3ial
Dm coeficiente de determinao parcial mede a contri+uio marginal de uma )ari)el
independente U8 quando todas as outras )ari)eis independentes esto no modelo.
9ntes de apresentar a e.presso dos coeficientes de determinao parcial, * importante
introduEir os conceitos de somas de quadrados seqHencial e parcial. 9 soma de quadrados seqHencial J>>
tipo I no >9>L representa a partio da soma de quadrado de regresso Jou soma de quadrado do modelo
no >9>L em somas de quadrados componentes correspondentes a adio de cada )ari)el no modelo
seqHencialmente. 7o caso de U1, U2,...U851, U8, U8X1,..., U= )ari)eis independentes por e.emplo, a soma
de quadrado seqHencial correspondente a U2 denotada por >GJU2bU1L, pode ser e.pressa comoI
>GJU2bU1L Q >GResiduoJU1L 5 >GResduoJU1,U2L, onde,
>GJU2bU1L l5se soma de quadrados de U2 dado U1,
>GResiduoJU1L * a soma de quadrados de resduo de um modelo com apenas a )ari)el independente U1
e >GResduoJU1,U2L * a soma de quadrados de resduo de um modelo com as )ari)eis independentes
independente U1 e U2. (e modo anlogo define5se
>GJU8bU1, U2,m,U851L Q >GResiduoJU1, U2,m,U851L 5 >GResduoJU1,U2 ...U851, U8 L
9 soma de quadrados parcial J>> tipo II no >9>L para uma dada )ari)el independente U8 * o
incremento as soma de quadrado de regresso J>GModelo no >9>L decorrente da adio de U8 ao
modelo que 8 contem todas as demais )ari)eis independentes, ou se8a
01
>GJU8bU1, U2,m,U851, U8X1,..., U=L Q >GResiduoJU1,U2,m,U851,U8X1,...,U=L 5
5 >GResduoJU1, U2,...U851, U8, U8X1,..., U=L
4ale ressaltar que, para U= J;ltima )ari)el adicionada ao modeloL as somas de quadrados
seqHencial e parcial so equi)alentes. 9 soma de quadrados seqHencial correspondente ao intercepto *
simplesmente
2
1 n
.
9dotando a notao RJU8bU1, U2,m,U851L Q >GJU8bU1, U2,m,U851L para as somas de quadrado
seqHencial e RJU8bU1, U2,m,U851L Q >GJU8bU1, U2,m,U851L para as somas de quadrados parcial, para um
caso de = Q ! )ari)eis independentes U1, U2, U! tem5seI
4ari)el >G >equencial >G 2arcial
U3
RJU3L Q
2
1 n
5
U1 RJU1bU3L RJU1bU3,U2,U!L
U2 RJU2bU1L RJU2bU3,U1,U!L
U! RJU!bU3,U1,U2L RJU!bU3,U1,U2L
U3 1 J"orrespondente ao par-metro 3L
2ara o caso de duas )ari)eis independentes U1 e U2, os coeficientes de determinao parcial
so definidos comoI
,ntre V e U1 dado U2
L J Re
L J Re L J Re
L J Re
L , J Re
1
2
2 1 2
2
2 1 2
2 . 1
2 sid&o :8
2 2 sid&o :8 2 sid&o :8
2 sid&o :8
2 2 sid&o :8
r
1

ou
L J Re
L b J Re
2
2 1 2
2 . 1
2 sid&o :8
2 2 !ress,o :8
r
1

,ntre V e U2 dado U1
L J Re
L J Re L J Re
L J Re
L , J Re
1
1
2 1 1
1
2 1 2
1 . 2
2 sid&o :8
2 2 sid&o :8 2 sid&o :8
2 sid&o :8
2 2 sid&o :8
r
1


ou
L J Re
L b J Re
1
1 2 2
1 . 2
2 sid&o :8
2 2 !ress,o :8
r
1

Dm coeficiente de determinao parcial 13 . 3


2
2 . 1

1
r por e.emplo, indica que cerca de 13Y
da )ariao remanescente em V ap#s o a8uste de um com U2, * e.plicada pela adio de U1 a este
modelo.
2ara o caso de U1, U2 e U! )ari)eis independentes tem5se
L , J Re
L , b J Re
! 2
! 2 1 2
2! . 1
2 2 sid&o :8
2 2 2 !ress,o :8
r
1

L , J Re
L , b J Re
! 1
! 1 2 2
1! . 2
2 2 sid&o :8
2 2 2 !ress,o :8
r
1

L , J Re
L , b J Re
2 1
2 1 ! 2
12 . !
2 2 sid&o :8
2 2 2 !ress,o :8
r
1

9 raiE quadrada do coeficiente de determinao parcial resulta no lcoeficiente de correlaol


parcial, ou se8a,
2
2 . 1 2 . 1 1 1
r r t , sendo o sinal positi)o se +1, o estimador de 1 for positi)o e
negati)o no caso ou +1 se8a negati)o
02
3.6 +(fer:(3ia &obre o mo*elo *e re"re&&;o
3.6.1 Te&te& *e #i$Ate&e& &obre o& $arCmetro&
9 estatstica : Q GMRegKGMRes da anlise de )ari-ncia * apropriada para o teste de /ip#teses
O3I
1
Q
2
Q ... Q

Q 3 )ersus OaI 8 3 para pelo menos um 8 Q 1, 2, ..., =


% crit*rio de teste * o seguinteI re8eita5se O3 em fa)or de O1,ao n)el de signific-ncia se, : :J=,n5=, L,
onde :J=,n5=, L * o percentil da distri+uio :5>nedecor, ta+ulada nos li)ros te.tos de ,statstica, ou
o+tida nos soft?are estatsticos.
9 matriE estimada de )ari-ncias e co)ari-ncias do )etor de estimati)as dos par-metros b * dada
por >
2
bQ JUjUL
51
GMResduo. >o+ condies de normalidade dos termos do erro do modelo
B
-
B B
:
-
distri+ui5se como t de >tudent com o n;mero de graus de li+erdade do resduo do quadro da 97%49.
9ssim testes de /ip#teses para par-metros indi)iduais do tipo O3I 8 Q 3 )ersus OaI 8 3 so feitos
utiliEando a estatstica
B
-
B
:
-

. Testes simult-neos para dois ou mais par-metros do modelo so feitos
atra)*s da estatstica : parcial, o+tida das somas de quadrados parciais.
3.6.2 - +(ter@alo& *e 3o(fia(8a $ara o& $arCmetro& e re&$o&ta mE*ia
Inter)alos indi)iduais a J1 5 L.133Y de confiana para 8 so o+tidos por
+8 t t
K2Pn5p>+8. Inter)alos simult-neos a J1 5 L.133Y de confiana para s e p par-metros so construdos
atra)*s do procedimento de Aonferroni, ou se8a construindo s inter)alos indi)iduais da formaI +8 t A>+8,
sendo A Q t
K2s Pn5p.
9 fronteira de uma regio simult-nea com J1 5 L.133Y de confiana para os p par-metros do
modelo * dada porI
Jb 5 LX7X7Jb 5 L Q pJGMResduoLJ:
PpPn5pL
,stimati)a da resposta m*dia correspondente a um )etor U/ Q ]1 U1/ U2/ ... U=/\ * o+tida por
h
1
^
K 7#b. T poss)el demonstrar que ,J
h
1
^
L Q 7# e a )ari-ncia de * 7#(7X7)
-1
7#X
2
Dma regio a J1 5 L.133Y de confiana simult-nea para a superfcie de regresso * uma
e.tenso direta do enfoque de @or=ing5Ootelling para construo de uma fai.a de confiana para a
lin/a de regresso linear simples. %s limites de confiana em cada ponto 7#b da regio so o+tidos porI
h
1
h
A: 1
^
^
t
< onde @
2
Q p:
PpPn5p
Guando se dese8a estimar a resposta m*dia em s pontos da superfcie de regresso, pode5se
utiliEar dois enfoquesI @or=ing5Ootelling e Aonferroni. % enfoque de @or=int5Ootelling utiliEado para
toda a superfcie de regresso * )lido para s pontos desta superfcie. 2ara o procedimento de Aonferroni
os limites de cada ponto so o+tidos por
h
1
h
B: 1
^
^
t
, sendo A Q t
K2s Pn5p.
3.6.3 !re@i&;o *e (o@a& ob&er@a89e&
Dm inter)alo de predio a J1 5 L.133Y de confiana para uma no)a o+ser)ao V/Jno)aL
correspondente a um )etor 7# de )alores especificados dos Ujs *
L J
^
P
2
^
nova h
1
+ n
h
: 1

onde
2
^
L J nova h
1
:
K J1 X 7#J7X7L
-1
7#XLGMResduo
Guando m no)as o+ser)aes so consideradas em um )etor 7#< sua m*dia ,J
L Jnova h
1 ) pode
ser predita com um inter)alo de predio a J1 5 L.133Y de confiana da forma L J
P
2
^
nova h
1
+ n
h
: 1

onde
2
L J nova h
1
:
K ]J1KmL X 7#J7X7L
-1
7#X\GMResduo.
0!
Inter)alos simult-neos de predio para s no)as o+ser)aes a s diferentes )etores 7# com uma
famlia de coeficientes de confiana J1 5 L.133Y so o+tidos por
L J
^
L J
^
nova h
1
h
: : 1 t
onde >
2
Q s:JPsPn5pL. 9lternati)amente pode5se utiliEar os inter)alos de pre)iso
simult-neos de Aonferroni com uma famlia de coeficientes de confiana J1 5 L.133Y dados por
L J
^
L J
^
nova h
1
h
: B 1 t
, sendo A Q t]KJ2sLPn5p\. >e U/ for esta+elecido Z priori, uma comparao a priori de >
com A numa dada aplicao indicar qual o procedimento que fornecer inter)alos de predio mais
precisos.
% programa >9> seguinte ilustra a o+teno de erros padres para construo de inter)alos de
confiana e predio, utiliEando os dados do e.erccio !.!.1
options ls=78 nocenter nodate;
data um;
input y x1 x2;
la-el y=<endas
x1=tampop
x2=renperc;
cards;
162 274 2450
120 180 3254
223 375 3802
131 205 2838
67 86 2347
169 265 3782
81 98 3008
192 330 2450
116 195 2137
55 53 2560
252 430 4020
232 372 4427
144 236 2660
103 157 2088
212 370 2605
run;
;
proc iml;
use um;
start regress;
read all <arQx1R into x1;
read all <arQx2R into x2;
read all <arQyR into y;
71=7A15@1G;
72=7A15G;
x=7188x188x2;
i3=iA3G;
xlx=xUJx;
xlxin<=in<AxlxG;
xi=Q 1@ 274@ 2450 R;
x"na=Q 1@ 220@ 2500 R;
x"n-=Q 1@ 375@ 3500 R;
dpyxi=srtAtAxiGJxlxin<JxiJ437403G;
dpya=srtAtAx"naGJxlxin<Jx"naJ437403G;
dpy-=srtAtAx"n-GJxlxin<Jx"n-J437403G;
dpyxin=srtAA1VtAxiGJxlxin<JxiGJ437403G;
dpyna=srtAA1VtAx"naGJxlxin<Jx"naGJ437403G;
dpyn-=srtAA1VtAx"n-GJxlxin<Jx"n-GJ437403G;
print@ S Pso do proc iml no exercicio 33331 S@xlx xlxin< dpyxi dpyxin
dpya dpy- dpyna dpyn-;
/inis" regress;
reset noprint;
run regress;
uit;
:igura !.&.1 2rograma >9> J7,T,2!$9L para construo de inter)alos de confiana e
predio par os dados do e.erccio !.!.1
Pso do proc iml no exercicio 33331
0'
N+N N+N9C,
5ol1 5ol2 5ol3 5ol4
#)T1 15 3626 44428 132463484
#)T2 3626 1067614 11419181 03000213
#)T3 44428 11419181 139063428 603000416
*&LN9 *&LN9C
5ol5 5ol6 5ol7 5ol8
#)T1 03000213 603000416 038425152 233345517
#)T2 737329$66 67303$67
#)T3 67303$67 139772$67
*&L. *&LO *&LC. *&LCO
036829088 038720441 232818116 233453701
:igura !.&.2 Resultado da e.ecuo do programa >9> da figura !.&.1
Exer3>3io 3.6.1 - a$li3a8;o &obre te&te& *e #i$Ate&e&
%s dados apresentados no programa >9> J:igura !.&.!L seguinte referem5se Z
produo de +iomassa JVL de uma dada esp*cie )egetal e cinco )ari)eis de solo onde a
esp*cie foi culti)ada sendo U1 a salinidade do solo, U2 o pO, U! o teor de potssio, U'
o teor de s#dio e U$ o teor de Einco JRa?lings, 1100L. % o+8eti)o de le)antamento dos
dados foi descre)er e pre)er a produo de +iomassa da plantas em funo das )ari)eis
preditoras.
options ls=78 nocenter nodate;
data a;
input y x1 x2 x3 x4 x5;
yl=y6A5Jx2D3G;
x3l=A2Jx2D3GVx3;
la-el x1=sal
x2=pM
x3=&ot
x4=0od
x5=Win
y=Oiom;
cards;
676 33 530 1441367 3518435 1634524
516 35 4375 1299319 2817034 1339852
1052 32 432 1154327 2645530 1533276
868 30 434 1045315 2507239 1733128
1008 33 5355 520361 3166432 2233312
436 33 5305 1273302 2549137 1232778
544 36 4325 1346335 2087733 1738225
680 30 4345 1253388 2562133 1433516
640 38 4375 1242365 2758733 1336826
492 30 436 1282395 2651137 1137566
984 30 431 553369 788635 93882
:igura !.&.! 2rograma >9> JAI%M9>>9.>9>L para e.erccio de aplicao so+re testes
de /ip#teses.
1400 37 3345 494374 14596 1636752
1276 33 3345 526397 982638 123373
0$
1736 36 431 571314 1197834 934058
1004 30 335 408364 1036836 1439802
396 30 3325 646365 1730734 3132865
352 27 3335 514303 12822 3031352
328 29 332 350373 858236 2835901
392 34 3335 496329 1237935 1938795
236 36 333 580392 1473139 1835056
392 30 3325 535382 1506036 2231344
268 28 3325 490334 1105633 2836101
252 31 332 552339 811839 2331908
236 31 332 661332 1300935 2436917
340 35 3335 672315 1500337 2236758
2436 29 731 525365 10225 033729
2216 35 7335 563313 802432 032703
2096 35 7345 497396 10393 033205
1660 30 7345 458338 871136 032648
2272 30 734 498325 1023936 032105
824 26 4385 936326 20436 1839875
1196 29 436 894379 1251939 2039687
1960 25 532 941336 18979 2339841
2080 26 4375 1038379 2298631 1939727
1764 26 532 898305 1170435 2133864
412 25 4355 989387 17721 2337063
416 26 3395 951328 1648532 3035589
504 26 337 939383 1710133 2638415
492 27 3375 925342 17849 2737292
636 27 4315 954311 1694936 2135699
1756 24 536 720372 1134436 1936531
1232 27 5335 782309 1475234 2033295
1400 26 535 77333 1364938 193588
1620 28 535 829326 14533 2031328
1560 28 534 856396 1689232 193242
;
run;
proc reg;
model y=x1 x2 x3 x4 x5 D ss1 ss2;
test x4=0;test x4=0@ x5=0;
test 3Jx262Jx3=5;
run;
proc reg;
model y=x1 x2 x3;
run;
proc reg;
model yl=x1 x3l x4 x5;
run;uit;
:igura !.&.! J"ontinuaoL
7a figura !.&.' * apresentado o resultado da e.ecuo do programa >9> da
figura !.&.!.
!"e #$% &rocedure
0&
'odel( ')*$+1
*ependent ,aria-le( y Oiom
.nalysis o/ ,ariance
0um o/ 'ean
0ource *1 0uares 0uare 1 ,alue &r 2
1
'odel 5 12984417 2596883 16337
430001
$rror 39 6186546 158629
5orrected !otal 44 19170963
#oot '0$ 398328305 #60uare 036773
*ependent 'ean 1000380000 .d7 #60 036359
5oe// ,ar 39379647
&arameter $stimates
&arameter 0tandard
,aria-le +a-el *1 $stimate $rror t ,alue &r 2 8t8
9ntcpt 9ntcpt 1 1252332252 1235347089 1301 033170
x1 sal 1 630327890 24303830 61326 032153
x2 pM 1 305348218 87393242 3347 030013
x3 &ot 1 60328509 0334815 60382 034178
x4 0od 1 60300868 0301592 60354 035890
x5 Win 1 620367564 15306563 61337 031778
&arameter $stimates
,aria-le +a-el *1 !ype 9 00 !ype 99 00
9ntercept 9ntercept 1 45072029 162986
x1 sal 1 204048 251684
x2 pM 1 11363668 1914509
x3 &ot 1 935104 106375
x4 0od 1 182834 47091
x5 Win 1 298763 298763
!"e #$% &rocedure
'odel( ')*$+1
!est 1 #esults /or *ependent ,aria-le y
'ean
0ource *1 0uare 1 ,alue &r 2 1
Cumerator 1 47091 0330 035890
*enominator 39 158629
!"e #$% &rocedure
'odel( ')*$+1
7a figura !.&.' Resultado da e.ecuo do programa >9> da figura !.&.!.
06
!est 2 #esults /or *ependent ,aria-le y
'ean
0ource *1 0uare 1 ,alue &r 2 1
Cumerator 2 240798 1352 032318
*enominator 39 158629
!"e #$% &rocedure
'odel( ')*$+1
!est 3 #esults /or *ependent ,aria-le y
'ean
0ource *1 0uare 1 ,alue &r 2 1
Cumerator 1 1897250 11396 030013
*enominator 39 158629
!"e #$% &rocedure
'odel( ')*$+1
*ependent ,aria-le( y Oiom
.nalysis o/ ,ariance
0um o/ 'ean
0ource *1 0uares 0uare 1 ,alue &r 2
1
'odel 3 12502820 4167607 25363
430001
$rror 41 6668143 162638
5orrected !otal 44 19170963
#oot '0$ 403328356 #60uare 036522
*ependent 'ean 1000380000 .d7 #60 036267
5oe// ,ar 40329612
&arameter $stimates
&arameter 0tandard
,aria-le +a-el *1 $stimate $rror t ,alue &r 2 8t8
9ntercept 9ntercept 1 6131315775 582354064 60323 038230
x1 sal 1 612305539 16336929 60374 034656
x2 pM 1 410313754 48382699 8340 430001
x3 &ot 1 60348987 0320430 62340 030211
!"e #$% &rocedure
'odel( ')*$+1
*ependent ,aria-le( yl
.nalysis o/ ,ariance
0um o/ 'ean
0ource *1 0uares 0uare 1 ,alue &r 2
1
'odel 4 10993895 2748474 13360
430001
$rror 40 8083796 202095
5orrected !otal 44 19077691
00
7a figura !.&.' J"ontinuaoL.
#oot '0$ 449354967 #60uare 035763
*ependent 'ean 993312963 .d7 #60 035339
5oe// ,ar 45326596
&arameter $stimates
&arameter 0tandard
,aria-le +a-el *1 $stimate $rror t ,alue &r 2 8t8
9ntercept 9ntercept 1 4842332355 756316726 6340 430001
x1 sal 1 680350504 21362077 63372 030006
x3l 1 60342839 0339017 61310 032788
x4 0od 1 0300468 0301744 0327 037898
x5 Win 1 664318002 9335748 66386 430001
7a figura !.&.' J"ontinuaoL.
4. /ia"(A&ti3o &obre o mo*elo *e re"re&&;o
4.1 +*e(tifi3a8;o *e ob&er@a89e& i(flue(te&
9s estatsticas usadas para medir a influncia de cada o+ser)ao so+re as estimati)as foram
propostas por Aelsle`, Bu/ e @els/ J1103L. %+ser)aes influentes so aquelas que, de acordo com
)rios crit*rios aparecem e.ercendo forte impacto no modelo a8ustado. 9s principais estatsticas
sugeridas pelos referidos autores para a identificao de o+ser)aes influentes so as seguintesI
4.1.1 Fe@are"e (#ii)
,sta estatstica e definida como o i5*simo elemento da diagonal da matriE Q 7(7X7)
-1
7X, ou
se8a, /ii Q xi(7X7)
-1
xiX< sendo xi a i5*sima lin/a J)etor lin/aL da matriE 7< ou se8a, xi Q]1 U1i U2i ... U=i\. %s
/iijs podem tam+*m ser e.pressos comoI
2
1
2
2
1
1 1
L J
L J 1

,
_

2
i
n
i
i
i
ii
:
2 2
n n
2 2
2 2
n
h
sendo
1
L J
1
2

n
2 2
:
n
i
i
2
%s /iijs so sempre positi)os e medem da dist-ncia JpadroniEada e quadradaL dos Uijs ao seu centro
Jm*dia aritm*tica dos Uijs no caso da regresso linear simplesL. Aelsle`, Bu/ e @els/ sugerem que
o+ser)aes com /ii c 2pKn de)em ser e.aminadas com cuidado, sendo p o n;mero de par-metros no
modelo e n o n;mero de o+ser)aes.
4.1.2 -e&>*uo& e&tu*e(tiMa*o& (ri
Y
)
%s resduos estudentiEados medem a distancia entre os )alores o+ser)ados e os estimados pelo
modelo e podem ser definidos comoI
ii i
i
i
h :
e
r

1 J
L J
d
, onde >
2
JiL * um estimador da )ari-ncia dos termos do erro do modelo e.cluindo5se
a i5*sima o+ser)ao. %s resduos estudentiEados so diferentes dos resduos padroniEados, ri definidos
neste te.to como
01
ii
i
i
h :
e
r

1 J
, onde >
2
* um estimador da )ari-ncia dos termos do erro Jgeralmente o quadrado
m*dio do resduo do quadro da anlise de )ari-ncia.
Merecem ateno, as o+ser)aes com ri
d
c 2. Ao?erman J1113, pg '&6L ressalta que ri
d
c t
, n5p
indicam que Vi pode ser um )alor discrepante JoutlierL
4.1.3 /i&tC(3ia& *e 'ooS (/i)
,stas estatsticas so definidas comoI
(i Q ](b(i) 5 bLj(7X7)Jb(i) 5 bL\KJp>
2
L ou ainda

,
_

ii
ii i
i
h
h
+
r
D
1
, onde b(i) * um estimador do )etor de
par-metros e.cluindo5se a i5*sima o+ser)ao. %s (ijs so sempre positi)os e medem o impacto da
retirada da i5*sima o+ser)ao so+re as estimati)as dos par-metros. "oo= e @eis+ergJ1102L sugerem
que se8a e.aminadas com cuidado, as o+ser)aes com (i c 1.
4.1.4 /ifere(8a& (o& @alore& aIu&ta*o& (/FF+Ti)
,stas estatsticas podem ser e.pressas comoI
2
1
L J
L J
2
1
d
L J
L J
1
L 1 J
L
^ ^
J
1
L
^ ^
J

,
_

,
_

ii
ii
ii i
i i
ii
ii
i
ii i
i i
i
h
h
h :
1 1
h
h
r
h :
1 1
D@@H=
%s (::ITijs medem o impacto da i5*sima o+ser)ao na estimati)a de ,JViL. 4alores a+solutos
dos (::ITijs maiores que n + K 2 indicam o+ser)aes influentes.
4.1.N /ifere(8a& (a& e&timati@a& *o& X& ('oefi3ie(te& *e &e(&iti@i*a*e-/FQET4BI)
,stas estatsticas medem o impacto da i5*sima o+ser)ao na estimati)a do 85*simo par-metro
do modelo e so e.pressas comoI
BB i
i B B
i B
C :
- -
D@BE=A
J
L J
L J
L J
L J

, onde "88 * o J88L5*simo elemento da diagonal da matriE (7X7)


-1
4alores de (:A,T98js maiores do que n K 2 sugerem o+ser)aes influentes.
4.1.6 E&tat>&ti3a& '2D-4T+2 (Be(&iti@i*a*e *a matriM *e 3o@ariC(3ia&-'2D-4T+2i)
9 estatstica "%4R9TI% mede o efeito da retirada da i5*sima o+ser)ao no determinante da
matriE de co)ari-ncia das estimati)as e * e.pressa comoI
\ L j J det]
\ L j J det]
1 2
1
L J L J
2
L J

2 2 :
2 2 :
COEGA=HO
i i i
i
9 estatstica "%4R9TI% reflete o impacto da i5*sima o+ser)ao na preciso das estimati)as dos
par-metros. 4alores pr#.imos de 1 indicam pouco impacto da i5*sima o+ser)ao na preciso das
estimati)as dos par-metros enquanto que )alores maiores do que 1 indicam que a presena da
o+ser)ao aumenta a preciso das estimati)as. 4alores menores do que 1 indicam que a presena da
o+ser)ao diminui a preciso das estimati)as dos par-metros. Aelsle`, Bu/ e @els/ J1103L sugerem
que o+ser)aes com b"%4R9TI% 5 1b c !pKn podem ser )alores influentes na preciso das estimati)as
dos par-metros.
4.2 4@alia8;o *o efeito *e multi3oli(eari*a*e (o mo*elo *e re"re&&;o li(ear m)lti$la
T importante ressaltar que o termo multicolinearidade * redundante. % mais apropriado seria
colinearidade ou mau condicionamento das matriEes 7 e 7W7
13
4.2.1 Gr5fi3o& *e re&>*uo& $ar3iai&
,stes grficos so encontrados na literatura com o nome de lgrficos de le)arage de regresso
parciall e tam+*m lle)erage partial plotsl.
>upon/a que se8a de interesse relacionar a )ari)el dependente V com as )ari)eis
independentes U1, U2, ... U851, U8, U8X1, ... U=51, U= e se8am +3, +1, +2, ... +851, +8X1, ..., += as estimati)as
pontuais de mnimos quadrados dos par-metros do modelo
V Q 3 X 1U1 X 2U2 X ...X 851U851 X 8X1U8X1X ... X=51U=51X =U= X
e se8am +j3, +j1, +j2, ... +j851, +j8X1, ..., +j= as estimati)as pontuais de mnimos quadrados dos par-metros do
modelo
U8 Q j3 X j1U1 X j2U2 X ...X j851U851 X j8X1U8X1X ... Xj=51U=51X j=U= X j
% grfico de le)arage parcial de resduos JregressoL de
eJ8L Q V 5 J+3 X +1U1 X +2U2 X ...X +851U851 X +8X1U8X1X ... X+=X1U=51X +=U=L
)ersus
ejJ8L Q U8 5 J+j3 X +j1U1 X +j2U2 X ...X +j851U851 X +j8X1U8X1X ... X+j=X1U=51X +j=U=L
representa um grfico de V )ersus U8 com os efeitos das outras )ari)eis independnetes U1, U2, ... U851,
U8X1, ... U=51, U= remo)idos. Guando e.iste forte multicolinearidade entre U8 e as outras )ari)eis
independentes o grfico de V )ersus U8 pode re)elar uma JaparenteL significante relao entre V e U8
enquanto que o grfico de resduos 5 le)erage parcial de eJ8L )ersus ejJ8L re)ela pouca ou nen/uma relao
entre eJ8L e ejJ8L. Isto * uma ilustrao grfica do efeito de multicolinearidade e diE5se que e.iste pouca ou
nen/uma relao entre V e U8 quando os efeitos das outras )ari)eis independentes so remo)idos. ,m
outras pala)ras, quando o grfico de resduos 5 le)erage parcial de eJ8L )ersus ejJ8L re)ela pouca ou
nen/uma relao entre eJ8L e ejJ8L, diE5se que U8 tem pouca ou nen/uma import-ncia para e.plicar V
quando o efeito com+inado das outras )ari)eis independentes 8 foi considerado.
:inalmente, * importante ressaltar que a estimati)a pontual de mnimos quadrados do
par-metro l8 no modelo de regresso linear simples
eJ8L Q l3 X l8ejJ8L X l
* igual a estimati)a pontual de mnimos quadrados do par-metro lj8 no modelo
V Q lj3 X lj1U1 X lj2U2 X ...X lj851U851 X lj8U8 X lj8X1U8X1X ... Xlj=X1U=51X lj=U= X lj
4.2.2 Fatore& i(flatore& *e @ariC(3ia
>o estatsticas usadas para medir a se)eridade da multicolinearidade entre as )ari)eis
independentes. %s fatores inflatores de )ari-ncia J4I: )ariance inflator factorL pode ser e.presso como
2
1
1
B
B
G
EH@

, onde R8
2
* o+tido do modelo
U8 Q j3 X j1U1 X j2U2 X ...X j851U851 X j8X1U8X1X ... Xj=X1U=51X j=U= X j
>e o maior 4I: * maior que 13 Jo que significa que R8
2
c 3.1L ou se a m*dia aritm*tica dos
4I:8js dada por
+
EH@
@ H E
+
B
B

1
, sendo p, o n;mero de par-metros, * su+stancialmente maior que a unidade, a
multicolinearidade pode estar influenciando se)eramente as estimati)as de mnimos quadrados dos
par-metros. Mais precisamente, a multicolinearidade estar aumentando a )ari-ncias das estimati)as dos
par-metros. Isto pode ser )isto claramente considerando5se que estas )ari-ncias podem se e.pressas
comoI
11
B
n
i
B iB
B
n
i
B iB
n
i
B B iB
-
EH@
2 2
G
2 2 G 2 2
B

,
_

1
2
2
2
1
2
2
1
2 2
2
2
L J
L 1 J
1
L J L 1 J L J

Exer3>3io 4.2.1 - ob&er@a89e& i(flue(te& e "r5fi3o& *e re&>*uo& $ar3iai&


options ls=78 ps=50 nocenter nodate;
data a;
input y x1 x2 x3 x4 x5;
label x1=sal
x2=pH
x3=4ot
x4=@od
x5=Iin
y=Jiom;
cards;
676 33 5 1441'67 35184'5 16'4524
516 35 4'75 12>>'1> 28170'4 13'>852
'''''''''''''''''''''''''''''''''''''''''''''''''''''''
1232 27 5'35 782'0> 14752'4 20'32>5
1400 26 5'5 773'3 1364>'8 1>'588
1620 28 5'5 82>'26 14533 20'1328
1560 28 5'4 856'>6 168>2'2 1>'242
;
proc reg;
model y=x1 x2 x3 x4 x5 p r in#luence partial;
run;
0$e 123 4rocedure
5odel6 578291
8ependent <ariable6 y Jiom
Analysis o# <ariance
@um o# 5ean
@ource 8B @%uares @%uare B <alue 4r C B
5odel 5 12>84417 25>6883 16'37 D'0001
2rror 3> 6186546 15862>
:orrected 0otal 44 1>170>63
1oot 5@2 3>8'28305 1)@%uare 0'6773
8ependent 5ean 1000'80000 AdE 1)@% 0'635>
:oe## <ar 3>'7>647
4arameter 2stimates
4arameter @tandard
<ariable 9abel 8B 2stimate 2rror t <alue 4r C FtF
=ntercept =ntercept 1 1252'32252 1235'4708> 1'01 0'3170
x1 sal 1 )30'278>0 24'03830 )1'26 0'2153
x2 pH 1 305'48218 87'>3242 3'47 0'0013
x3 4ot 1 )0'2850> 0'34815 )0'82 0'4178
x4 @od 1 )0'00868 0'015>2 )0'54 0'58>0
x5 Iin 1 )20'67564 15'06563 )1'37 0'1778
0$e 123 4rocedure ) 5odel6 578291 ) 8ependent <ariable6 y Jiom
7utput @tatistics
8ep <ar 4redicted @td 2rror @td 2rror @tudent
7bs y <alue 5ean 4redict 1esidual 1esidual 1esidual
1 676'0000 724'07>1 175'6>38 )48'07>1 357'4 )0'135
2 516'0000 73>'638> 142'0550 )223'638> 372'1 )0'601
3 1052 6>0'>04> 126'8105 361'0>51 377'6 0'>56
4 868'0000 814'6150 113'7064 53'3850 381'7 0'140
5 1008 1064 321'33>6 )55'67>3 235'3 )0'237
6 436'0000 >57'8453 125'>88> )521'8453 377'8 )1'381
12
7 544'0000 527'112> 213'882> 16'8871 336'0 0'0503
8 680'0000 826'8478 140'6677 )146'8478 372'6 )0'3>4
> 640'0000 676'2371 174'1415 )36'2371 358'2 )0'101
10 4>2'0000 >10'3103 165'3106 )418'3103 362'4 )1'154
11 >84'0000 1166 166'6583 )181'8352 361'7 )0'503
12 1400 573'457> 146'5552 826'5421 370'3 2'232
13 1276 815'7151 153'3274 460'284> 367'6 1'252
14 1736 >53'52>8 137'4537 782'4702 373'8 2'0>3
15 1004 8>6'>548 165'170> 107'0452 362'4 0'2>5
16 3>6'0000 355'381> 134'7748 40'6181 374'8 0'108
17 352'0000 577'2>70 126'>7>1 )225'2>70 377'5 )0'5>7
18 328'0000 586'2014 138'5354 )258'2014 373'4 )0'6>1
1> 3>2'0000 586'2848 117'87>7 )1>4'2848 380'4 )0'511
20 236'0000 4>4'3212 131'06>4 )258'3212 376'1 )0'687
21 3>2'0000 5>5'6>86 122'33>4 )203'6>86 37>'0 )0'537
22 268'0000 570'0761 11>'6313 )302'0761 37>'> )0'7>5
23 252'0000 583'8086 124'3142 )331'8086 378'4 )0'877
24 236'0000 47>'2885 >>'7840 )243'2885 385'6 )0'631
25 340'0000 425'2852 130'>326 )85'2852 376'1 )0'227
26 2436 22>7 16>'8383 13>'1282 360'3 0'386
27 2216 2202 1>6'3264 13'>001 346'5 0'0401
28 20>6 2230 187'47>1 )133'6372 351'4 )0'380
2> 1660 2408 170'8715 )748'055> 35>'8 )2'07>

30 2272 236> 167'>745 )>7'2802 361'1 )0'26>
31 824'0000 1110 114'7731 )285'8476 381'4 )0'74>
32 11>6 >82'1836 117'5775 213'8164 380'5 0'562
33 1>60 1155 120'2263 805'0752 37>'7 2'120
34 2080 1008 124'3607 1072 378'4 2'834
35 1764 1254 136'2618 510'1813 374'2 1'363
36 412'0000 >5>'1>00 110'8824 )547'1>00 382'5 )1'430
37 416'0000 625'663> 132'754> )20>'663> 375'5 )0'558
38 504'0000 624'071> 107'1255 )120'071> 383'6 )0'313
3> 4>2'0000 588'3342 >>'4644 )>6'3342 385'7 )0'250
40 636'0000 837'4>87 >5'06>> )201'4>87 386'8 )0'521
41 1756 1526 12>'3640 22>'>150 376'7 0'610
42 1232 12>8 >7'3742 )65'82>1 386'2 )0'170
43 1400 1401 105'6776 )1'333> 384'0 )0'0035
44 1620 1306 113'0600 314'104> 381'> 0'822
45 1560 1265 >0'25>8 2>4'6017 387'> 0'75>
0$e 123 4rocedure ) 5odel6 578291 ) 8ependent <ariable6 y Jiom
7utput @tatistics
:oo,.s Hat 8iag :o!
7bs )2)1 0 1 2 8 1@tudent H 1atio 8BB=0@
1 F F F 0'001 )0'1328 0'1>46 1'4470 )0'0653
2 F +F F 0'00> )0'5>60 0'1272 1'2663 )0'2276
3 F F+ F 0'017 0'>553 0'1014 1'127> 0'320>
4 F F F 0'000 0'1381 0'0815 1'2685 0'0411
5 F F F 0'017 )0'2337 0'650> 3'31>3 )0'31>2
6 F ++F F 0'035 )1'3>80 0'1001 0'>612 )0'4662
7 F F F 0'000 0'04>6 0'2884 1'6416 0'0316
8 F F F 0'004 )0'38>8 0'1247 1'3036 )0'1472
> F F F 0'000 )0'0>>> 0'1>12 1'4426 )0'0486
10 F ++F F 0'046 )1'15>5 0'1723 1'1460 )0'52>0
11 F +F F 0'00> )0'4>78 0'1751 1'3625 )0'22>3
12 F F++++ F 0'130 2'3588 0'1354 0'5>54 0'>335
13 F F++ F 0'045 1'2616 0'1482 1'0726 0'5263
14 F F++++ F 0'0>> 2'1>31 0'11>1 0'64>0 0'8064
15 F F F 0'003 0'2>1> 0'1720 1'3>26 0'1330
16 F F F 0'000 0'1070 0'1145 1'3174 0'0385
17 F +F F 0'007 )0'5>18 0'1016 1'2312 )0'1>>1
18 F +F F 0'011 )0'6868 0'1210 1'2347 )0'2548
1> F +F F 0'004 )0'5058 0'0876 1'2303 )0'1567
20 F +F F 0'010 )0'6821 0'1083 1'2183 )0'2377
21 F +F F 0'005 )0'5325 0'0>44 1'2341 )0'171>
22 F +F F 0'010 )0'7>13 0'0>02 1'1645 )0'24>2
23 F +F F 0'014 )0'8743 0'0>74 1'14>0 )0'2872
1!
24 F +F F 0'004 )0'6260 0'0628 1'1725 )0'1620
25 F F F 0'001 )0'2240 0'1081 1'2>>> )0'0780
26 F F F 0'006 0'381> 0'1818 1'3>5> 0'1801
27 F F F 0'000 0'03>6 0'2430 1'5434 0'0224
28 F F F 0'007 )0'3761 0'2216 1'4682 )0'2007
2> F ++++F F 0'163 )2'1766 0'1841 0'7077 )1'0338
30 F F F 0'003 )0'2661 0'177> 1'4057 )0'1238
31 F +F F 0'008 )0'7452 0'0830 1'1682 )0'2243
32 F F+ F 0'005 0'556> 0'0871 1'21>3 0'1721
33 F F++++ F 0'075 2'2251 0'0>11 0'6167 0'7045
34 F F+++++ F 0'145 3'13>8 0'0>75 0'3245 1'0320
35 F F++ F 0'041 1'378> 0'1170 0'>875 0'5020
36 F ++F F 0'02> )1'4505 0'0775 0'>168 )0'4205
37 F +F F 0'006 )0'5534 0'1111 1'252> )0'1>56
38 F F F 0'001 )0'30>4 0'0723 1'240> )0'0864
3> F F F 0'001 )0'2468 0'0624 1'2345 )0'0636
40 F +F F 0'003 )0'5161 0'0570 1'1884 )0'1268
41 F F+ F 0'007 0'6054 0'1055 1'2334 0'207>
42 F F F 0'000 )0'1683 0'05>8 1'2374 )0'0424
43 F F F 0'000 )0'00342> 0'0704 1'2572 )0'000>
44 F F+ F 0'010 0'81>0 0'0806 1'1444 0'2425
45 F F+ F 0'005 0'7552 0'0514 1'1266 0'1757
0$e 123 4rocedure ) 5odel6 578291 ) 8ependent <ariable6 y Jiom
7utput @tatistics
)))))))))))))))))))))))))))))8BJ20A@))))))))))))))))))))))))))))
7bs =ntercept x1 x2 x3 x4 x5
1 0'00>8 )0'0044 )0'0043 )0'0017 )0'0314 0'0011
2 0'0737 )0'0856 )0'0144 )0'0807 )0'0165 )0'0066
3 0'1228 )0'0>3> )0'1658 )0'004> 0'151> )0'1714
4 0'01>> )0'0200 )0'0185 )0'0105 0'0272 )0'0207
5 0'0657 )0'0305 )0'1080 0'2461 )0'2448 )0'0832
6 0'0540 )0'06>2 0'0216 )0'2201 0'0071 0'0780
7 )0'01>3 0'0217 0'0086 0'0257 )0'0204 0'0125
8 )0'0746 0'06>1 0'0810 )0'0300 )0'040> 0'0>12
> 0'02>4 )0'0336 )0'0136 )0'0165 0'0035 )0'0140
10 )0'30>> 0'2845 0'3172 )0'0687 )0'1762 0'3780
11 )0'1737 0'1165 0'1720 0'0040 0'0214 0'1804
12 )0'150> 0'4418 )0'1501 )0'2>34 0'0>20 0'01>8
13 0'3074 )0'1258 )0'3>78 )0'0515 )0'0241 )0'350>
14 0'1337 0'1648 )0'3461 )0'0411 )0'08>5 )0'3318
15 0'1076 )0'0761 )0'1042 )0'0621 0'0417 )0'0>78
16 )0'013> 0'0127 0'0105 )0'0113 0'004> 0'0241
17 )0'0204 0'027> 0'0010 0'0816 )0'0285 )0'0601
18 0'0133 )0'0324 )0'00>> 0'083> 0'023> )0'0>25
1> 0'0081 )0'0555 0'0358 0'040> 0'0057 )0'0064
20 0'0424 )0'1182 0'0456 0'038> 0'0062 )0'0137
21 )0'1004 0'0700 0'1044 0'1060 )0'0835 0'0686
22 )0'021> 0'0120 0'0171 0'0743 0'0078 )0'06>0
23 0'0102 )0'074> 0'0534 )0'0686 0'1628 )0'0441
24 0'0111 )0'0428 0'0303 )0'0144 0'0503 )0'0366
25 0'040> )0'0573 )0'011> )0'0071 0'021> )0'0367
26 0'0740 )0'0744 )0'0061 )0'0482 0'0255 )0'0>08
27 )0'0111 0'0120 0'0128 0'0048 )0'0101 0'0055
28 0'08>7 )0'0>42 )0'1175 0'0104 0'0376 )0'041>
2> )0'1302 0'153> )0'24>8 0'2334 )0'00>4 0'2465
30 )0'0227 0'0258 )0'0235 0'0332 )0'0118 0'0375
31 )0'1405 0'1743 0'06>0 0'0521 )0'1082 0'0>68
32 )0'0660 0'0600 0'05>0 0'125> )0'138> 0'077>
33 )0'0442 )0'1786 0'2>11 0'0276 0'0475 0'24>4
34 0'583> )0'7521 )0'30>7 )0'1833 0'5327 )0'4064
35 )0'1255 0'0414 0'2138 0'3070 )0'3414 0'20>7
36 )0'11>0 0'2056 0'0153 )0'1141 0'0387 )0'0025
37 0'05>7 )0'0233 )0'06>5 )0'0784 0'075> )0'11>4
38 )0'0260 0'0345 0'01>7 )0'0225 0'0114 )0'0021
1'
3> )0'0005 0'0085 )0'0013 )0'0152 0'00>0 )0'0203
40 )0'05>3 0'0651 0'0474 )0'0424 0'0183 0'0332
41 0'0332 )0'0812 0'0582 0'0175 )0'043> 0'025>
42 0'00>7 0'0006 )0'0243 )0'0042 0'0086 )0'01>6
43 0'0001 0'0002 )0'0004 )0'0001 0'0002 )0'0003
44 )0'1272 0'0751 0'17>7 0'07>7 )0'1052 0'15>6
45 )0'0563 0'0133 0'1085 0'0248 )0'0246 0'0833
@um o# 1esiduals 0
@um o# @%uared 1esiduals 6186546
4redicted 1esidual @@ &412@@* 7>55513
1$
0$e 123 4rocedure
5odel6 578291
4artial1egression 1esidual 4lot
KLMMMMMMMMMMLMMMMMMMMMMLMMMMMMMMMMLMMMMMMMMMMLMMMMMMMMMMLMMMMMMMMMMLMN
y O O
1500 L L
O O
O O
O O
O O
O 1 O
O O
1000 L L
O O
O O
O 1 1 1 O
O O
O O
O 1 O
500 L 1 L
J O 1 O
i O O
o O 1 1 1 O
m O 1 1 O
O 1 1 O
O O
0 L 1 1 L
O 1 11 1 11 1 1 O
O 1 1 2 1 1 O
O 1 1 1 1 O
O 11 1 2 1 1 O
O 1 O
O O
)500 L 1 L
O 1 O
O O
O 1 O
O O
O O
O O
)1000 L L
PLMMMMMMMMMMLMMMMMMMMMMLMMMMMMMMMMLMMMMMMMMMMLMMMMMMMMMMLMMMMMMMMMMLMQ
)0'15 )0'10 )0'05 0'00 0'05 0'10 0'15
=ntercept
1&
0$e 123 4rocedure
5odel6 578291
4artial1egression 1esidual 4lot
KLMMMMMLMMMMMLMMMMMLMMMMMLMMMMMLMMMMMLMMMMMLMMMMMLMMMMMLMMMMMLMMMMMLMN
y O O
1500 L L
O O
O O
O O
O 1 O
O O
O O
1000 L L
O O
O 1 O
O O
O 1 1 O
O O
O O
500 L 1 1 L
J O 1 O
i O O
o O 1 1 1 O
m O1 1 O
O 1 1 O
O O
0 L 1 1 L
O 1 1 1 1 1 1 1 1 O
O 1 2 1 1 O
O 1 1 1 1 1 1 O
O 1 1 1 1 1 O
O 1 1 O
O O
)500 L 1 L
O 1 O
O O
O 1 O
O O
O O
O O
)1000 L L
PLMMMMMLMMMMMLMMMMMLMMMMMLMMMMMLMMMMMLMMMMMLMMMMMLMMMMMLMMMMMLMMMMMLMQ
)4 )3 )2 )1 0 1 2 3 4 5 6 7
sal x1
16
0$e 123 4rocedure
5odel6 578291
4artial1egression 1esidual 4lot
KMMMMMMMLMMMMMMMMLMMMMMMMMLMMMMMMMMLMMMMMMMMLMMMMMMMMLMMMMMMMMLMMMMMMMN
y O O
1000 L 1 L
O 1 O
O O
O O
O O
750 L 1 L
O 1 O
O O
O 1 1 O
O O
500 L 1 L
O O
O 1 O
O 11 O
O 1 O
J 250 L 1 L
i O 1 O
o O 1 1 21 O
m O 1 O
O 1 O
0 L 1 1 1 L
O 1 O
O 1 1 O
O O
O 1 1 O
)250 L 11 L
O 11 1 O
O 1 1 1 O
O 1 1 1 O
O 1 O
)500 L L
O 2 O
O 1 1 O
O O
O O
)750 L 1 L
PMMMMMMMLMMMMMMMMLMMMMMMMMLMMMMMMMMLMMMMMMMMLMMMMMMMMLMMMMMMMMLMMMMMMMQ
)1'5 )1'0 )0'5 0'0 0'5 1'0 1'5
pH x2
10
0$e 123 4rocedure
5odel6 578291
4artial1egression 1esidual 4lot
KMLMMMMLMMMMLMMMMLMMMMLMMMMLMMMMLMMMMLMMMMLMMMMLMMMMLMMMMLMMMMLMMMMLMN
y O O
1500 L L
O O
O O
O O
O O
O O
O 1 O
1000 L L
O O
O 1 O
O 1 1 O
O O
O O
O O
500 L 1 L
J O 1 O
i O 1 O
o O 1 1 O
m O 1 O
O 1 1 1 1 O
O 1 1 O
0 L 1 1 L
O 1 21 1 O
O 1 1 1 12 1 O
O 2 1 1 1 O
O 11 1 11 O
O 1 O
O 1 O
)500 L L
O 1 1 O
O O
O 1 O
O O
O O
O O
)1000 L L
PMLMMMMLMMMMLMMMMLMMMMLMMMMLMMMMLMMMMLMMMMLMMMMLMMMMLMMMMLMMMMLMMMMLMQ
)800 )700 )600 )500 )400 )300 )200 )100 0 100 200 300 400 500
4ot x3
11
0$e 123 4rocedure
5odel6 578291
4artial1egression 1esidual 4lot
KMLMMMMMMMMMMLMMMMMMMMMMLMMMMMMMMMMLMMMMMMMMMMLMMMMMMMMMMLMMMMMMMMMMLMN
y O O
O O
1250 L L
O O
O O
O 1 O
1000 L L
O O
O O
O 1 11 O
750 L L
O O
O O
O 1 O
500 L L
O 1 O
J O O
i O 1 1 1 O
o 250 L 1 1 L
m O O
O 1 O
O 1 1 1 O
0 L 11 1 1 L
O 1 11 O
O 1 1 1 1 O
O 1 21 1 1 O
)250 L 1 1 11 1 1 L
O 1 1 1 O
O O
O 1 O
)500 L 1 L
O 1 O
O O
O O
)750 L 1 L
O O
O O
PMLMMMMMMMMMMLMMMMMMMMMMLMMMMMMMMMMLMMMMMMMMMMLMMMMMMMMMMLMMMMMMMMMMLMQ
)10000 )5000 0 5000 10000 15000 20000
@od x4
133
0$e 123 4rocedure
5odel6 578291
4artial1egression 1esidual 4lot
KMMMMMLMMMMMMLMMMMMMLMMMMMMLMMMMMMLMMMMMMLMMMMMMLMMMMMMLMMMMMMLMMMMMMN
y O O
1500 L L
O O
O O
O O
O O
O 1 O
O O
1000 L L
O O
O 1 1 O
O O
O 1 O
O O
O 1 O
500 L L
J O 1 1 O
i O O
o O 1 1 O
m O 1 1 1 O
O 1 1 O
O O
0 L 1 1 1 L
O 1 1 11 2 O
O 1 1 1 1 1 1 1 O
O 1 2 1 O
O 1 1 1 1 1 O
O 1 1 1 O
O O
)500 L 1 L
O 1 O
O O
O 1 O
O O
O O
O O
)1000 L L
PMMMMMLMMMMMMLMMMMMMLMMMMMMLMMMMMMLMMMMMMLMMMMMMLMMMMMMLMMMMMMLMMMMMMQ
)10 )8 )6 )4 )2 0 2 4 6
Iin x5
N. Bele8;o *o mel#or &ub3o(Iu(to *e @ari5@ei& i(*e$e(*e(te&
% crit*rio de manter ou e.cluir uma )ari)el independente U
8
no modelo de
regresso linear m;ltipla +aseado na lcorrelao linear simplesl desta )ari)el com a
)ari)el dependente ou em
B
-
B
B
s
-

poder le)ar a erros, especialmente porque no
considera a relao entre U
8
e as outras )ari)eis independentes. T importante mencionar
que a escol/a dos m*todos apresentados a seguir * um pouco su+8eti)a e eles podem
le)ar a resultados diferentes.
%s principais m*todos encontrados na literatura para seleo do mel/or
su+con8unto de )ari)eis independentes para incluso no modelo soI
N.1 - 4Iu&te *e to*o& o& mo*elo& $o&&>@ei& - Bele8;o $elo m5ximo 3oefi3ie(te *e
*etermi(a8;o -
2
((;o aIu&ta*o ou aIu&ta*o)
131
"onsidere 251 o n;mero de )ari)eis independentes dispon)eis no estudo para
serem includas no modelo e admita que todos os modelos ten/am o intercepto
3
. %
n;mero total de poss)eis modelos a8ustados com 3, 1, ...., 251 )ari)eis independentes
*I
1 1
1
2
1
1
1
3
1
2 ...


+ + + +
P P
P P P P
C C C C
7o caso de $ )ari)eis independentes tem5se 251 Q $ e 2
$
Q !2 poss)eis modelos
a serem a8ustados. % crit*rio consiste em a8ustar todos os modelos poss)eis e dentre
aqueles com o mesmo n;mero de )ari)eis independentes JpL escol/er aqueles que tem o
m.imo coeficiente de determinao m;ltiplo R
2
. Dm procedimento equi)alente seria
escol/er os modelos que ten/am a soma de quadrados de resduo mnima.
7o >9> este procedimento * e.ecutado com as opes selectionQrsquare e
selectionQad8rsq, sendo esta ;ltima utiliEa o R
2
a8ustado.
N.2 - Bele8;o $elo m5ximo ou m>(imo i(3reme(to (o 3oefi3ie(te *e *etermi(a8;o
-
2
Bele8;o $elo m5ximo i(3reme(to (o 3oefi3ie(te *e *etermi(a8;o -
2
,ste procedimento a8usta todos os modelos poss)eis, por*m, no caso do >9>
Jopo selection Q ma.rL o analista poder esta+elecer que analise apenas modelos com
2, !, ....etc. )ari)eis independentes. % procedimento inicia procurando o modelo com
uma )ari)el independente que ten/a o m.imo R
2
. ,m seguida uma segunda )ari)el
independente que promo)a o maior incremento no R
2
* adicionada ao modelo e assim
por diante
Bele8;o $elo m>(imo i(3reme(to (o 3oefi3ie(te *e *etermi(a8;o -
2
,ste procedimento no >9> * e.ecutado atra)*s da opo selectionQminr e *
semel/ante ao m*todo do m.imo incremento no R
2
, por*m, as trocas de )ari)eis
+aseiam5se no menor incremento no R
2
. 2ara um dado n;mero de )ari)eis
independentes p os m*todos do m.imo e mnimo incremento no R
2
produEem
geralmente os mesmos lmel/oresl modelos.
N.3 - Bele8;o atra@E& *a e&tat>&ti3a '$ *e Mallo%
,ste procedimento * similar a seleo atra)*s do R
2
a8ustado, por*m, usa a
estatstica "p de Mallo? como crit*rio para seleo do modelo, e.pressa comoI
1
]
1

+


n
i
n
i
1
i i +
i
1 1
2
^
2
2
L J
1

onde,

i
Q ,JV
i
L de acordo com a )erdadeira relao de regresso, ou se8a, mel/or modelo
te#ricoP

i
Q ,JV
i
L de acordo com o modelo que est sendo a8ustado
2
^
i
1

Q )ari-ncia do )alor predito com o modelo a8ustado com p )ari)eis independentes

2
Q )ari-ncia do erro no modelo a8ustado com p )ari)eis independentes
T poss)el demonstrar que
132
L 2 J
^
L J Re
2
+ n
+ s :8
C
+

* um estimador de
p
,
2 2
^
1
+
i
1
n
i

e
,]>GResJpL\ Q
1
]
1

n
i
i i
+ n
1
2 2
L J L J
4alores de "
p
pr#.imos de p indicam +ons modelos.
N.4 - Bele8;o - elimi(a8;o BTE!T+BE
,ste procedimento no >9> * e.ecutado com a opo selectionQstep?ise e * um
dos mais usados nas aplicaes prticas. %utros pacotes estatsticos como MI7IT9A,
>T9TI>TI"9, etc. tam+*m apresentam a opo de seleo de )ari)eis atra)*s do
procedimento >T,2@I>,. ,ste procedimento no requer o clculo de todos os
poss)eis modelos e foi desen)ol)ido com o o+8eti)o de reduEir o tempo computacional.
<eralmente c/ega a um raEoa)elmente +om lmel/orl su+con8unto de )ari)eis
independentes para o modelo. ,ssencialmente este m*todo calcula uma seqHncia de
equaes de regresso a cada passo adicionando ou remo)endo uma )ari)el
independente no modelo. % crit*rio para adicionar ou retirar )ari)el independente do
modelo pode ser +aseado Je declaradoL equi)alentemente em termos da reduo na soma
de quadrados do resduo, coeficiente de determinao parcial ou : parcial informando
um ln)el de signific-ncial para entrada ou sada da )ari)el no modelo Jno >9> slsta` Q

1
e slentr` Q
2
L. <eralmente
1
e
2
)ariam de 3.13 a 3.$3 em aplicaes prticas. ,m
resumo o procedimento * o seguinteI
aL Inicialmente calcula5se todas as regresses lineares simples poss)eis J251L com as
)ari)eis independentes. 9 )ari)el independente com o maior : * colocada no
modeloP
+L "alcula5se todas as regresses com duas )ari)eis sendo que a )ari)el que entrou
no passo JaL figura em todos os modelos. 9dmita que a )ari)el U
6
ten/a sido
adicionada ao modelo no passo aL. 2ara cada )ari)el U
=
fora do modelo o
procedimento calcula5se uma estatstica : ] : Q GMRegJU
=
KU
6
LKGMResJU
=
,U
6
L \ e a
)ari)el com maior : * adicionada ao modelo, se o n)el de signific-ncia do : for
atingido pelo esta+elecido para entrada das )ari)eis. "aso nen/uma )ari)el no
atin8a o n)el de signific-ncia esta+elecido o procedimento paraP
cL 9gora o procedimento )erifica se alguma )ari)el de)er ser retirada do modelo,
+aseando5se no n)el de signific-ncia Jcrit*rio dos testes : parciaisL esta+elecido para
permanncia no modelo. % processo termina quando todas as )ari)eis no modelo
atingem o n)el de signific-ncia para permanecer e nen/uma outra )ari)el fora do
modelo atin8a o n)el de signific-ncia para entrar.
N.N - 2& mEto*o& F2-T4-/ e Q4'[T4-/
Bele8;o $ro"re&&i@a (F2-T4-/)
,ste procedimento * uma simplificao do m*todo >T,2@I>,, omitindo o teste
de que uma )eE que uma )ari)el ten/a entrado no modelo ela no sai mais. Isto
possi+ilita que )ari)eis sem import-ncia fiquem no modelo ap#s a adio de outras
)ari)eis.
13!
Elimi(a8;o re"re&&i@a (Q4'[T4-/)
% m*todo inicia com todas as )ari)eis independentes no modelo e )ai
eliminando uma a cada )eE, que no apresente a signific-ncia preesta+elecida para
permanecer no modelo. Dma )eE que uma )ari)el foi eliminada, no se faE mais teste
para seu retorno. "omo nos procedimentos >T,2@I>, e :%R@9R(, o teste * feito
atra)*s da estatstica : parcial.
Exer3>3io N.1 5 Ilustrao dos procedimentos de seleo do mel/or su+con8unto de
)ari)eis independentes para o modelo de regresso linear m;ltipla Jdados da produo
de +iomassa de uma esp*cie )egetal apresentados e descritos na pgina 02L.
options ls=78 nocenter nodate;
data a;
input y x1 x2 x3 x4 x5;
la-el x1=sal
x2=pM
x3=&ot
x4=0od
x5=Win
y=Oiom;
cards;
676 33 5 1441367 3518435 1634524
516 35 4375 1299319 2817034 1339852
1052 32 432 1154327 26455 1533276
3333333333333333333333333333333333333333333333333333333
1400 26 535 77333 1364938 193588
1620 28 535 829326 14533 2031328
1560 28 534 856396 1689232 193242
;
run;
DJJJ 5orrelacao entre as <aria<eis JJJD;
proc corr;run;
DJJJ *iagnostico no modelo de regressao JJJD;
proc reg;
model y=x1 x2 x3 x4 x5 D <i/ selection=maxr;
title I'aximo incremento no #JJ2I;
run;
proc reg;
model y=x1 x2 x3 x4 x5 D selection=minr;
title I'inimo incremento no #JJ2I;
run;
proc reg;
model y=x1 x2 x3 x4 x5 D selection=rsuare;
title I0elecao pelo maximo #JJ2I;
run;
proc reg;
model y=x1 x2 x3 x4 x5 D selection=ad7rs;
title I0elecao pelo maximo #JJ2 a7ustadoI;
run;
proc reg;
model y=x1 x2 x3 x4 x5 D selection=cp;
title I0elecao 5p de 'alloFsI;
run;
proc reg;
model y=x1 x2 x3 x4 x5 D selection=/orFard slentry=0335;
13'
title I0elecao progressi<aI;
run;
proc reg;
model y=x1 x2 x3 x4 x5 D selection=-acEFard slstay=0330;
title I$liminacao regressi<aI;
run;
proc reg;
model y=x1 x2 x3 x4 x5 D <i/ selection=stepFise slentry=0335
slstay=0330;
title I0elecao6eliminacao stepFiseI;
run;
!"e 5)## &rocedure
6 ,aria-les( y x1 x2 x3 x4 x5
,aria-le +a-el
y Oiom; x1 sal; x2 pM; x3 &ot; x4 0od; x5 Win
&earson 5orrelation 5oe//icients@ C = 45
&ro- 2 8r8 under M0( #"o=0
y x1 x2 x3 x4 x5
y 1300000 60310317 0377419 60320510 60327211 60362443
Oiom 035001 430001 031765 030706 430001
x1 60310317 1300000 60305133 60302055 0316230 60342084
sal 035001 037377 038934 032868 030040
x2 0377419 60305133 1300000 0301863 60303775 60372233
pM 430001 037377 039033 038055 430001
x3 60320510 60302055 0301863 1300000 0379189 0307383
&ot 031765 038934 039033 430001 036298
x4 60327211 0316230 60303775 0379189 1300000 0311700
0od 030706 032868 038055 430001 034440
x5 60362443 60342084 60372233 0307383 0311700 1300000
Win 430001 030040 430001 036298 034440
'aximo incremento no #JJ2
!"e #$% &rocedure
'odel( ')*$+1
*ependent ,aria-le( y Oiom
'aximum #60uare 9mpro<ement( 0tep 1
,aria-le x2 $ntered( #60uare = 035994 and 5ApG = 734184
.nalysis o/ ,ariance
0um o/ 'ean
0ource *1 0uares 0uare 1 ,alue &r 2
1
13$
'odel 1 11490388 11490388 64333
430001
$rror 43 7680575 178618
5orrected !otal 44 19170963
&arameter 0tandard
,aria-le $stimate $rror !ype 99 00 1 ,alue &r 2 1
9ntercept 6885321051 243344073 2361739 13322 030007
x2 409380431 51309422 11490388 64333 430001
Oounds on condition num-er( 1@ 1
6666666666666666666666666666666666666666666666666666666666666666666666
666
!"e a-o<e model is t"e -est 16<aria-le model /ound3
'aximum #60uare 9mpro<ement( 0tep 2
,aria-le x4 $ntered( #60uare = 036584 and 5ApG = 232791
.nalysis o/ ,ariance
0um o/ 'ean
0ource *1 0uares 0uare 1 ,alue &r 2
1
'odel 2 12622882 6311441 40348
430001
$rror 42 6548081 155907
5orrected !otal 44 19170963
'aximo incremento no #JJ2
!"e #$% &rocedure
'odel( ')*$+1
*ependent ,aria-le( y Oiom
'aximum #60uare 9mpro<ement( 0tep 2
&arameter 0tandard
,aria-le $stimate $rror !ype 99 00 1 ,alue &r 2 1
9ntercept 6475367504 273352768 471501 3302 030894
x2 404394362 47376956 11203438 71386 430001
x4 60302333 0300866 1132494 7326 030101
Oounds on condition num-er( 130014@ 430057
6666666666666666666666666666666666666666666666666666666666666666666666
6666
!"e a-o<e model is t"e -est 26<aria-le model /ound3
13&
'aximum #60uare 9mpro<ement( 0tep 3
,aria-le x5 $ntered( #60uare = 036624 and 5ApG = 337952
.nalysis o/ ,ariance
0um o/ 'ean
0ource *1 0uares 0uare 1 ,alue &r 2
1
'odel 3 12699653 4233218 26382
430001
$rror 41 6471310 157837
5orrected !otal 44 19170963
&arameter 0tandard
,aria-le $stimate $rror !ype 99 00 1 ,alue &r 2 1
9ntercept 6195370056 486372379 25517 0316 036897
x2 369382259 69361434 4454488 28322 430001
x4 60302253 0300878 1038774 6358 030141
x5 67335860 10355116 76771 0349 034895
Oounds on condition num-er( 231269@ 153739
6666666666666666666666666666666666666666666666666666666666666666666666
666666
!"e a-o<e model is t"e -est 36<aria-le model /ound3
'aximum #60uare 9mpro<ement( 0tep 4
'aximo incremento no #JJ2
!"e #$% &rocedure
'odel( ')*$+1
*ependent ,aria-le( y Oiom
'aximum #60uare 9mpro<ement( 0tep 4
,aria-le x1 $ntered( #60uare = 036717 and 5ApG = 436706
.nalysis o/ ,ariance
0um o/ 'ean
0ource *1 0uares 0uare 1 ,alue &r 2
1
'odel 4 12878042 3219511 20346
430001
$rror 40 6292921 157323
5orrected !otal 44 19170963
&arameter 0tandard
,aria-le $stimate $rror !ype 99 00 1 ,alue &r 2 1
9ntercept 936319019 1168376531 100941 0364 034279
x1 624327824 22379972 178389 1313 032933
136
x2 314323969 86391955 2056267 13307 030008
x4 60301924 0300930 673705 4328 030450
x5 618331748 14372683 243391 1355 032208
Oounds on condition num-er( 431569@ 423398
6666666666666666666666666666666666666666666666666666666666666666666666
66666
'aximum #60uare 9mpro<ement( 0tep 5
,aria-le x4 #emo<ed( #60uare = 036748 and 5ApG = 432969
,aria-le x3 $ntered
.nalysis o/ ,ariance
0um o/ 'ean
0ource *1 0uares 0uare 1 ,alue &r 2
1
'odel 4 12937326 3234332 20375
430001
$rror 40 6233637 155841
5orrected !otal 44 19170963
'aximo incremento no #JJ2
!"e #$% &rocedure
'odel( ')*$+1
*ependent ,aria-le( y Oiom
'aximum #60uare 9mpro<ement( 0tep 5
&arameter 0tandard
,aria-le $stimate $rror !ype 99 00 1 ,alue &r 2 1
9ntercept 1506303571 1134325333 274746 1376 031918
x1 635394476 21348127 436348 2380 031021
x2 293376382 84350886 1883101 12308 030012
x3 60343876 0320231 732989 4370 030361
x5 623345800 14304862 434506 2379 031028
Oounds on condition num-er( 338188@ 393125
6666666666666666666666666666666666666666666666666666666666666666666666
6666
!"e a-o<e model is t"e -est 46<aria-le model /ound3
'aximum #60uare 9mpro<ement( 0tep 6
,aria-le x4 $ntered( #60uare = 036773 and 5ApG = 630000
.nalysis o/ ,ariance
0um o/ 'ean
0ource *1 0uares 0uare 1 ,alue &r 2
1
'odel 5 12984417 2596883 16337
430001
$rror 39 6186546 158629
130
5orrected !otal 44 19170963
&arameter 0tandard
,aria-le $stimate $rror !ype 99 00 1 ,alue &r 2 1
9ntercept 1252332252 1235347089 162986 1303 033170
x1 630327890 24303830 251684 1359 032153
x2 305348218 87393242 1914509 12307 030013
x3 60328509 0334815 106375 0367 034178
x4 60300868 0301592 47091 0330 035890
x5 620367564 15306563 298763 1388 031778
Oounds on condition num-er( 433146@ 803892
6666666666666666666666666666666666666666666666666666666666666666666666
666
!"e a-o<e model is t"e -est 56<aria-le model /ound3
'aximo incremento no #JJ2
!"e #$% &rocedure
'odel( ')*$+1
*ependent ,aria-le( y Oiom
'aximum #60uare 9mpro<ement( 0tep 6
Co /urt"er impro<ement in #60uare is possi-le3
'aximo incremento no #JJ2
!"e #$% &rocedure
'odel( ')*$+1
*ependent ,aria-le( y Oiom
.nalysis o/ ,ariance
0um o/ 'ean
0ource *1 0uares 0uare 1 ,alue &r 2
1
'odel 5 12984417 2596883 16337
430001
$rror 39 6186546 158629
5orrected !otal 44 19170963
#oot '0$ 398328305 #60uare 036773
*ependent 'ean 1000380000 .d7 #60 036359
5oe// ,ar 39379647
&arameter $stimates
&arameter 0tandard
,aria-le +a-el *1 $stimate $rror t ,alue &r
2 8t8
9ntercept 9ntercept 1 1252332252 1235347089 1301
033170
x1 sal 1 630327890 24303830 61326
032153
131
x2 pM 1 305348218 87393242 3347
030013
x3 &ot 1 60328509 0334815 60382
034178
x4 0od 1 60300868 0301592 60354
035890
x5 Win 1 620367564 15306563 61337
031778
&arameter $stimates
,ariance
,aria-le +a-el *1 9n/lation
9ntercept 9ntercept 1 0
x1 sal 1 2321768
x2 pM 1 3333500
x3 &ot 1 2397959
x4 0od 1 3333165
x5 Win 1 4331455
'inimo incremento no #JJ2
!"e #$% &rocedure
'odel( ')*$+1
*ependent ,aria-le( y Oiom
'inimum #60uare 9mpro<ement( 0tep 1
,aria-le x1 $ntered( #60uare = 030106 and 5ApG = 7835675
.nalysis o/ ,ariance
0um o/ 'ean
0ource *1 0uares 0uare 1 ,alue &r 2
1
'odel 1 204048 204048 0346
035001
$rror 43 18966915 441091
5orrected !otal 44 19170963
&arameter 0tandard
,aria-le $stimate $rror !ype 99 00 1 ,alue &r 2 1
9ntercept 1554390670 820368191 1583387 3359 030649
x1 618330749 26391701 204048 0346 035001
Oounds on condition num-er( 1@ 1
6666666666666666666666666666666666666666666666666666666666666666666666
666
'inimum #60uare 9mpro<ement( 0tep 2
,aria-le x1 #emo<ed( #60uare = 030421 and 5ApG = 7437698
,aria-le x3 $ntered
113
.nalysis o/ ,ariance
0um o/ 'ean
0ource *1 0uares 0uare 1 ,alue &r 2
1
'odel 1 806465 806465 1389
031765
$rror 43 18364498 427081
5orrected !otal 44 19170963
'inimo incremento no #JJ2
!"e #$% &rocedure
'odel( ')*$+1
*ependent ,aria-le( y Oiom
'inimum #60uare 9mpro<ement( 0tep 2
&arameter 0tandard
,aria-le $stimate $rror !ype 99 00 1 ,alue &r 2 1
9ntercept 1363350876 281335380 10030462 23349 430001
x3 60345476 0333094 806465 1389 031765
Oounds on condition num-er( 1@ 1
6666666666666666666666666666666666666666666666666666666666666666666666
6666
'inimum #60uare 9mpro<ement( 0tep 3
,aria-le x3 #emo<ed( #60uare = 030740 and 5ApG = 7039056
,aria-le x4 $ntered
.nalysis o/ ,ariance
0um o/ 'ean
0ource *1 0uares 0uare 1 ,alue &r 2
1
'odel 1 1419445 1419445 3344
030706
$rror 43 17751519 412826
5orrected !otal 44 19170963
&arameter 0tandard
,aria-le $stimate $rror !ype 99 00 1 ,alue &r 2 1
9ntercept 1433393986 252346336 13317792 32326 430001
x4 60302610 0301407 1419445 3344 030706
Oounds on condition num-er( 1@ 1
6666666666666666666666666666666666666666666666666666666666666666666666
6666
'inimum #60uare 9mpro<ement( 0tep 4
111
,aria-le x4 #emo<ed( #60uare = 033899 and 5ApG = 3237309
,aria-le x5 $ntered
'inimo incremento no #JJ2
!"e #$% &rocedure
'odel( ')*$+1
*ependent ,aria-le( y Oiom
'inimum #60uare 9mpro<ement( 0tep 4
.nalysis o/ ,ariance
0um o/ 'ean
0ource *1 0uares 0uare 1 ,alue &r 2
1
'odel 1 7475069 7475069 27348
430001
$rror 43 11695894 271998
5orrected !otal 44 19170963
&arameter 0tandard
,aria-le $stimate $rror !ype 99 00 1 ,alue &r 2 1
9ntercept 1890381607 186372923 27889384 102354 430001
x5 649378920 9349752 7475069 27348 430001
Oounds on condition num-er( 1@ 1
6666666666666666666666666666666666666666666666666666666666666666666666
666
'inimum #60uare 9mpro<ement( 0tep 5
,aria-le x5 #emo<ed( #60uare = 035994 and 5ApG = 734184
,aria-le x2 $ntered
.nalysis o/ ,ariance
0um o/ 'ean
0ource *1 0uares 0uare 1 ,alue &r 2
1
'odel 1 11490388 11490388 64333
430001
$rror 43 7680575 178618
5orrected !otal 44 19170963
&arameter 0tandard
,aria-le $stimate $rror !ype 99 00 1 ,alue &r 2 1
9ntercept 6885321051 243344073 2361739 13322 030007
x2 409380431 51309422 11490388 64333 430001
Oounds on condition num-er( 1@ 1
6666666666666666666666666666666666666666666666666666666666666666666666
6
'inimo incremento no #JJ2
!"e #$% &rocedure
112
'odel( ')*$+1
*ependent ,aria-le( y Oiom
'inimum #60uare 9mpro<ement( 0tep 5
!"e a-o<e model is t"e -est 16<aria-le model /ound3
'inimum #60uare 9mpro<ement( 0tep 6
,aria-le x1 $ntered( #60uare = 036034 and 5ApG = 839309
.nalysis o/ ,ariance
0um o/ 'ean
0ource *1 0uares 0uare 1 ,alue &r 2
1
'odel 2 11567716 5783858 31395
430001
$rror 42 7603247 181030
5orrected !otal 44 19170963
&arameter 0tandard
,aria-le $stimate $rror !ype 99 00 1 ,alue &r 2 1
9ntercept 6535369792 588325824 150125 0383 033677
x1 611328502 17326675 77327 0343 035170
x2 408307631 51350591 11363668 62377 430001
Oounds on condition num-er( 130026@ 430106
6666666666666666666666666666666666666666666666666666666666666666666666
6666
'inimum #60uare 9mpro<ement( 0tep 7
,aria-le x1 #emo<ed( #60uare = 036083 and 5ApG = 833436
,aria-le x5 $ntered
.nalysis o/ ,ariance
0um o/ 'ean
0ource *1 0uares 0uare 1 ,alue &r 2
1
'odel 2 11660879 5830440 32361
430001
$rror 42 7510084 178812
5orrected !otal 44 19170963
'inimo incremento no #JJ2
!"e #$% &rocedure
'odel( ')*$+1
*ependent ,aria-le( y Oiom
'inimum #60uare 9mpro<ement( 0tep 7
&arameter 0tandard
,aria-le $stimate $rror !ype 99 00 1 ,alue &r 2 1
11!
9ntercept 6450388563 507312116 141353 0379 033790
x2 357366426 73392367 4185810 23341 430001
x5 610387314 11313530 170491 0395 033344
Oounds on condition num-er( 23091@ 83364
6666666666666666666666666666666666666666666666666666666666666666666666
666
'inimum #60uare 9mpro<ement( 0tep 8
,aria-le x5 #emo<ed( #60uare = 036476 and 5ApG = 335921
,aria-le x3 $ntered
.nalysis o/ ,ariance
0um o/ 'ean
0ource *1 0uares 0uare 1 ,alue &r 2
1
'odel 2 12414609 6207305 38359
430001
$rror 42 6756354 160866
5orrected !otal 44 19170963
&arameter 0tandard
,aria-le $stimate $rror !ype 99 00 1 ,alue &r 2 1
9ntercept 6506382448 279381044 527777 3328 030772
x2 411397036 48349714 11608144 72316 430001
x3 60348692 0320314 924221 5375 030211
Oounds on condition num-er( 130003@ 430014
6666666666666666666666666666666666666666666666666666666666666666666666
666
'inimum #60uare 9mpro<ement( 0tep 9
,aria-le x3 #emo<ed( #60uare = 036584 and 5ApG = 232791
,aria-le x4 $ntered
'inimo incremento no #JJ2
!"e #$% &rocedure
'odel( ')*$+1
*ependent ,aria-le( y Oiom
'inimum #60uare 9mpro<ement( 0tep 9
.nalysis o/ ,ariance
0um o/ 'ean
0ource *1 0uares 0uare 1 ,alue &r 2
1
'odel 2 12622882 6311441 40348
430001
$rror 42 6548081 155907
5orrected !otal 44 19170963
&arameter 0tandard
,aria-le $stimate $rror !ype 99 00 1 ,alue &r 2 1
11'
9ntercept 6475367504 273352768 471501 3302 030894
x2 404394362 47376956 11203438 71386 430001
x4 60302333 0300866 1132494 7326 030101
Oounds on condition num-er( 130014@ 430057
6666666666666666666666666666666666666666666666666666666666666666666666
666
!"e a-o<e model is t"e -est 26<aria-le model /ound3
'inimum #60uare 9mpro<ement( 0tep 10
,aria-le x1 $ntered( #60uare = 036591 and 5ApG = 432049
.nalysis o/ ,ariance
0um o/ 'ean
0ource *1 0uares 0uare 1 ,alue &r 2
1
'odel 3 12634651 4211550 26342
430001
$rror 41 6536312 159422
5orrected !otal 44 19170963
'inimo incremento no #JJ2
!"e #$% &rocedure
'odel( ')*$+1
*ependent ,aria-le( y Oiom
'inimum #60uare 9mpro<ement( 0tep 10
&arameter 0tandard
,aria-le $stimate $rror !ype 99 00 1 ,alue &r 2 1
9ntercept 6344332552 556397063 60929 0338 035399
x1 64346045 16341689 11769 0307 037872
x2 404334129 48335599 11146656 69392 430001
x4 60302294 0300887 1066935 6369 030133
Oounds on condition num-er( 130292@ 931822
6666666666666666666666666666666666666666666666666666666666666666666666
66666
'inimum #60uare 9mpro<ement( 0tep 11
,aria-le x1 #emo<ed( #60uare = 036604 and 5ApG = 430457
,aria-le x3 $ntered
.nalysis o/ ,ariance
0um o/ 'ean
0ource *1 0uares 0uare 1 ,alue &r 2
1
'odel 3 12659904 4219968 26357
430001
$rror 41 6511059 158806
5orrected !otal 44 19170963
11$
&arameter 0tandard
,aria-le $stimate $rror !ype 99 00 1 ,alue &r 2 1
9ntercept 6447376793 282304536 400254 2352 031201
x2 406380078 48336493 11234925 70375 430001
x3 60316007 0333151 37022 0323 036318
x4 60301783 0301435 245295 1354 032210
Oounds on condition num-er( 237016@ 193224
6666666666666666666666666666666666666666666666666666666666666666666666
6666
'inimum #60uare 9mpro<ement( 0tep 12
,aria-le x3 #emo<ed( #60uare = 036624 and 5ApG = 337952
,aria-le x5 $ntered
'inimo incremento no #JJ2
!"e #$% &rocedure
'odel( ')*$+1
*ependent ,aria-le( y Oiom
'inimum #60uare 9mpro<ement( 0tep 12
.nalysis o/ ,ariance
0um o/ 'ean
0ource *1 0uares 0uare 1 ,alue &r 2
1
'odel 3 12699653 4233218 26382
430001
$rror 41 6471310 157837
5orrected !otal 44 19170963
&arameter 0tandard
,aria-le $stimate $rror !ype 99 00 1 ,alue &r 2 1
9ntercept 6195370056 486372379 25517 0316 036897
x2 369382259 69361434 4454488 28322 430001
x4 60302253 0300878 1038774 6358 030141
x5 67335860 10355116 76771 0349 034895
Oounds on condition num-er( 231269@ 153739
6666666666666666666666666666666666666666666666666666666666666666666666
6666
!"e a-o<e model is t"e -est 36<aria-le model /ound3
'inimum #60uare 9mpro<ement( 0tep 13
,aria-le x3 $ntered( #60uare = 036642 and 5ApG = 535866
.nalysis o/ ,ariance
0um o/ 'ean
0ource *1 0uares 0uare 1 ,alue &r 2
1
11&
'odel 4 12732733 3183183 19378
430001
$rror 40 6438231 160956
5orrected !otal 44 19170963
'inimo incremento no #JJ2
!"e #$% &rocedure
'odel( ')*$+1
*ependent ,aria-le( y Oiom
'inimum #60uare 9mpro<ement( 0tep 13
&arameter 0tandard
,aria-le $stimate $rror !ype 99 00 1 ,alue &r 2 1
9ntercept 6176338350 493335279 20573 0313 037226
x2 372346775 70354052 4487522 27388 430001
x3 60315141 0333400 33079 0321 036528
x4 60301735 0301446 231754 1344 032372
x5 67317247 10366281 72828 0345 035050
Oounds on condition num-er( 237082@ 383624
6666666666666666666666666666666666666666666666666666666666666666666666
66666
'inimum #60uare 9mpro<ement( 0tep 14
,aria-le x3 #emo<ed( #60uare = 036717 and 5ApG = 436706
,aria-le x1 $ntered
.nalysis o/ ,ariance
0um o/ 'ean
0ource *1 0uares 0uare 1 ,alue &r 2
1
'odel 4 12878042 3219511 20346
430001
$rror 40 6292921 157323
5orrected !otal 44 19170963
&arameter 0tandard
,aria-le $stimate $rror !ype 99 00 1 ,alue &r 2 1
9ntercept 936319019 1168376531 100941 0364 034279
x1 624327824 22379972 178389 1313 032933
x2 314323969 86391955 2056267 13307 030008
x4 60301924 0300930 673705 4328 030450
x5 618331748 14372683 243391 1355 032208
Oounds on condition num-er( 431569@ 423398
6666666666666666666666666666666666666666666666666666666666666666666666
66666
'inimum #60uare 9mpro<ement( 0tep 15
'inimo incremento no #JJ2
!"e #$% &rocedure
'odel( ')*$+1
*ependent ,aria-le( y Oiom
116
'inimum #60uare 9mpro<ement( 0tep 15
,aria-le x4 #emo<ed( #60uare = 036748 and 5ApG = 432969
,aria-le x3 $ntered
.nalysis o/ ,ariance
0um o/ 'ean
0ource *1 0uares 0uare 1 ,alue &r 2
1
'odel 4 12937326 3234332 20375
430001
$rror 40 6233637 155841
5orrected !otal 44 19170963
&arameter 0tandard
,aria-le $stimate $rror !ype 99 00 1 ,alue &r 2 1
9ntercept 1506303571 1134325333 274746 1376 031918
x1 635394476 21348127 436348 2380 031021
x2 293376382 84350886 1883101 12308 030012
x3 60343876 0320231 732989 4370 030361
x5 623345800 14304862 434506 2379 031028
Oounds on condition num-er( 338188@ 393125
6666666666666666666666666666666666666666666666666666666666666666666666
6666
!"e a-o<e model is t"e -est 46<aria-le model /ound3
'inimum #60uare 9mpro<ement( 0tep 16
,aria-le x4 $ntered( #60uare = 036773 and 5ApG = 630000
.nalysis o/ ,ariance
0um o/ 'ean
0ource *1 0uares 0uare 1 ,alue &r 2
1
'odel 5 12984417 2596883 16337
430001
$rror 39 6186546 158629
5orrected !otal 44 19170963
'inimo incremento no #JJ2
!"e #$% &rocedure
'odel( ')*$+1
*ependent ,aria-le( y Oiom
'inimum #60uare 9mpro<ement( 0tep 16
&arameter 0tandard
,aria-le $stimate $rror !ype 99 00 1 ,alue &r 2 1
9ntercept 1252332252 1235347089 162986 1303 033170
x1 630327890 24303830 251684 1359 032153
x2 305348218 87393242 1914509 12307 030013
110
x3 60328509 0334815 106375 0367 034178
x4 60300868 0301592 47091 0330 035890
x5 620367564 15306563 298763 1388 031778
Oounds on condition num-er( 433146@ 803892
6666666666666666666666666666666666666666666666666666666666666666666666
6666
!"e a-o<e model is t"e -est 56<aria-le model /ound3
Co /urt"er impro<ement in #60uare is possi-le3
0elecao pelo maximo #JJ2
!"e #$% &rocedure
'odel( ')*$+1
#60uare 0election 'et"od
#egression 'odels /or *ependent ,aria-le( y
Cum-er in
'odel #60uare ,aria-les in 'odel
1 035994 x2
1 033899 x5
1 030740 x4
1 030421 x3
1 030106 x1
6666666666666666666666666666666666666666666
2 036584 x2 x4
2 036476 x2 x3
2 036083 x2 x5
2 036034 x1 x2
2 035527 x1 x5
2 034301 x4 x5
2 034153 x3 x5
2 030776 x1 x4
2 030743 x3 x4
2 030536 x1 x3
6666666666666666666666666666666666666666666
3 036624 x2 x4 x5
3 036604 x2 x3 x4
3 036591 x1 x2 x4
3 036522 x1 x2 x3
3 036521 x2 x3 x5
3 036366 x1 x2 x5
3 035766 x1 x3 x5
3 035645 x1 x4 x5
3 034301 x3 x4 x5
3 030776 x1 x3 x4
6666666666666666666666666666666666666666666
4 036748 x1 x2 x3 x5
4 036717 x1 x2 x4 x5
4 036642 x2 x3 x4 x5
4 036617 x1 x2 x3 x4
4 035774 x1 x3 x4 x5
6666666666666666666666666666666666666666666
5 036773 x1 x2 x3 x4 x5
0elecao pelo maximo #JJ2 a7ustado
111
!"e #$% &rocedure
'odel( ')*$+1
.d7usted #60uare 0election 'et"od
#egression 'odels /or *ependent ,aria-le( y
Cum-er in .d7usted
'odel #60uare #60uare ,aria-les in 'odel
4 036423 036748 x1 x2 x3 x5
2 036422 036584 x2 x4
4 036389 036717 x1 x2 x4 x5
3 036377 036624 x2 x4 x5
5 036359 036773 x1 x2 x3 x4 x5
3 036355 036604 x2 x3 x4
3 036341 036591 x1 x2 x4
2 036308 036476 x2 x3
4 036306 036642 x2 x3 x4 x5
4 036279 036617 x1 x2 x3 x4
3 036267 036522 x1 x2 x3
3 036266 036521 x2 x3 x5
3 036100 036366 x1 x2 x5
1 035900 035994 x2
2 035896 036083 x2 x5
2 035845 036034 x1 x2
3 035456 035766 x1 x3 x5
4 035352 035774 x1 x3 x4 x5
3 035326 035645 x1 x4 x5
2 035314 035527 x1 x5
2 034029 034301 x4 x5
3 033884 034301 x3 x4 x5
2 033875 034153 x3 x5
1 033757 033899 x5
1 030525 030740 x4
2 030337 030776 x1 x4
2 030303 030743 x3 x4
1 030198 030421 x3
3 030101 030776 x1 x3 x4
2 030085 030536 x1 x3
1 630124 030106 x1
0elecao 5p de 'alloFs
!"e #$% &rocedure
'odel( ')*$+1
5ApG 0election 'et"od
#egression 'odels /or *ependent ,aria-le( y
Cum-er in
'odel 5ApG #60uare ,aria-les in 'odel
2 232791 036584 x2 x4
2 335921 036476 x2 x3
3 337952 036624 x2 x4 x5
3 430457 036604 x2 x3 x4
3 432049 036591 x1 x2 x4
4 432969 036748 x1 x2 x3 x5
4 436706 036717 x1 x2 x4 x5
123
3 530360 036522 x1 x2 x3
3 530476 036521 x2 x3 x5
4 535866 036642 x2 x3 x4 x5
4 538834 036617 x1 x2 x3 x4
5 630000 036773 x1 x2 x3 x4 x5
3 639176 036366 x1 x2 x5
1 734184 035994 x2
2 833436 036083 x2 x5
2 839309 036034 x1 x2
3 1431679 035766 x1 x3 x5
2 1530623 035527 x1 x5
3 1536333 035645 x1 x4 x5
4 1630691 035774 x1 x3 x4 x5
2 2938763 034301 x4 x5
2 3136589 034153 x3 x5
3 3138760 034301 x3 x4 x5
1 3237309 033899 x5
1 7039056 030740 x4
2 7234735 030776 x1 x4
2 7238707 030743 x3 x4
3 7434729 030776 x1 x3 x4
1 7437698 030421 x3
2 7533757 030536 x1 x3
1 7835675 030106 x1
0elecao progressi<a
!"e #$% &rocedure
'odel( ')*$+1
*ependent ,aria-le( y Oiom
1orFard 0election( 0tep 1
,aria-le x2 $ntered( #60uare = 035994 and 5ApG = 734184
.nalysis o/ ,ariance
0um o/ 'ean
0ource *1 0uares 0uare 1 ,alue &r 2
1
'odel 1 11490388 11490388 64333
430001
$rror 43 7680575 178618
5orrected !otal 44 19170963
&arameter 0tandard
,aria-le $stimate $rror !ype 99 00 1 ,alue &r 2 1
9ntercept 6885321051 243344073 2361739 13322 030007
x2 409380431 51309422 11490388 64333 430001
Oounds on condition num-er( 1@ 1
6666666666666666666666666666666666666666666666666666666666666666666666
66666
1orFard 0election( 0tep 2
,aria-le x4 $ntered( #60uare = 036584 and 5ApG = 232791
121
.nalysis o/ ,ariance
0um o/ 'ean
0ource *1 0uares 0uare 1 ,alue &r 2
1
'odel 2 12622882 6311441 40348
430001
$rror 42 6548081 155907
5orrected !otal 44 19170963
0elecao progressi<a
!"e #$% &rocedure
'odel( ')*$+1
*ependent ,aria-le( y Oiom
1orFard 0election( 0tep 2
&arameter 0tandard
,aria-le $stimate $rror !ype 99 00 1 ,alue &r 2 1
9ntercept 6475367504 273352768 471501 3302 030894
x2 404394362 47376956 11203438 71386 430001
x4 60302333 0300866 1132494 7326 030101
Oounds on condition num-er( 130014@ 430057
6666666666666666666666666666666666666666666666666666666666666666666666
666666
Co ot"er <aria-le met t"e 033500 signi/icance le<el /or entry into t"e
model3
0ummary o/ 1orFard 0election
,aria-le Cum-er &artial 'odel
0tep $ntered +a-el ,ars 9n #60uare #60uare 5ApG 1 ,alue &r
2 1
1 x2 pM 1 035994 035994 734184 64333
430001
2 x4 0od 2 030591 036584 232791 7326
030101
$liminacao regressi<a
!"e #$% &rocedure
'odel( ')*$+1
*ependent ,aria-le( y Oiom
OacEFard $limination( 0tep 0
.ll ,aria-les $ntered( #60uare = 036773 and 5ApG = 630000
.nalysis o/ ,ariance
0um o/ 'ean
0ource *1 0uares 0uare 1 ,alue &r 2
1
'odel 5 12984417 2596883 16337
430001
$rror 39 6186546 158629
5orrected !otal 44 19170963
122
&arameter 0tandard
,aria-le $stimate $rror !ype 99 00 1 ,alue &r 2 1
9ntercept 1252332252 1235347089 162986 1303 033170
x1 630327890 24303830 251684 1359 032153
x2 305348218 87393242 1914509 12307 030013
x3 60328509 0334815 106375 0367 034178
x4 60300868 0301592 47091 0330 035890
x5 620367564 15306563 298763 1388 031778
Oounds on condition num-er( 433146@ 803892
6666666666666666666666666666666666666666666666666666666666666666666666
6666
OacEFard $limination( 0tep 1
,aria-le x4 #emo<ed( #60uare = 036748 and 5ApG = 432969
.nalysis o/ ,ariance
0um o/ 'ean
0ource *1 0uares 0uare 1 ,alue &r 2
1
'odel 4 12937326 3234332 20375
430001
$rror 40 6233637 155841
5orrected !otal 44 19170963
$liminacao regressi<a
!"e #$% &rocedure
'odel( ')*$+1
*ependent ,aria-le( y Oiom
OacEFard $limination( 0tep 1
&arameter 0tandard
,aria-le $stimate $rror !ype 99 00 1 ,alue &r 2 1
9ntercept 1506303571 1134325333 274746 1376 031918
x1 635394476 21348127 436348 2380 031021
x2 293376382 84350886 1883101 12308 030012
x3 60343876 0320231 732989 4370 030361
x5 623345800 14304862 434506 2379 031028
Oounds on condition num-er( 338188@ 393125
6666666666666666666666666666666666666666666666666666666666666666666666
6666
.ll <aria-les le/t in t"e model are signi/icant at t"e 033000 le<el3
0ummary o/ OacEFard $limination
,aria-le Cum-er &artial 'odel
0tep #emo<ed +a-el ,ars 9n #60uare #60uare 5ApG 1 ,alue &r
2 1
12!
1 x4 0od 4 030025 036748 432969 0330
035890
0elecao6eliminacao stepFise
!"e #$% &rocedure
'odel( ')*$+1
*ependent ,aria-le( y Oiom
0tepFise 0election( 0tep 1
,aria-le x2 $ntered( #60uare = 035994 and 5ApG = 734184
.nalysis o/ ,ariance
0um o/ 'ean
0ource *1 0uares 0uare 1 ,alue &r 2
1
'odel 1 11490388 11490388 64333
430001
$rror 43 7680575 178618
5orrected !otal 44 19170963
&arameter 0tandard
,aria-le $stimate $rror !ype 99 00 1 ,alue &r 2 1
9ntercept 6885321051 243344073 2361739 13322 030007
x2 409380431 51309422 11490388 64333 430001
Oounds on condition num-er( 1@ 1
6666666666666666666666666666666666666666666666666666666666666666666666
6666
0tepFise 0election( 0tep 2
,aria-le x4 $ntered( #60uare = 036584 and 5ApG = 232791
.nalysis o/ ,ariance
0um o/ 'ean
0ource *1 0uares 0uare 1 ,alue &r 2
1
'odel 2 12622882 6311441 40348
430001
$rror 42 6548081 155907
5orrected !otal 44 19170963
0elecao6eliminacao stepFise
!"e #$% &rocedure
'odel( ')*$+1
*ependent ,aria-le( y Oiom
0tepFise 0election( 0tep 2
&arameter 0tandard
,aria-le $stimate $rror !ype 99 00 1 ,alue &r 2 1
9ntercept 6475367504 273352768 471501 3302 030894
x2 404394362 47376956 11203438 71386 430001
12'
x4 60302333 0300866 1132494 7326 030101
Oounds on condition num-er( 130014@ 430057
6666666666666666666666666666666666666666666666666666666666666666666666
6666
.ll <aria-les le/t in t"e model are signi/icant at t"e 033000 le<el3
Co ot"er <aria-le met t"e 033500 signi/icance le<el /or entry into t"e
model3
0ummary o/ 0tepFise 0election
,aria-le ,aria-le Cum-er &artial 'odel
0tep $ntered #emo<ed +a-el ,ars 9n #60uare #60uare 5ApG 1
,alue
1 x2 pM 1 035994 035994 734184
64333
2 x4 0od 2 030591 036584 232791
7326
0ummary o/ 0tepFise 0election
0tep &r 2 1
1 430001
2 030101
0elecao6eliminacao stepFise
!"e #$% &rocedure
'odel( ')*$+1
*ependent ,aria-le( y Oiom
.nalysis o/ ,ariance
0um o/ 'ean
0ource *1 0uares 0uare 1 ,alue &r 2
1
'odel 2 12622882 6311441 40348
430001
$rror 42 6548081 155907
5orrected !otal 44 19170963
#oot '0$ 394385021 #60uare 036584
*ependent 'ean 1000380000 .d7 #60 036422
5oe// ,ar 39345346
&arameter $stimates
&arameter 0tandard
,aria-le +a-el *1 $stimate $rror t ,alue &r
2 8t8
9ntercept 9ntercept 1 6475367504 273352768 61374
030894
x2 pM 1 404394362 47376956 8348
430001
12$
x4 0od 1 60302333 0300866 62370
030101
&arameter $stimates
,ariance
,aria-le +a-el *1 9n/lation
9ntercept 9ntercept 1 0
x2 pM 1 1300143
x4 0od 1 1300143
6. -e"re&&;o 3om @ari5@ei& i(*i3a*ore&
6.1 Mo*elo& 3om uma ou mai& @ari5@ei& i(*e$e(*e(te& =ualitati@a&
9 maioria dos te.tos so+re regresso trata dos casos onde as )ari)eis independentes do modelo
so quantitati)as. 4ari)eis quantitati)as assumem )alores numa escala +em definida como, por
e.emploI renda, idade, temperatura, receitas liquidas, etc.
Muita& @ari5@ei& *e i(tere&&e e&$e3ialme(te em E3o(omia e ,e"A3io& &;o =ualitati@a& 3omo
&exo (ma&3uli(o< femi(i(o)< e&ta*o *e a=ui&i8;o (a*=uiri*o< (;o a*=uiri*o) e&ta*o *e #abilita8;o
(*e&abilita*o< $ar3ialme(te #abilita*o< #abilita*o)< et3.
4ari)eis qualitati)as podem ser usadas em modelos de regresso m;ltipla da mesma maneira
que as )ari)eis quantitati)as. ,.istem casos em que algumas ou todas as )ari)eis independentes so
qualitati)as, +em como, casos onde a )ari)el dependente * qualitati)a.
Mo*elo& 3om uma @ari5@el i(*e$e(*e(te =ualitati@a
"onsidere uma situao onde o interesse se8a relacionar a )elocidade com que uma ino)ao em
segurana JVL se8a adotada em funo do taman/o JU1L e do tipo de empresa. 9 )ari)el dependente *
medida como o numero de meses transcorridos entre o tempo em que a primeira empresa e a empresa
considerada adotou a ino)ao. 9 )ari)el independente U1 * a receita +ruta da empresa, portanto,
quantitati)a. 9 segunda )ari)el independente * o tipo de empresa, tratada como qualitati)a e composta
de duas classesI empresas de distri+uio de mercadorias J)endas de produtosL e empresas prestadoras de
ser)ios. 2ara se introduEir )ari)eis qualitati)as no modelo de regresso, indicadores quantitati)os
de)em ser atri+udos aos n)eis das )ari)eis qualitati)as.
Dari5@ei& i(*i3a*ora&
O muitas maneiras de identificar quantitati)amente as classes de )ari)eis qualitati)as. Dma
delas * usar )ari)eis indicadoras que assumem apenas os )alores 3 ou 1. 2ara o ultimo e.emplo
apresentado em que a )ari)el qualitati)a tem duas classes, pode5se definir duas )ari)eis indicadoras,
U2 e U! da seguinte maneiraI
U2 Q 1 para empresas distri+uidoras de mercadorias e U2 Q 3 para outros casos.
U! Q 1 para empresas prestadoras de ser)ios e U! Q 3 para outros casos.
9ssumindo que a relao entre as )ari)eis se8a linear, o modelo pode ser escrito comoI
Vi Q 3U3i X 1U1i X 2U2i X !U!i X I, sendo U3i 1 para todo i.
% enfoque intuiti)o de atri+uir )ari)el indicadora a cada classe da )ari)el qualitati)a,
infeliEmente le)a a algumas dificuldades computacionais. >upon/a o e.emplo em curso com quatro
o+ser)aes Jn Q 'L sendo duas para cada tipo de empresa. 2ara empresas de distri+uio de mercadorias
tem5se U2 Q 1 e U! Q 3 e para as prestadoras de ser)ios, U2 Q 3 e U! Q 1. 9 matriE 7 correspondente ao
modelo de regresso linear * da formaI
12&
1
1
1
1
]
1

1 3 1
1 3 1
3 1 1
3 1 1
1'
1!
12
11
2
2
2
2
2
%+ser)e que a coluna correspondente a U3 * igual a soma das colunas correspondentes a U2 e
U!, ou se8a, as colunas so linearmente dependentes, o que causa um serio efeito na matriE 7\7I
1
1
1
1
]
1

1 1 3 3
3 3 1 1
1 1 1 1
n
1' 1! 12 11
2 2 2 2
2 2
1
1
1
1
]
1

1 3 1
1 3 1
3 1 1
3 1 1
1'
1!
12
11
2
2
2
2
1
1
1
1
1
1
1
1
1
]
1

2 3 2
3 2 2
2 2 '
n
'
!
1
2
1
1
'
!
1
2
1
1
'
1
2
1
'
1
1
'
1
1
i
i
i
i
i
i
i
i
i
i
i
i
i
i
2
2
2 2 2 2
2
2 2
%+ser)e que a primeira coluna de 7\7 * igual a soma das duas ultimas colunas, sendo,
portanto, as colunas de 7\7 linearmente dependentes. 9ssim, 7\7 no tem in)ersa ;nica e
conseqHentemente no e.istem estimadores ;nicos para os coeficientes da equao de regresso.
Dma maneira simples de contornar a singularidade de 7\7 * retirar uma das )ari)eis
indicadoras, como por e.emplo, U!. 9 retirada de uma )ari)el indicadora no * a ;nica soluo para o
pro+lema computacional, porem, ela * con)eniente por le)ar a interpretao simples dos par-metros
remanescentes no modelo.
7o caso geral, uma )ari)el qualitati)a com c classes pode ser representada por c C 1 )ari)eis
indicadoras, cada uma assumindo os )alores 3 ou 1.
4ari)eis indicadoras so tam+*m referenciadas como )ari)eis Rdumm`S ou )ari)eis
+inrias. % termo )ari)el +inria tem como origem o sistema num*rico +inrio, contendo apenas os
algarismos 3 e 1.
+(ter$reta8;o *o& $arCmetro& *a re"re&&;o
"onsiderando5se o e.emplo colocado nas sees anteriores, supon/a que a )ari)el indicadora
U! se8a retirada, de modo que o modelo ficaI
Vi Q 3U3i X 1U1i X 2U2i X i, onde
U2i Q 1 para empresas distri+uidoras de mercadorias e U2i Q 3 para outros casos.
9 funo de resposta JmediaL para o modelo *I
,JVL Q 3 X 1U1 X 2U2
126
2ara entender o significado dos par-metros deste modelo, considere primeiro o caso de
empresas de prestao de ser)ios, para as quais U2 Q 3 e a funo de resposta passa a serI
,JVL Q 3 X 1U1 X 2J3L Q 3 X 1U1
%+ser)a5se que a funo de resposta para firmas prestadoras de ser)ios * uma lin/a reta com
intercepto de V, 3 e inclinao, 1. ,sta funo de resposta * ilustrada na figura &.1.
,JVL
,JVL Q 3 X2 X 1U1 J(ist. de mercadoriasL
1
2
3 X2
1 ,JVL Q 3 X 1U1 J>er)iosL
3
Taman/o da empresa U1
:igura &.1 >ignificado dos par-metros do modelo de
regresso linear com )ari)el qualitati)a.
2ara as empresas de distri+uio de mercadorias U2 Q 1 e a funo de resposta *I
,JVL Q 3 X 1U1 X 2J1L Q J3 X 2L X 1U1
%+ser)a5se que para as empresas distri+uidoras de mercadorias a funo de resposta * tam+*m
uma lin/a reta com intercepto 3 X 2 e inclinao com V, 1. ,sta funo encontra5se tam+*m ilustrada
na figura &.1. ,sta figura ilustra tam+*m o significado dos par-metros do modelo de regresso linear
com uma )ari)el indicadora representando duas classes de uma )ari)el qualitati)a.
"onsiderando5se o e.emplo em curso, o+ser)a5se que para o modelo formulado, a m*dia do
tempo transcorrido at* a ino)ao ser adotada, ,JVL * uma funo linear do taman/o da empresa JU1L
com a mesma inclinao 1 para am+os os tipos de empresa. % par-metro 2 indica quanto * mais
ele)ada Jou mais +ai.aL a funo de resposta para as firmas de distri+uio de mercadorias em relao Zs
prestadoras de ser)ios, independente do taman/o da empresa. 9ssim, 2 mede o efeito diferencial do
tipo de empresa. ,m geral 2 mede quanto * mais alta Jou mais +ai.aL a lin/a m*dia de resposta para a
classe codificada como 1 em relao Z classe codificada como 3.
Dma questo o+)ia aqui seria, porque no a8ustar duas equaes de regresso linear simples,
uma para cada tipo de empresa o O duas raEes +sicas para o procedimento do modelo com )ari)el
indicadora. 2rimeiro o modelo assume a mesma inclinao e mesma distri+uio dos i[s para a cur)a
media de resposta nos dois tipos de empresas. % par-metro referente Z inclinao 1 pode ser estimado
con8untamente para os dois tipos de empresas. >egundo, outras inferncias referentes a 3 e 2 podem ser
feitas mais precisamente tra+al/ando com o modelo contendo a )ari)el indicadora, 8 que, e.iste mais
graus de li+erdade associados ao quadrado m*dio do erro. Tam+*m, o modelo com duas equaes de
regresso linear simples teria mais par-metros a estimar e conseqHentemente, mais erros de estimao
podem ser cometidos.
Exer3>3io 6.1
120
"onsidere os dados da ta+ela &.1, referentes a )elocidade de adoo de segurana em dois tipos
de empresasI (istri+uidoras de produtos e prestadoras de ser)ios. 9 )ari)el resposta V refere ao
numero de meses transcorridos desde quando a primeira empresa adotou a segurana. 9 )ari)el
independente U1 * o taman/o da empresa medida em termos das receitas totais e U2 * a )ari)el
qualitati)a a ser representada pela )ari)el indicadora.
Tabela 6.1 /a*o& refere(te& ao e&tu*o *e a*o8;o *e i(o@a8;o em &e"ura(8a (a*a$ta*o *e ,ETE- e
T4BBE-M4,< 1V74< $. 301).
,mpres
a
JiL
7o. de meses
JViL
Taman/o da
empresa JU1iL
Tipo de
empresa
JU2iL
1 16 1$1 >er)io
2 2& 12 >er)io
! 21 16$ >er)io
' !3 !1 >er)io
$ 22 13' >er)io
& 3 266 >er)io
6 12 213 >er)io
0 11 123 >er)io
1 ' 213 >er)io
13 1& 2!0 >er)io
11 20 1&' 2roduto
12 1$ 262 2roduto
1! 11 21$ 2roduto
1' !0 &0 2roduto
1$ !1 0$ 2roduto
1& 21 22' 2roduto
16 23 1&& 2roduto
10 1! !3$ 2roduto
11 !3 12' 2roduto
23 1' 2'& 2roduto
98ustar aos dados um modelo de regresso linear com )ari)el indicadora, apresentando as estimati)as e
testes de /ip#teses para todos os par-metros, +em como, um inter)alo a 1$Y de confiana para 2.
Ilustre graficamente o modelo a8ustado e os )alores o+ser)ados. 9presente uma discusso simplificada
da analise dos resduos.
6.2 Mo*elo 3om efeito *e i(tera8;o
7o e.emplo tratado na seo &.1 en)ol)endo o efeito do tipo e taman/o de empresas na
)elocidade de adoo de ino)ao de segurana, pode ser de interesse a)aliar se / interao entre tipo e
taman/o das empresas. ,m+ora uma das )ari)eis independentes do modelo de regresso se8a
qualitati)a, o efeito de interao * introduEido no modelo na maneira usual, ou se8a, incluindo o termo
do produto das )ari)eis. % modelo de regresso linear para o e.emplo em curso com interao entre as
)ari)eis independentes pode ser escrito comoI
Vi Q 3U3i X 1U1i X 2U2i X 12 U1iU2i X i, cu8a funo de resposta *I
,JVL Q 3 X 1U1 X 2U2 X 12 U1U2
Bi"(ifi3a*o *o& $arCmetro& *a re"re&&;o
"onsiderando5se o e.emplo em curso, o significado dos par-metros no modelo de regresso
com interao so mel/or entendidos e.aminando a natureEa da funo de resposta para cada tipo de
empresa. 2ara empresas de prestao de ser)ios, U2 Q 3, logo, U1U2 Q 3. 9 funo de resposta para este
tipo de empresa * portantoI
121
,JVL Q 3 X 1U1 X 2J3L X 12 J3L Q 3 X 1U1
,sta funo * ilustrada na figura &.2. 7ote que o intercepto de V * 3 e a inclinao, 1. 2ara as
empresas distri+uidoras de produtos, U2 Q 1, logo, U1U2 Q U1. 9 funo de resposta para este tipo de
empresa * da formaI
,JVL Q 3 X 1U1 X 2J1L X 12U1 Q J3 X 2L X J1 X 12LU1.
,sta funo de resposta encontra5se tam+*m ilustrada na figura &.2, onde pode ser o+ser)ado
que a funo de resposta para este tipo de empresa * tam+*m linear com intercepto 3 X 2 e inclinao
1 X 12. "laramente 2 indica quanto maior Jou menorL * o intercepto de V para a classe codificada
como 1 em ralao Z classe codificada como 3 e, similarmente 12 indica quanto maior Jou menorL * a
inclinao da funo de resposta da classe codificada como 1 em ralao Z codificada como 3. 2elo fato
de am+os, intercepto e inclinao diferirem nas duas classes da )ari)el indicadora do modelo, no *
mais )erdade que 2 indica quanto mais alto Jou mais +ai.oL uma lin/a de resposta em ralao Z outra.
9 figura &.2 e)idencia que o efeito do tipo de empresa depende do taman/o da empresa. (e acordo com
aquela figura, pequenas empresas prestadoras de ser)ios tendem a ino)ar mais rapidamente, porem,
grandes empresas )endedoras de produtos tendem a ino)ar tam+*m mais rapidamente. 9ssim, na
presena do efeito de interao, o efeito da )ari)el quantitati)a de)e ser in)estigado comparando as
funes de resposta nas duas classes da )ari)el qualitati)a.
,JVL
,JVLQJ3X2LXJ1X12LU1
J(ist. de mercadoriasL

2
1X12
3X2
1 ,JVLQ3X1U1J>er)iosL
3
Taman/o da empresa U1
:igura &.2 >ignificado dos par-metros do modelo de
regresso linear com )ari)el qualitati)a e
termo de interao.
9 figura &.! ilustra outra possi+ilidade de modelo com efeito de interao onde empresas
prestadoras de ser)ios tendem a ino)ar mais rapidamente do que as re)endedoras de produtos para
todos os taman/os de empresas, na a+rangncia do modelo, porem, o efeito diferencial * muito maior
para pequenas empresas.
Exer3>3io 6.2
"onsidere os dados do e.erccio &.1 porem introduEindo o termo para o efeito de interao no
modelo. 9presente o modelo a8ustado aos dados e testes de /ip#teses de interesse. (iscuta os resultados.
1!3
,JVL
(ist. de mercadorias

>er)ios
Taman/o da empresa U1
:igura &.! Modelo de regresso linear com )ari)el qualitati)a e
efeito de interao.
'ome(t5rio&
98ustar o modelo com )ari)el indicadora e termo de interao produE os mesmos resultados
que a8ustar regresses separadas para cada tipo de empresa. 2orem, uma )antagem do modelo com
)ari)el indicadora * que uma ;nica e.ecuo da analise produE am+os os tipos de regresso a8ustada,
ou se8a, com e sem o termo de interao Jestimati)as dos par-metrosL. %+ser)e os resultados dos
e.erccios &.1 e &.2. %utra )antagem * que testes para comparar equaes de regresso para diferentes
classes da )ari)el qualitati)a podem ser claramente )istos como testes para os coeficientes de regresso
so+ a teoria do modelo linear geral. 2or e.emplo, a figura &.2 mostra claramente que para o e.emplo
aqui tratado, testar se as duas equaes de regresso tm a mesma inclinao * equi)alente a testarI
O3I 12 Q 3 )ersus OaI 12 3
>imilarmente, testar se as equaes de regresso para os dois tipos de empresas so idnticas,
equi)ale a testarI
O3I 2 Q 12 Q 3 )ersus OaI 7o O3.
,ste ultimo teste de /ip#teses so+re os par-metros do modelo en)ol)endo )ari)el indicadora e
interao * a +ase para a comparao de duas lin/as de regresso. 98ustar um modelo completo *
equi)alente a a8ustar regresses separadas para cada classe da )ari)el indicadora. >e 2 Q 12 Q 3, o
modelo reduEido consiste de uma lin/a de regresso comum Zs duas classes da )ari)el indicadora.
Dari5@ei& =ualitati@a& 3om mai& *e *ua& 3la&&e&
>e uma )ari)el qualitati)a independente tem mais de duas classes, )ari)eis indicadoras
adicionais so requeridas no modelo de regresso. "onsidere a regresso do desgaste Jou tempo de uso,
)ida ;til, etc.L de uma ferramenta JVL so+re a )elocidade de operao da ferramenta JU1L e o modelo
JtipoL da ferramenta, classificado como M1, M2, M! e M'. _ que a )ari)el qualitati)a tem quatro classes
Jtipo de ferramentaL, ser necessrio incluir no modelo de regresso trs )ari)eis indicadoras que
podem ser definidas comoI
U2 Q 1 se a ferramenta * do tipo M1 e U2 Q 3 em outros casos
U! Q 1 se a ferramenta * do tipo M2 e U! Q 3 em outros casos
U' Q 1 se a ferramenta * do tipo M! e U' Q 3 em outros casos
1!1
% modelo de regresso linear Jou modelo de primeira ordemL para este caso pode ser escrito
comoI
Vi Q 3U3i X 1U1i X 2U2i X ! U!i X 'U'i X i
9 entrada dos dados na matriE U deste modelo pode ser feita da seguinte formaI
Tipo de
ferramenta
U3 U1 U2 U! U'
M1 1 U1i 1 3 3
M2 1 U1i 3 1 3
M! 1 U1i 3 3 1
M' 1 U1i 3 3 3
9 funo de resposta para o modelo *I
,JVL Q 3U3 X 1U1 X 2U2 X ! U! X 'U'
2ara interpretao do significado dos par-metros da regresso considere a funo de resposta
para cada tipo de ferramenta, ou se8a, paraI
Tipo M', U2 Q U! Q U' Q 3I ,JVL Q 3 X 1U1
Tipo M1, U2 Q 1, U! Q U' Q 3I ,JVL Q J3 X 2LX 1U1
Tipo M2, U! Q 1, U2 Q U' Q 3I ,JVL Q J3 X !LX 1U1
Tipo M!, U' Q 1, U2 Q U! Q 3I ,JVL Q J3 X 'LX 1U1
7aturalmente, a funo de resposta do modelo de regresso geral Jpara todos os tipos de
ferramentaL assume que a regresso do uso da ferramenta em funo da )elocidade * linear, com a
mesma inclinao, para todos os tipos de ferramenta. <eometricamente, os coeficientes 2, ! e '
indicam respecti)amente, quanto mais altas Jou mais +ai.asL so as funes de resposta para os tipos M1,
M2 e M!, em relao a funo de resposta do tipo de ferramenta M'. 9ssim, geometricamente, 2, ! e '
medem os efeitos diferenciais das classes da )ari)el qualitati)a na altura das funes de resposta,
sempre tomando como +ase para comparao a classe para a qual U2 Q U! Q U' Q 3. 9 figura &.' ilustra
um poss)el arran8o destas funes de resposta.
,JVL
,JVLQJ3X'LX1U1 JM!L

,JVLQJ3X!LX1U1 JM2L
'
! ,JVLQ3X1U1 JM'L
,JVLQJ3X2LX1U1 M1
2
3
4elocidade da ferramenta U1
:igura &.' Modelo de regresso linear com )ari)el qualitati)a
com ' n)eis.
1!2
7o caso do modelo de regresso com uma )ari)el qualitati)a com mais de dois n)eis JclassesL
pode ser de interesse estimar e testar /ip#teses so+re outros efeitos diferenciais. 7o e.emplo de
)elocidade e uso da ferramenta pode ser que o interesse se8a estimar efeitos diferenciais entre M1, M2 e
M! contra M'. 2or e.emplo, ' 5 ! Q ,JVM!L C ,JVM2L mede quanto mais alto Jou mais +ai.oL * a funo
de resposta para M! em ralao a funo de resposta de M2. % estimador pontual desta quantidade *
! '
^ ^
e a estimati)a da )ari-ncia deste estimador *I
L
^
,
^
J 2
' !
2
^
2
^
2
L
^ ^
J
! ' ! '


Cov : : : +

9s estimati)as das )ari-ncias e co)ari-ncias necessrias so o+tidas da matriE de )ari-ncias e


co)ari-ncias das estimati)as dos par-metros do modelo de regresso, ou se8a,
2 1 2
^
L j J : 2 2 :

Modelo de regresso linear com uma )ari)el qualitati)a a mais de dois n)eis e interao
7o e.emplo tratado na seo anterior, se efeitos de interao entre )elocidade e tipo da
ferramenta esto presentes, o modelo passa a ser e.presso na seguinte formaI
Vi Q 3U3i X 1U1i X 2U2i X ! U!i X 'U'i X 12U1iU2i X 1!U1iU!i X 1'U1iU'i X i
9s funes de resposta deste modelo de regresso para os quatro tipos de ferramentas so as
seguintesI
Tipo M', U2 Q U! Q U' Q 3I ,JVL Q 3 X 1U1
Tipo M1, U2 Q 1, U! Q U' Q 3I ,JVL Q J3 X 2LX J1X12 LU1
Tipo M2, U! Q 1, U2 Q U' Q 3I ,JVL Q J3 X !LX J1X1! L U1
Tipo M!, U' Q 1, U2 Q U! Q 3I ,JVL Q J3 X 'LX J1X1' L U1
7esta formulao do modelo, o teste de /ip#teses O3I 2 Q 12 Q 3 )ersus OaI no O3 * equi)alente
a testar se os tipos de ferramenta M1 e M' tem a mesma equao. >imilarmente, o teste de /ip#teses O3I
12 Q 1! Q 3 )ersus OaI no O3 equi)ale a testar se os tipos de ferramenta M1 e M2 tem lin/as de
respostas paralelas.
7o modelo com interao do e.emplo em curso, o+ser)a5se que cada tipo de ferramenta tem sua
lin/a de regresso com possi)elmente diferentes interceptos e inclinaes.
Mo*elo& 3om mai& *e uma @ari5@el =ualitati@a i(*e$e(*e(te
Modelos podem ser prontamente construdos para casos de duas ou mais )ari)eis
independentes qualitati)as. "onsidere como um e.emplo a regresso de )endas JVL em funo das
despesas com comerciais JU1L, o tipo de empresa Jprestao de ser)ios e )enda de produtosL e qualidade
do gerenciamento das )endas Jalta e +ai.aL. 9s )ari)eis indicadoras para este e.emplo podem ser
definidas comoI
U2 Q 1 para empresas prestadoras de ser)ios e U2 Q 3 em outros casos
U! Q 1 para alta qualidade de gerenciamento de )endas e U! Q 3 em outros casos
% modelo de primeira ordem Jregresso linearL para este e.emplo pode ser escrito comoI
Vi Q 3U3i X 1U1i X 2U2i X ! U!i X i
1!!
,ste modelo implica que a funo de resposta para )endas em funo de despesas com
comerciais * linear e com a mesma inclinao para todos os tipos de empresas e qualidade de
gerenciamento das )endas Jcom+inaesL. %s par-metros 2 e ! indicam o efeito diferencial aditi)o do
tipo de empresa e qualidade de gerenciamento das )endas na altura Jrepresentao geom*tricaL das
lin/as de resposta.
7este e.emplo * poss)el se pensar no modelo de regresso linear com efeito de interao entre
pares de )ari)eis independentes. Dma poss)el e.presso do modelo com interao *I
Vi Q 3 X 1U1i X 2U2i X ! U!i X 12U1iU2i X 1!U1iU!i X 2!U2iU!i X i
9s funes de respostas para este modelo soI
Tipo de
empres
a
Gualidade de
gerenciament
o
:uno de resposta
>er)io 9lta ,JVLQJ3X2X!X2!LXJ1X12X1!LU1
2roduto 9lta ,JVLQJ3X!LXJ1X1!LU1
>er)io Aai.a ,JVLQJ3X2LXJ1X12LU1
2roduto Aai.a ,JVLQ3X1U1
%+ser)a5se neste modelo que, no apenas todas as funes de respostas so diferentes para as
diferentes com+inaes de tipo de empresa e qualidade do gerenciamento, como tam+*m, os efeitos
diferenciais de uma )ari)el qualitati)a no intercepto, depende da classe da outra )ari)el qualitati)a.
2or e.emplo, em +ai.a qualidade de gerenciamento, quando se mo)e de empresas de )enda de produtos
para empresas de ser)ios, o intercepto muda de 2. 2or*m, em alta qualidade de gerenciamento, quando
se mo)e de empresas de )enda de produtos para empresas de ser)ios, o intercepto muda de 2 X 2!.
Modelos de regresso contendo apenas )ari)eis independentes qualitati)as podem tam+*m ser
construdos. "om referencia ao e.emplo anterior, pode5se esta+elecer a regresso de )endas apenas em
funo do tipo de empresa e da qualidade do gerenciamento. % modelo ento seria escrito comoI
Vi Q 3 X 2U2i X ! U!i X i, com U2 e ! U! definidos anteriormente.
Modelos em que todas as )ari)eis independentes so qualitati)as so c/amados modelos de
analise de )ari-ncia. Modelos contendo )ari)eis independentes qualitati)as e quantitati)as so
denominados modelos de co)ari-ncia. <eralmente, nos modelos de co)ari-ncia a )ari)el independente
principal de interesse * a qualitati)a e uma ou mais )ari)eis quantitati)as so introduEidas no modelo
com o o+8eti)o especifico da reduEir a )ari-ncia dos termos do erro.
6.3 Dari5@el i(*i3a*ora *e$e(*e(te
,m muitas aplicaes a )ari)el dependente de interesse assume apenas dois poss)eis
resultados, podendo, portanto, ser representada por uma )ari)el indicadora assumindo os )alores 3 ou
1. "onsidere como e.emplo uma analise da situao de grandes empresas de neg#cios ter ou no um
departamento de relaes industriais em funo do taman/o da empresa. 9 )ari)el dependente neste
caso pode ser definida para assumir apenas dois )aloresI 9 empresa tem ou no tem um departamento de
relaes industriais que podem ser codificados como 3 e 1 respecti)amente.
"omo outro e.emplo, considere um estudo da participao da forca de tra+al/o das esposas em
funo da idade, do numero de fil/os e da renda familiar. 7este caso a )ari)el dependente V pode ser
definida para ter dois poss)eis )alores como, esposa na forca de tra+al/o e fora da forca de tra+al/o que
podem ser codificados como 1 e 3, respecti)amente.
7a )erdade e.iste uma ampla )ariedade de aplicaes em que a )ari)el dependente *
dicotFmica e portanto, pode ser representada por uma )ari)el indicadora. Dma )ari)el dependente
dicotFmica assumindo )alores 3 e 1 * as )eEes referida na literatura como resposta qu-ntica ou resposta
+inria.
2 &i"(ifi3a*o *a fu(8;o *e re&$o&ta *e uma @ari5@el *e$e(*e(te bi(5ria
"onsidere o seguinte modelo de regresso linear simplesI
1!'
Vi Q 3 X 1Ui X i, com Vi assumindo os )alores 3 ou 1, ou se8a resposta +inria.
7este caso o )alor esperado da )ari)el resposta, ,JVL, tem um significado especial. (esde que
,JiL Q 3, segue que ,JViL Q 3 X 1Ui. "onsidere agora Vi como uma )ari)el aleat#ria com distri+uio
de Aernoulli para a qual pode5se esta+elecer a seguinte distri+uioI
Vi 2ro+a+ilidade
3 2JVi Q 3L Q 1 C pi Q
qi
1 2JVi Q 1L Q pi
2elo conceito de )alor esperado, segue queI ,JViL Q 3JqiL X 1JpiL Q pi, ou se8a,
3 X 1Ui Q pi.
9ssim, a resposta m*dia ,JViL Q 3 X 1Ui, conforme dada pela funo de resposta * a
pro+a+ilidade de Vi Q 1, quando o n)el da )ari)el independente * Ui. ,sta interpretao da resposta
media aplica5se quando a funo de resposta * uma regresso linear simples ou m;ltipla. 9 resposta
media quando a )ari)el dependente * uma )ari)el indicadora, representa a pro+a+ilidade de V assumir
o )alor 1, para dados n)eis das )ari)eis independentes. 9 figura &.$ ilustra a funo de resposta de
uma regresso linear simples com )ari)el dependente indicadora. 9 )ari)el indicadora V
,JVL
15
,JViLQ3X1U
3
Taman/o da empresa U
:igura &.$ funo de resposta de uma )ari)el indicadora dependente.
representa o fato de uma empresa possuir ou no um departamento de relaes industriais e a )ari)el
independente U * o taman/o da empresa. 9 funo de resposta da figura &.$ mostra a pro+a+ilidade de
empresas de um dado taman/o ten/a um departamento de relaes industriais.
!roblema& *e3orre(te& *e @ari5@ei& i(*i3a*ora& *e$e(*e(te&
InfeliEmente, pro+lemas especiais surgem quando a )ari)el dependente * uma )ari)el +inria.
Trs destes pro+lemas sero considerados a seguir, utiliEando o modelo de regresso linear simples como
ilustrao.
1. 7o normalidade dos termos do erro.
%s termos do erro, i, Q Vi C J3 X 1UiL podem assumir apenas dois )aloresI
Vi Q 1I i, Q 1 C J3 X 1UiL e Vi Q 3I i, Q C 3 5 1Ui
"laramente, a pressuposio de normalidade dos termos do erro no pode ser adotada neste
caso.
2. 4ari-ncia dos erros no constante
1!$
Dm outro pro+lema com os termos do erro, i, * que eles no tm a mesma )ari-ncia, quando a
)ari)el dependente * uma )ari)el indicadora. 2ara o modelo de regresso linear simples, o+ser)a5se
queI

2
V Q ,]V C ,JVL\
2
Q J1 5 pL
2
p X J3 5 pL
2
J1 C pL Q pJ1 C pL Q ],JVL\]1 C ,JVL\.
9 )ari-ncia de i * a mesma de Vi, 8 que i Q Vi C pi e pi * uma constante. 9ssim,

2
i Q piJ1 C piL Q ],JViL\]1 C ,JViL\. %u ainda

2
i Q J3 X 1UiL] 1 C J3 X 1UiL\
%+ser)e que
2
i depende de Ui e portanto difere a cada n)el de U, logo mnimos quadrados
ordinrios no produEem mais estimadores #timos.
!. Restries na funo de resposta
(esde que a funo de resposta representa pro+a+ilidades quando a )ari)el dependente e
indicadora, as respostas medias de)em ser restritas ao seguinteI
3 ,JVL Q p 1
Muitas funes de respostas no possuem automaticamente esta restrio. 9 funo de resposta
linear, por e.emplo, pode cair fora destes limites dentro da amplitude da )ari)el independente na
a+rangncia do modelo.
%s trs pro+lemas acima mencionados criam dificuldades, mas solues podem ser encontradas.
% caso de )ari-ncia /eterognea pode ser contornado, usando mnimos quadrados ponderados ou a
teoria dos modelos lineares generaliEados. % caso das restries na funo de resposta pode ser
contornado assegurando que a funo do modelo a8ustado no caia a+ai.o de Eero ou acima de um para
os n)eis de U dentro da a+rangncia do modelo, ou usando um modelo que automaticamente atenda a
estas restries.
:inalmente, em+ora os termos do erro no so normalmente distri+udos quando a )ari)el
resposta g[e uma )ari)el indicadora, o m*todo dos mnimos quadrados fornecem estimadores no
tendenciosos que, so+ condies gerais so assintoticamente normais. 2ortanto, para grandes amostras,
inferncias so+re os coeficientes da resposta media pode ser feita assumindo que os erros so
normalmente distri+udos.
Dm e.emplo de regresso linear com )ari)el resposta indicadora J7,T,R, p. !2'L
Dma in)estigao de pequena escala foi e.ecutada para estudar a relao entre a e.perincia de
um programador de computador e sua /a+ilidade para completar uma comple.a tarefa de programao
dentro de um tempo especificado. 4inte e cinco programadores foram selecionados para o estudo. ,les
tin/am )ariada e.perincia em programao Jmedida em meses de e.perinciaL, conforme mostrado na
ta+ela seguinte
Indi)idu
o
JiL
Meses de
e.perincia
JUiL
>ucesso na e.ecuo
da tarefa JViL
1 1' 3
2 21 3
! & 3
' 2$ 1
$ 10 1
& ' 3
6 10 3
0 12 3
1 22 1
13 & 3
1!&
11 !3 1
12 11 3
1! !3 1
1' $ 3
1$ 23 1
1& 1! 3
16 1 3
10 !2 1
11 2' 3
23 1! 1
21 11 3
22 ' 3
2! 20 1
2' 22 1
2$ 0 1
9 cada participante foi atri+uda a mesma tarefa de programao e os resultados do sucesso na e.ecuo
da tarefa codificados como so apresentados na ta+ela tratado como )ari)el resposta. Guando a tarefa
foi completada com sucesso no tempo estipulado V toma o )alor 1, caso contrario, o )alor 3.
aL 98uste o modelo de regresso linear simples aos dados da ta+ela anterior e ilustre graficamente
os )alores o+ser)ados e a lin/a de resposta a8ustada, usando mnimos quadrados ordinrios.
"omente os resultados.
+L 98uste o modelo de regresso linear simples usando mnimos quadrados ponderados. "omente
os resultados da analise comparando5a com o item a.
6.4 4 fu(8;o *e re&$o&ta lo">&ti3a
Muitas )eEes consideraes te#ricas ou empricas sugerem que quando a )ari)el dependente *
uma )ari)el indicadora, a forma da funo de resposta pode ser cur)ilnea. 9 figura &.& ilustra uma
funo de resposta cur)ilnea, que pode ser apropriada para muitas situaes en)ol)endo )ari)el
dependente +inria. %+ser)e que
,JVL
1.35
3.$ 5
3.3
$3 133 1$3 U
:igura &.& Ilustrao de uma funo de resposta logstica.
a funo de resposta tem assintotas em 3 e 1, o que automaticamente satisfaE a restrio
3 ,JVL 1
9 funo de resposta ilustrada na figura &.& * denominada funo logstica e pode ser escrita comoI
L e.pJ 1
L e.pJ
L J
1 3
1 3
2
2
1 E


+ +
+

1!6
Dma importante propriedade da funo logstica * que ela pode ser facilmente lineariEada.
"onsidere ,JVL Q p 8 que a resposta media * a pro+a+ilidade quando a )ari)el dependente *
indicadora. ,nto, se for feita a transformao p[ Q ln]pKJ15pL\, o+ser)a5se que p[ Q 3 X 1U. ,sta
transformao * c/amada logstica ou transformao logit.
2 aIu&te *a fu(8;o lo">&ti3a
% a8uste da funo logstica transformada * relati)amente simples quando se tem o+ser)aes
repetidas a cada )alor de U. 9 seguir sero apresentados alguns e.emplos de regresso logstica que
aparecem na pratica.
1 C >upon/a um e.perimento com preo que en)ol)e a apresentao e informao so+re um no)o
produto aos consumidores e a cada consumidor * perguntado se ele compraria aquele produto a um dado
preo. "inco preos, por e.emplo, podem ser estudados, e o produto seria e.posto a n pessoas a cada
n)el de preo. 9 )ari)el dependente * +inria Jcompra ou no compra o produtoL. 9 )ari)el
independente * o preo e tem cinco n)eis.
2 C 9 '33 consumidores * solicitado indicarem numa escala de 1 a 13 pontos seus interesses em comprar
um carro no)o nos pr#.imos 12 meses. Dm ano depois cada consumidor * entre)istado no)amente para
sa+er se ele comprou ou no um carro no)o. 9 )ari)el dependente * +inria Jcomprou ou noL e a
)ari)el independente * a medida da inteno de comprar um carro no)o e tem 13 classes.
2ara o a8uste de uma funo de resposta logstica, considere os n)eis de U aos quais
o+ser)aes so tomadas como U1, U2, ... , Uc. % numero de o+ser)aes a cada n)el U8 sera denotado
por n8 J8 Q 1, 2, ... , cL. 2ode ser demonstrado que ser necessrio considerar apenas o numero de 1[s a
cada n)el de U e no os )alores indi)iduais de V. >e8a R8 o numero de 1[s a cada n)el U8. 9ssim, a
proporo de 1[s no n)el U8 denotado por
B
+
*I
B
B
B
n
G
+
9 ta+ela &.'.1 seguinte contem )alores de U8, n8, R8 e
B
+
, para um e.emplo em que U8 refere5se a
reduo no preo oferecida por um cupom, n8 * o numero de clientes que rece+eram o cupom com a
reduo de preo, R8 * o numero de clientes que usaram o cupom e
B
+
* a proporo de clientes que
rece+eram e utiliEaram o cupom com a reduo de preo U8.
Ta+ela &.'.1 (ados referentes a eficincia do uso de cupons
Reduo no
preo JU8L
7umero de
consumidores
Jn8L
7umero de
usados JR8L
B
+
B
+j
B
F^
$ 233 !2 3.1&
3
5
1.&$0
2&.00
13 233 $1 3.2$
$
5
1.362
!0.33
1$ 233 63 3.!$
3
5
3.&11
'$.$3
23 233 13! 3.$1
$
3.3&3 $3.33
!3 233 1'0 3.6'
3
1.3'& !0.'0
:oi efetuada a transformao logstica da funo de resposta p[ Q 3 X 1U atra)*s da transformao
logstica das propores amostraisI

,
_

B
B
B
+
+
+
1
ln j e considerou5se
B
+j
como a )ari)el dependente.
1!0
9 transformao logstica lineariEa a funo de resposta, porem, no elimina a /eterogeneidade
de )ari-ncia dos termos do erro. 2ortanto, mnimos quadrados ponderados de)em ser usados. 2ode5se
demonstrar que quando os n8 so raEoa)elmente grandes a )ari-ncia apro.imada de
B
+j
* 1K]n8p8J1 5
p8L\ que pode ser estimada por 1K]n8 B
+
J1 5
B
+
L\. 9ssim, os pesos estimados a serem usados no calculo
dos mnimos quadrados ponderados soI
L 1 J ^
B B B B
+ + n F
.
, importante ressaltar que os pesos estimados requerem taman/os de amostras n8,
raEoa)elmente grandes.
% a8ustamento do modelo de regresso linear com )ari)el independente U e )ari)el
dependente
B
+j
usando mnimos quadrados ponderados * direto. Dma )eE que a funo de resposta
a8ustada ten/a sido o+tida, 2 - - +
1 3
j ^ + , ela pode ser transformada de )olta a foram original
faEendo
L e.pJ 1
L e.pJ
^
1 3
1 3
2 - -
2 - -
+
+ +
+

Exer3>3io *e a$li3a8;o
98ustar o modelo de regresso logstica aos dados da ta+ela &.'.1 e estimar a pro+a+ilidade de um cupom
ser usado, para reduo no preo de 2$ unidades monetrias.
Bolu8;o
% sistema de equaes normais para os mnimos quadrados ponderados *I
?8 B
+j
Q +3?8 X +1?8U8
?8U8 B
+j
Q +3?8U8 X +1?8U8
2
ou em notao matricial 7WT7b Q 7WTR. % modelo a8ustado fica
2 - - +
1 3
j ^ + Q 52.1013& X 3.1306U
2ara U Q 2$ tem5se
$!2'' . 3 L 2$ J 1306 . 3 1013& . 2 j ^ + + ,
&! . 3 ^ 63!30 . 1 L $!2'' . 3 e.pJ L j ^ e.pJ
^ 1
^

+ +
+
+
9 interpretao da inclinao +1 Q 3.1306 na funo de resposta logstica no * simples, em
decorrncia do efeito do incremento de U de uma unidade, )ariar para o modelo logstico, de acordo com
a locao do ponto. Dma interpretao de +1 * encontrada na propriedade da funo logstica de que a
raEo de pro+a+ilidade Jodds ratioL
+
+
^ 1
^

* multiplicada por e.pJ+1L para qualquer incremento


unitrio de U. 2or e.emplo, para U Q 2& tem5se &'11' . 3 L 2& J 1306 . 3 1013& . 2 j ^ + + , logo,
+
+
^ 1
^

Qe.pJ3.&'11'L Q 1.010&'' 1.63!30 e.pJ3.1306L.


6.N 2utro& u&o& *e @ari5@ei& i(*i3a*ora& i(*e$e(*e(te&
Regresso linear em diferentes estgios J2iece?aseL
1!1
9lgumas )eEes a regresso de V em U segue uma diferentes relaes lineares em diferentes
amplitudes de U. 2or e.emplo, o custo unitrio de produo, V de um dado item em funo do taman/o
do lote produEido U pode seguir uma certa relao linear at* Up Q $33 e, ap#s este ponto a inclinao
pode mudar de)ido a uma eficincia operacional poss)el apenas para lotes maiores do que $33. 9 figura
&.6 ilustra esta situao.
V Q "usto unitrio



3 Up Q $33 U
Taman/o do lote
:igura &.6 Ilustrao de uma regresso linear em dois estgios.
>er considerado agora como )ari)eis indicadoras podem ser usadas para a8ustar uma
regresso linear em dois estgios. "onsidere o caso em que Up, o ponto onde ocorre mudana de
inclinao se8a con/ecido. ,nto, o modelo pode ser escrito comoI
Vi Q 3 X 1U1i X 2JU1i C UpLU2i X i
%u para Up Q $33, Vi Q 3 X 1U1i X 2JU1i C $33LU2i X i onde U1 * uma )ari)el quantitati)a e U2 uma
)ari)el indicadora definida comoI
U2i Q 1 se U1i c Up J ou U1i c $33L
Q 3 se U1i Up J ou U1i $33L
2ara )erificar que o modelo acima fornece uma regresso linear em dois estgios considere a
funo de resposta
,JVL Q 3 X 1U1 X 2JU1 C UpLU2
Guando U1 Up, U2 Q 3 de modo que a funo de resposta ficaI ,JVL Q 3 X 1U1.
2or outro lado quando U1 c Up, U2 Q 1 e a funo de resposta passa a serI
,JVL Q J3 5 2UpL X J1 X 2LU1
9ssim, 1 e 1 X 2 so as inclinaes e 3 e J3 5 2UpL so os interceptos de V das duas lin/as
de regresso. ,stes par-metros esto ilustrados na figura &.0.
V

52Up
1
1
3 1X2
1'3
1
3 Up U
:igura &.0 >ignificado dos par-metros no modelo de regresso linear em
dois estgios.
,.erccio
"onsidere os dados da ta+ela seguinte referentes a custos unitrios JVL de produo de um item
e taman/o do lote produEido JUL. T sa+ido que a funcao de resposta muda de inclinao no ponto Up Q
$33.
Note JiL
"usto
unitrio
JViL
Taman/o
do lote JUiL
Note JiL
"usto
unitrio
JViL
Taman/o
do lote JUiL
1 2.$6 &$3 $ '.6$ !33
2 '.'3 !'3 & !.$$ $63
! '.$2 '33 6 2.'1 623
' 1.!1 033 0 !.66 '03
,scre)a a matriE 7 do modelo de regresso linear em dois estgios referentes aos dados da ta+ela
anterior. 9presente e interprete as estimati)as dos par-metros do modelo.
%+ser)aoI
4 exte(&;o $ara mo*elo& *e re"re&&;o li(ear 3om mai& *e *oi& e&t5"io& E *ireta. !or
exem$lo< &e a& mu*a(8a& *e i(3li(a8;o *a re"re&&;o li(ear *o exem$lo a(terior o3orrer (o& $o(to&
7 K N00 e 7 K U00 (tama(#o *e lote) o mo*elo &eria:
Vi Q 3 X 1U1i X 2JU1i C $33LU2i X !JU1i C 033LU!i X i, onde
U1i Q taman/o do lote
U2i Q 1 se U1 c $33 U!i Q 1 se U1 c 033
Q 3 em outros casos Q 3 em outros casos
/e&3o(ti(ui*a*e (a fu(8;o *e re"re&&;o
9lgumas )eEes a funo de regresso linear pode apresentar no apenas mudana na inclinao
num certo ponto Up, como tam+*m um salto neste ponto. 9 figura &.1 ilustra este caso. Dma outra
)ari)el indicadora de)e ser introduEida no
V


52UpX! ! ,JVLQJ35Up2X!LXJ1X2LU1


,JVLQ3X1U1
3

3 Up U
:igura &.1 Ilustrao de um modelo de regresso linear em
dois estgios, descontinua.
1'1
modelo para cuidar da descontinuidade JsaltoL. >upon/a que o tempo requerido para soluo +em
sucedida de uma tarefa JVL possa ser relacionado com a comple.idade da tarefa JUL, quando a
comple.idade * medida numa escala quantitati)a de 3 a 133. T con/ecido que a inclinao da lin/a de
resposta muda em Up, e suspeita5se que a relao de regresso se8a descontinua neste ponto. ,nto o
modelo pode ser escrito comoI
Vi Q 3 X 1U1i X 2JU1i C UpLU2i X !U!i X i
%nde U1i * a comple.idade da tarefa e, U2i e U!i so )ari)eis indicadoras definidas comoI
U2i Q 1 se U1 c Up U!i Q 1 se U1 c Up
Q 3 em outros casos Q 3 em outros casos
9 funo de resposta para este modelo *I
,JVL Q 3 X 1U1 X 2JU1 C UpLU2 X !U!
Guando U1 Up, U2 Q U! Q 3 e a funo de resposta torna5se
,JVL Q 3 X 1U1
2ara U1 c Up, U2 Q U! Q 1 e a funo de resposta *I
,JVL Q J3 X 2Up X !L X J1 X 2LU1
,stas duas funes de resposta so mostradas na figura &.1 8untamente com a interpretao dos
par-metros en)ol)idos. %+ser)a5se que ! representa a diferena na m*dia da )ari)el resposta para as
duas lin/as de regresso, no ponto Up e 2 representa a diferena entre as inclinaes. 9 estimati)a dos
par-metros no apresenta nen/uma no)idade JdificuldadeL. 7o caso anteriormente referido, pode5se
testar a /ip#tese ! Q 3 da maneira usual. >e for concludo ! Q 3 a funo de regresso * continua no
ponto Up, de modo que o caso tri)ial da regresso em m;ltiplos estgios pode ser aplicado.
4$li3a89e& *e @ari5@ei& i(*i3a*ora& a &Erie& tem$orai&
,conomistas e analistas de mercado freqHentemente usam dados de s*ries temporais em analise
de regresso. 2or e.emplo, poupana JVL em funo de renda JUL, em que am+as as )ari)eis so
medidas em n perodos Janos, ms, etc.L. % modelo empregado pode ser escrito comoI
Vt Q 3 X 1U1t X t t Q 1, 2, ..., n
onde Vt e Ut so poupanas e rendas respecti)amente para o perodo Jano, ms, etc.L t. >upon/a que o
perodo de o+ser)ao cu+ra anos de guerra e anos normais e que este aspecto de)e ser considerado
porque * sa+ido a priori que poupana em anos de guerra * mais ele)ada. % seguinte modelo pode ser
ento mais apropriadoI
Vt Q 3 X 1U1t X 2U2t X t
onde U1 representa a renda e U2 * uma )ari)el indicadora definida comoI
U2 Q 1 se o perodo t * normal
Q 3 se o perodo t * de guerra
%+ser)e que o modelo acima assume que a prosperidade marginal de poupana J1L * constante para
am+os os perodos e que apenas a altura da cur)a de resposta * afetada pela )ari)el qualitati)a.
Dma outra aplicao de )ari)eis indicadoras em series temporais * quando dados mensais ou
quadrimestrais esto sendo modelados. >upon/a que se8a de interesse esta+elecer um modelo de
1'2
regresso entre )endas quadrimestrais JVL, despesas com comerciais JU1L e renda pessoal dispon)el
JU2L, tam+*m quadrimestrais. >e efeito saEonal tem influencia em )endas quadrimestrais, um modelo de
regresso linear incorporando este efeito pode ser escrito comoI
Vt Q 3 X 1U1t X 2U2t X !U!t X 'U't X $U$t X t
onde
U! Q 1 se o perodo t * o 1
o
. quadrimestre
Q 3 em outros casosP
U' Q 1 se o perodo t * o 2
o
. quadrimestre
Q 3 em outros casosP
U$ Q 1 se o perodo t * o !
o
. quadrimestre
Q 3 em outros casos.
'o(&i*era89e& &obre o u&o *e @ari5@ei& i(*i3a*ora& i(*e$e(*e(te&
Dari5@ei& i(*i3a*ora& @er&u& alo3a8;o *e 3A*i"o&
Dma alternati)a ao uso de )ari)eis indicadoras para uma )ari)el independente qualitati)a * o
emprego de c#digos alocados. % uso de )ari)eis indicadoras geralmente apresenta duas )antagensI J1L
2ermite estimati)as e testes mais simples so+re efeitos diferenciais das diferentes classes da )ari)el
indicadoraP J2L a alocao de c#digos * su+8eti)a e pode definir uma escala de medida no realstica para
as classes da )ari)el qualitati)a.
4ari)eis indicadoras )ersus )ari)eis quantitati)as
Dma )ari)el quantitati)a independente tal como idade pode ser transformada numa )ari)el
indicadora atra)*s do grupamento da )ari)el quantitati)a em classes tais como e 21P 21 a !'P !$ a '1P
etc. 4ari)eis indicadoras podem ento ser usadas para as classes desta no)a )ari)el independente. 9
principio este enfoque parece ser incon)eniente porque ele perde informaes so+re idade e alem do
mais, par-metros adicionais so requeridos no modelo, o que reduE o numero de graus de li+erdade
associados ao quadrado m*dio do erro. 2or e.emplo, se c classes de idade so formadas, c C 1
par-metros da regresso so requeridos no modelo en)ol)endo a )ari)el idade na forma de )ari)el
indicadora, enquanto que apenas um par-metro seria requerido no modelo com a )ari)el quantitati)a
idade, original. 2orem e.istem casos em que a su+stituio da )ari)el quantitati)a por )ari)el
indicadora * mais apropriado. Dm +om e.emplo * quando se tem muitas o+ser)aes e a perda de graus
de li+erdade do quadrado m*dio do erro no constitui pro+lema e, o interesse maior * )isualiEar a forma
da relao Jfuno de respostaL entre as duas )ari)eis. 9ssim, este enfoque * apropriado quando o
analista tem du)ida so+re a forma da relao funcional entre as )ari)eis. 7este caso a regresso em
m;ltiplos estgios com )ari)eis indicadoras representando as classes da )ari)el quantitati)a pode
e)idenciar a forma da relao funcional entre as )ari)eis.
1'!
D7I4,R>I(9(, :,(,R9N (9 A9OI9
I7>TITDT% (, M9T,MpTI"9
(,29RT9M,7T% (, ,>T9Tq>TI"9
4@. 4*#emar *e Qarro& &/( ? 2(*i(a
'3.1635113 C >al)ador 5 A9
,5MailI mat3'ruf+a.+r, Oome pageI /ttpIKK???.uf+a.+rKaestat/p
Tel.: (071) 263-6262 ou 263-6263
PROGRAMA OFICIAL DA DISCIPLINA
"#digo
+++- ,ome *a *i&3i$li(a
M9T221
+D- 4(5li&e *e -e"re&&;o
"arga /orria semestral "r*ditos
Te#rica 2rtica Total Te#rica 2rtica Total
&3 !3 13 3' 31 3$
"ursos atendidos 7atureEa 2r*5requisitos
,statstica "M M9T316
M9T22$
,mentaI Modelo de Regresso Ninear >imples. ,stimao de 2ar-metros. Testes e
2redio. Regresso Ninear M;ltipla. Regresso 2olinomial. 4ari)eis
Indicadoras. (iagn#sticos em Regresso. >eleo do Mel/or Modelo. Modelo
Ninear <eral. Teorema de <auss5Mar=o).
%+8eti)osI 2roporcionar aos alunos o con/ecimento te#rico5prtico aos t#picos do programa
para uso nas situaes relacionadas com a sua rea de estudo ou em disciplinas
afins.
MetodologiaI 9ulas e.positi)as seguidas de e.erccios de aplicao com uso de equipamentos
con)encionais e eletrFnico, +em como de listas de e.erccios distri+udas aos
alunos.
Q+QF+2G-4F+4 !-+,'+!4F:
(R922,R, 7. R. e >MITO, O.. 4$$lie* re"re&&io( a(al6&i&. _o/n @ile` k >ons, Inc., 7e? Vor=.
11&&.
:%7>,"9, _airo >. da, M9RTI7>, <il+erto de 9. e T%N,(%, Nuciano. E&tat>&ti3a a$li3a*a. 2ed.,
9TN9>, >2 110$.
O%::M977, Rodolfo e 4I,IR9, >on/a. 4(5li&e *e -e"re&&;o: uma i(tro*u8;o ] E3o(ometria.
OD"IT,", >2, 110!.
B,7(9NN, M. <. e >TD9RT, 9. T#e a*@a(3e* t#eor6 of &tati&ti3&. 4ol 2. "/arles <riffin k "o.
Ntd., Nondres, 116!.
>7,(,"%R, <., "%"OR97, @. <. Btati&ti3al met#o*&. T/e Io?a >tate Dni)ersit` 2ress, 9mes.
11&6.
1''
Q+QF+2G-4F+4 '2M!FEME,T4-:
A%@,RM97, A. N. e %["%77,NN, R. T. Fi(ear &tati&ti3al mo*el&: a( a$$lie* a$$roa3#. 2. ed.
2@>5B,7T 2u+lis/ing "o. Aoston. 1113.
7,T,R, _. e @9>>,RM97, @. 4$$lie* li(ear &tati&ti3al mo*el&. Ric/ard (. Ir?in Inc. Oome?ood,
Illinois. 116'.
MI9s9BI, Tdina >. (eteco de dados atpicos em regresso linear 11
M
>I792,, Aelo OoriEonte, 111'.
<D9_9R9TI, (amodar 7. ,conometria +sica. !ed. M9BR%7, >2, 2333.
49>"%7",NN%>, M. 9. >. e (. 9l)es J,ditoresL. Manual de econometria, >2, 9TN9>, 2333.
Ra?lings, _. %. 9pplied Regression 9nal`sisI 9 researc/ tool, @ads?ort/ k Aroo=sK"ole ad)anced
Aoo=s k >oft?are, "alif#rnia, 1100
Aelsle`,(.9.P Bu/,,. e @elsc/,R.,. Regression (iagnostics J1103L, @ile` >eries in 2ro+a+ilit`
Montgomer`,(.".P2ec=,,.9., Introduction to Ninear Regression 9nal`sis J1112L, _o/n @ile` k
>ons, Inc.
'o(te)*o !ro"ram5ti3o:
1. Introduo
1.1. Relaes de dependncia e de interdependncia. Regresso e correlao.
1.1.1. Terminologia, notao e questes especficas.
1.2. Modelos matemticos e modelos estatsticos.
1.2.1. "onceito de componente aleat#rio ou erro nos modelos estatsticos.
1.!. % modelo de regresso na populao e na amostra.
1.'. (ados de cortes trans)ersais e dados de s*ries temporais.
2. % modelo de regresso linear simples.
2.1 "onceitos e pressupostos so+re os componentes do modelo de regresso.
2.2 ,stimao pontual dos par-metros.
2.2.1. M*todo dos mnimos quadrados.
2.2.2. M*todo da m.ima )erossimil/ana
2.! ,stimao da )ari-ncia dos termos do erro.
2.6 2ropriedades dos estimadores.
2.0 4ari-ncia e erro 5 padro dos estimadores.
2.1 % enfoque da anlise de )ari-ncia no modelo de regresso
2.6 ,stimao por inter)alo de confiana e teste de /ip#teses so+re o modelo de regresso.
2.6.1. "onstruo de inter)alos de confiana e teste de /ip#teses so+re os par-metros da
equao de regresso.
2.6.2. "onstruo do inter)alo de pre)iso para a resposta m*dia, dado um )alor
particular da )ari)el independente.
2.6.$. "onstruo do inter)alo de pre)iso para uma no)a o+ser)ao, dado um )alor
particular da )ari)el independente.
2.6.&. 7oes de inferncia simult-nea so+re os par-metros e a lin/a de regresso.
2.11. % coeficiente de determinao e a +ondade do a8uste.
2.12. 9nlise de resduos
2.12.1. (efinio e propriedades dos resduos
2.12.2. 9nlise grfica dos resduos
2.12.!. Teste : para linearidade
2.13. %s mnimos quadrados ponderados.
!. % modelo de regresso linear m;ltipla
!.1. Tratamento matricial do modelo de regresso linear. ,quaes normais.
!.2. "onceitos e pressupostos so+re os componentes do modelo.
!.!. ,stimao pontual dos par-metros de regresso do modelo. Teorema de <auss5Mar=o)
!.'. ,.emplos de aplicao de regresso m;ltipla.
'.$. 9nlise de )ari-ncia.
'.$.1. ,stimao da )ari-ncia dos erros.
'.$.2. % coeficiente de determinao e +ondade do a8uste.
'.$.!. "oeficientes de determinao parcial.
'.&. Inferncia so+re o modelo de regresso
1'$
'.&.1. Testes de /ip#teses so+re os par-metros.
'.&.2. Inter)alos de confiana para os par-metros e resposta m*dia.
'.&.!. 2redio de no)as o+ser)aes.
'.6. Regresso polinomial
'.6.1. Modelos de regresso polinomial
'.6.2. ,stimati)a do m.imo ou mnimo de uma funo de regresso quadrtica.
'.6.!. 2olinFmios ortogonais.
$. (iagn#stico so+re o modelo de regresso
6.6 %+ser)aes influentes e discrepantes
6.0 9)aliao do efeito de multicolinearidade no modelo de regresso linear m;ltipla
0 >eleo do mel/or su+con8unto de )ari)eis independentes
0.1 98uste de todos os modelos poss)eis
0.2 >eleo pelo m.imo ou mnimo incremento no coeficiente de determinao R
2
0.! >eleo atra)*s da estatstica "p de Mallo?
0.' >eleo 5 eliminao >T,2@I>,
0.$ %s m*todos :%R@9R( e A9"B@9R(
1 Regresso com )ari)eis indicadoras.
1.1 Modelos com uma ou mais )ari)eis independentes qualitati)as.
1.2 ,feito de interao.
1.! 4ari)el dependente indicadora
&.0. :uno de resposta logstica.
!la(eIame(to $ara o &eme&tre 2002.2
(ias de aulaI 2
a
. e '
a
. feiras, das 36I33 Zs 13I33
/ata-/ia 'o(te)*o/ati@i*a*e/lo3al
2$K11K3252
a
. 3'529: II
26K11K325'
a
. 3'529: II
32K12K3252
a
. 9plicaesP resoluo de e.ercciosK1$25IM
3'K12K325'
a
. 3'529: II
31K12K3252
a
. 3'529: II
11K12K325'
a
. 9plicaesP resoluo de e.ercciosJ2.6LK1$25IM
1&K12K3252
a
. 3'529: II
10K12K325'
a
. 3'529: II
2!K12K3252
a
. 1
a
. 9)aliaoK3'529: II
3&K31K3!52
a
. 1$25IM
30K31K3!5'
a
. 3'529: II
1!K31K3!52
a
. 3'529: II
1$K31K3!5'
a
. 1$25IM
23K31K3!52
a
. 3'529: II
22K31K3!5'
a
. 3'529: II
26K31K3!52
a
. 3'529: II
21K31K3!5'
a
. 1$25IM
3!K32K3!52
a
. 3'529: II
3$K32K3!5'
a
. 3'529: II
13K32K3!52
a
. Tra+al/o
12K32K3!5'
a
. Tra+al/o
16K32K3!52
a
. 3'529: II
11K32K3!5'
a
. 2
a
. 9)aliaoK3'529: II
2'K32K3!5
2a.
1$25IM
13K3!K3!52
a
. 3'529: II
12K3!K3!5'
a
. 3'529: II
16K3!K3!52
a
. 1$25IM
11K3!K3!5'
a
. 3'529: II
2'K3!K3!52
a
. !
a
. 9)aliaoK3'529: II
2&K3!K3!5'
a
. 2
as
. c/amadasK3'529: II
36K3'K3!52
a
. ,.ame finalK3'529: II
1'&
1
a
. a)aliao C pontos 1 e 2P 2
a
. a)aliao C ponto ! e !
a
. a)aliao C pontos ', $ e &.
1'6

S-ar putea să vă placă și