Sunteți pe pagina 1din 24

UNIVERSIDADE FEDERAL UNIVERSIDADE FEDERAL

DA PARABA DA PARABA
Luiz Medeiros de Araujo Lima Filho Luiz Medeiros de Araujo Lima Filho
Departamento de Estatstica Departamento de Estatstica
Correlao e Regresso Correlao e Regresso
Introduo
Existem situaes nas quais h interesse em estudar o
comportamento conjunto de uma ou mais variveis;
Em muitos casos, a explicao de um fenmeno de interesse Em muitos casos, a explicao de um fenmeno de interesse
pode estar associado a outros fatores (variveis) que
contribuem de algum modo para a ocorrncia deste fenmeno.
O comportamento conjunto de duas variveis quantitativas
pode ser observado por meio do grfico de disperso.
x
Introduo
x
Exemplo
x
Para desenhar um diagrama de disperso, necessrio sempre fazer o eixo cartesiano para
identificar os pontos das variveis quantitativas consideradas.
Representa-se primeiramente uma das variveis no eixo das abscissas (varivel X) e a outra
varivel no eixo das ordenadas (varivel Y).
Os valores das variveis so marcados sob os respectivos eixos e assim marca-se um ponto
para cada par de valores.
Exemplo
x
Correlao e Regresso
So duas tcnicas estreitamente relacionadas, que visa
estimar uma relao que possa existir entre duas variveis na
populao.
Correlao: resume o grau de relacionamento entre
duas variveis (X e Y, por exemplo).
Regresso: tem como resultado uma equao
matemtica que descreve o relacionamento entre variveis.
x
Correlao
O objetivo do estudo da correlao determinar (mensurar) o grau de
relacionamento entre duas variveis.
Caso os pontos das variveis, representados num plano cartesiano (X, Y)
ou grfico de disperso, apresentem uma disperso ao longo de uma reta
imaginria, dizemos que os dados apresentam uma correlao linear.
x
Coeficiente de correlao linear de Pearson
Uma medida do grau e do sinal da correlao linear entre
duas variveis (X,Y) dado pelo Coeficiente de Correlao
Linear de Pearson, definido por:
O valor de r estar sempre no intervalo de -1 a 1.
x
Propriedades do Coeficiente de Correlao Linear
Este coeficiente adimensional, logo no afetado pelas unidades de
medidas das variveis X e Y.
O sinal positivo indica que as variveis so diretamente proporcionais,
enquanto que o sinal negativo indica que a relao entre as variveis
inversamente proporcional. inversamente proporcional.
x
Exemplo 1:
A tabela abaixo apresenta os preos mdios das aes e ttulos divulgados
pela Bolsa de Nova York entre 1950 e 1959. Calcule o coeficiente de
correlao de Pearson e interprete o resultado.
x
x y
8 78
2 92
5 90
Faltas
Nota
final
Exemplo 2: Existe correlao entre o nmero de faltas e a
nota final? De que forma?
95
90
85
80
75
N
o
t
a

f
i
n
a
l
5 90
12 58
15 43
9 74
6 81
75
70
65
60
55
45
40
50
0 2 4 6 8 10 12 14 16
N
o
t
a

f
i
n
a
l
X
Faltas
REGRESSO
Quando analisamos dados que sugerem a existncia de uma relao
funcional entre duas variveis, surge ento o problema de se determinar
uma funo matemtica que exprima esse relacionamento, ou seja, uma
equao de regresso.
Ao imaginar uma relao funcional entre duas variveis, digamos X e Y, Ao imaginar uma relao funcional entre duas variveis, digamos X e Y,
estamos interessados numa funo que explique grande parte da variao
de Y por X. Entretanto, uma parcela da variabilidade de Y no explicada
por X ser atribuda ao acaso, ou seja, ao erro aleatrio.
Quando se estuda a variao de uma varivel Y em funo de uma
varivel X, dizemos que Y a varivel dependente e que X a varivel
explanatria (ou independente).
x
O modelo em que busca explicar uma varivel Y como uma funo
linear de apenas uma varivel X denominado de modelo de regresso
linear simples.
Varivel independente, X Varivel dependente, Y
Temperatura do forno (C) Resistncia mecnica da cermica (MPa)
x
Temperatura do forno (C) Resistncia mecnica da cermica (MPa)
Quantidade de aditivo (%) Octanagam da gasolina
Renda(R$) Consumo(R$)
Memria RAM do computador (Gb) Tempo de resposta do sistema (s)
rea construda do imvel (m
2
) Preo do imvel (R$)
REGRESSO LINEAR SIMPLES
ESTIMAO DOS PARMETROS
O objetivo estimar valores para e atravs dos dados fornecidos pela
amostra. Alm disso, encontrar a reta que passe o mais prximo possvel
dos pontos observados segundo um critrio pr-estabelecido.
x
MTODO DOS MNIMOS QUADRADOS
usado para estimar os parmetros do modelo ( e ) e consiste
em fazer com que a soma dos erros quadrticos seja menor
possvel, ou seja, este mtodo consiste em obter os valores de e
que minimizam a expresso:
Aplicando-se derivadas parciais expresso acima, e igualando-se
a zero, acharemos as estimativas para e .
x
MTODO DOS MNIMOS QUADRADOS
Aps aplicar as derivadas parciais, e igualando-se a zero,
possvel obter as seguintes estimativas para e , as quais
chamaremos de a e b, respectivamente:
e
x
A chamada equao (reta) de regresso dada por
e para cada valor x (i = 1, ..., n) temos, pela equao de e para cada valor x
i
(i = 1, ..., n) temos, pela equao de
regresso, o valor predito:
A diferena entre os valores observados e os preditos ser
chamada de resduo do modelo de regresso, sendo denotado
por:
O resduo relativo i-sima observao (e
i
) pode ser O resduo relativo i-sima observao (e
i
) pode ser
considerado uma estimativa do erro aleatrio (e
i
), como
ilustrado abaixo.
COEFICIENTE DE DETERMINAO (R
2
)
O coeficiente de determinao uma medida descritiva da
proporo da variao de Y que pode ser explicada por
variaes em X, segundo o modelo de regresso
especificado. Ele dado pela seguinte razo:
Quanto mais prximo de 1 estiver o coeficiente de determinao, melhor
ser o grau de explicao da variao de Y em termos da varivel X.
uma medida sempre positiva, e obtida, na regresso linear simples,
elevando-se o coeficiente de correlao de pearson ao quadrado.
EXEMPLO 3:
Considere um experimento em que se analisa a octanagem da gasolina (Y) em
funo da adio de um novo aditivo (X). Para isso, foram realizados ensaios
com os percentuais de 1, 2, 3, 4, 5 e 6% de aditivo. Os resultados so
mostrados no grfico de disperso.
82
83
84
85
86

n
d
i
c
e

d
e

o
c
t
a
n
a
g
e
m
a) Existe uma relao linear entre a adio de um novo aditivo e a
octanagem da gasolina? Qual o grau dessa relao?
b) Determine a reta de regresso que explica a octanagem da gasolina em
funo da adio do novo aditivo. Calcule o coeficiente de determinao
do modelo.
c) Se adicionarmos 5,5% de aditivo, qual o ndice de octanagem esperado?
d) Calcule o erro de estimao para cada valor de X.
80
81
0 1 2 3 4 5 6 7
Quantidade de aditivo (%)

n
d
i
c
e

d
e

o
c
t
a
n
a
g
e
m
EXEMPLO 4:
Quantidade de procana hidrolisada, em 10 moles/litro, no plasma humano,
em funo do tempo decorrido aps sua administrao.
a) Existe uma relao linear entre a quantidade de procana e o tempo
decorrido aps sua administrao? Qual o grau dessa relao?
b) Determine a reta de regresso que explica a quantidade de procana em
funo do tempo. Calcule o coeficiente de determinao do modelo.
c) Qual a quantidade de procana hidrolisada aps 6 minutos de sua
administrao? E aps 13 minutos?
d) Calcule o erro de estimao para cada valor de X.
Exemplo 5:
A tabela abaixo apresenta os preos mdios das aes e ttulos divulgados pela
Bolsa de Nova York entre 1950 e 1959. Calcule o coeficiente de correlao de
Pearson e interprete o resultado.
a) Determine a reta de regresso que explique os ttulos divulgados em funo do preo
mdio das aes. Calcule o coeficiente de determinao do modelo.
b) Qual o nmero de ttulos divulgados para um preo mdio da ao de 45,00? E para um
preo mdio de 50,00?
c) Calcule o erro de estimao para cada valor de X.
x
REGRESSO LINEAR MLTIPLA
Em algumas situaes o interesse estudar o comportamento de uma
varivel dependente Y em funo de duas ou mais variveis independentes
X
i
.
Os mtodos para tratar com o problema de prever uma varivel por meio
de diversas outras so semelhantes queles para uma varivel
independente.
x

S-ar putea să vă placă și