Documente Academic
Documente Profesional
Documente Cultură
CORRELAO LINEAR
At agora, todas as medidas estatsticas que estudamos neste Curso diziam respeito
somente a uma varivel. Ou seja, estudamos a mdia das idades, ou a moda dos salrios, ou a
mediana dos pesos, ou o desvio-padro das estaturas, e assim por diante.
No que diz respeito Correlao, surge a uma diferena. Estaremos agora estudando,
conjuntamente, duas variveis!
A Correlao uma medida estatstica que nos vai responder duas perguntas:
1) Existe alguma fora unindo estas duas variveis?
2) Caso exista esta fora, como se comporta uma varivel em relao outra?
Por meio de exemplos, entenderemos bem melhor. Vejamos.
Suponhamos que se pretende estudar as duas seguintes variveis: nmero de anos que
uma pessoa freqentou os bancos escolares, e nmero de livros que esta pessoa l por ano.
Ora, o censo comum nos levaria facilmente a crer que algum que estudou por mais
tempo l mais livros por ano; ao passo que quem mal freqentou a escola pouco l. No
verdade?
Mas a Estatstica no trabalha com o censo comum, e sim com dados de pesquisa.
Assim, uma pesquisa seria realizada, e seriam coletados pares de informaes, ou
seja, cada pessoa pesquisada responderia a estas duas perguntas: Quantos anos estudou? e
Quantos livros l por ano?
www.pontodosconcursos.com.br 1
CURSO ONLINE - ESTATSTICA BSICA CURSO REGULAR
PROFESSOR SRGIO CARVALHO
Desta forma, ao fim da pesquisa, teremos um grupo de pares de informaes, os quais
iro alimentar uma tabela. Teramos:
Varivel X Varivel Y
(Tempo de estudo, (Nmero de livros
em anos) lidos por ano)
2 5
5 8
7 12
4 9
3 1
E ser por meio dos dados constantes nesta tabela que trabalharemos a Correlao!
Na realidade, a Correlao nada mais que uma frmula veremos daqui a pouco a
qual ser preenchida por meio dos dados (os pares de informao) constantes na tabela acima,
e cujo resultado nos conduzir quelas duas concluses: 1) se h uma fora unindo as duas
variveis; e 2) como se comporta uma varivel em relao outra.
Ora, quase certo que o resultado da aplicao da frmula da Correlao para os dados
acima nos iria indicar duas coisas: 1) sim, h uma fora unindo estas duas variveis; e 2)
estas duas variveis se comportam de forma, digamos, diretamente proporcional. Ou seja,
aumentando-se uma, a outra tambm aumenta, e diminuindo-se uma, a outra tambm diminui.
Neste ponto convm que sejamos apresentados frmula da Correlao, que a
seguinte:
n. Xi.Yi Xi. Yi
r ( x, y ) =
[n. Xi 2
][
( Xi ) . n. Yi 2 ( Yi )
2 2
]
O primeiro impulso, ao ver a frmula acima, o de abandonar este assunto, e ir buscar
algo mais fcil para estudar... Um engano terrvel este pensamento!
Eu lhes adianto que h, basicamente, quatro tipos de questo de Correlao caindo em
prova, e que destes, trs so muito fceis! Ou seja, h 75% de chance de cair uma questo de
resoluo quase imediata sobre este tema! No vamos esquecer disso, OK?
Quanto frmula acima, daqui a pouco voltaremos a ela, e eu lhes ensinarei uma
maneira faclima de memoriz-la. Por hora, vamos com calma.
O resultado da aplicao da frmula da Correlao variar, sempre, entre -1 (menos um)
e 1. Ou seja, nunca ser menor que menos um, e nunca maior que um. Teremos:
-1 0 1
www.pontodosconcursos.com.br 2
CURSO ONLINE - ESTATSTICA BSICA CURSO REGULAR
PROFESSOR SRGIO CARVALHO
Conhecemos, pois, a primeira anlise do resultado da Correlao: a existncia ou
inexistncia de fora unindo as duas variveis. E quando esta fora mais intensa ou menos
intensa.
A segunda anlise do resultado diz respeito ao comportamento das variveis, uma em
relao outra.
E faclima esta anlise:
Se o resultado da Correlao der um valor maior que zero (positivo), teremos que as
variveis se comportam de forma diretamente proporcional, ou seja, aumentando-se o valor de
uma, aumenta tambm a outra, e diminuindo-se uma, diminui tambm a outra;
Se o resultado da Correlao for menor que zero (negativo), as variveis se
comportaro de maneira inversamente proporcional, ou seja, aumentando-se o valor de uma, o
da outra diminui; e vice-versa.
Compreendido isso?
Assim, interpretar o resultado da correlao pode perfeitamente ser uma questo de
prova! Pelo que me consta, ainda no foi. Mas pode ser. Isso pode!
Agora vamos voltar tabela que vimos acima:
Varivel X Varivel Y
(Tempo de estudo, (Nmero de livros
em anos) lidos por ano)
2 5
5 8
7 12
4 9
3 1
Com os pares de informao que vemos acima, seremos capazes de criar um grfico,
muito simples, chamado Diagrama de Disperso, em que cada par de informao se
transformar em um ponto. Vejamos como simples:
O primeiro par de informao (2 e 5). Esto vendo?
Varivel X Varivel Y
(Tempo de estudo, (Nmero de livros
em anos) lidos por ano)
2 5
5 8
7 12
4 9
3 4
Yi
12
11
10
9
8
7
6
www.pontodosconcursos.com.br 3
CURSO ONLINE - ESTATSTICA BSICA CURSO REGULAR
PROFESSOR SRGIO CARVALHO
5
4
3
2
1
0 1 2 3 4 5 6 7 Xi
Observando os pontos marcados acima, facilmente vemos que impossvel uni-los por
meio de uma reta perfeita. Todavia, percebemos tambm que embora no formem uma reta
perfeita, estes pontos esto dispostos em torno do formato aproximado de uma reta.
Seno vejamos:
Yi
12
11
10
9
8
7
6
5
4
3
2
1
0 1 2 3 4 5 6 7 Xi
Percebam ainda que esta reta ascendente, ou seja, ela est subindo, da esquerda para
a direita. Quando isso ocorrer, ou seja, quando os pontos do diagrama de disperso no
formarem uma reta perfeita, mas estiverem dispostos ao longo de uma reta ascendente, ento
diremos que a correlao positiva (r>1).
Outra situao possvel que os pontos do diagrama, oriundos da tabela (dos pares de
informao) tambm no formassem uma reta descendente perfeita, mas se aproximassem, ou
seja, estivessem dispostos ao longo de uma reta que desce, da esquerda para a direita. Seria
algo semelhante ao seguinte:
Yi
12
11
10
9
8
7
6
5
4
3
2
1
0 1 2 3 4 5 6 7 Xi
Yi
Xi
Neste caso, temos a situao de uma correlao perfeita positiva, ou seja, r=1.
2) Os pontos, unidos, formaram uma reta descendente perfeita:
Yi
Xi
Neste caso, temos a situao de uma correlao perfeita negativa, ou seja, r=-1.
Por fim, se estivermos estudando a existncia da correlao entre as duas seguintes
variveis: 1) nmero de anos que a pessoa freqentou a escola; e 2) nmero do sapato que a
pessoa cala.
Ora, muitssimo provvel que ao fazermos a pesquisa, e ao preenchermos uma tabela
com os pares de informaes coletados, e depois ao marcarmos os pontos no diagrama de
disperso, cheguemos ao seguinte grfico:
Yi
Xi
Percebemos que, neste caso, no possvel sequer aproximar os pontos do diagrama
para o formato de uma reta, quer ascendente, quer descendente.
Quando isso ocorrer, diremos que estamos diante da ausncia da correlao, ou seja,
r=0.
Com o que vimos at aqui, j estamos aptos a resolver um estilo de questo de
Correlao: aquele que pergunta pela interpretao do diagrama de disperso.
www.pontodosconcursos.com.br 5
CURSO ONLINE - ESTATSTICA BSICA CURSO REGULAR
PROFESSOR SRGIO CARVALHO
Um resumo desta teoria que acabamos de ver o que se segue, nos cinco quadros
seguintes:
Acreditem-me: estes pequenos grficos j foram objeto de prova. Era olhar para o
desenho e acertar a questo.
Mas se trata de uma questo muito rara. A chance de cair no das maiores. Pelo sim,
pelo no, melhor conhecermos tudo!
O terceiro tipo de questo, que aprenderemos agora, diz respeito s propriedades da
Correlao. Uma questo faclima, para quem conhece essas tais propriedades. E o bom de tudo
que podemos reuni-las em uma nica frase:
A correlao no influenciada nem por operaes de soma, nem de subtrao,
nem de produto, e nem de diviso, exceto pelo sinal.
Como isso?
Vamos ver, por meio de vrios exemplos:
Uma questo de prova pode dizer que a correlao entre duas variveis quaisquer x e y
igual a 0,8. Ou seja, r(x,y)=0,8. E perguntar qual a correlao entre (2x-3 e 3y+5). Ou seja,
perguntar: r(2x-3, 3y+5)=?
Como resolveremos essa questo? Analisando as operaes que ocorreram com as
variveis x e y. Vejamos. Temos:
r(x,y)=0,8 e r(2x-3, 3y+5)=?
A varivel x virou o qu? Virou 2x-3.
Quais as operaes que ocorreram com o x? Ele foi multiplicado por 2, e depois,
subtrado de 3. Produto ou subtrao afetam a correlao? No! Por ltimo: o x mudou de sinal?
No!
Quais as operaes que ocorreram com o y? Ele foi multiplicado por 3, e depois, somado
a cinco. Produto e soma no influenciam a correlao! Por fim, o y no mudou de sinal.
Assim, desconsiderando as operaes que no influenciam na Correlao, teremos que:
r(2x-3, 3y+5) = r(x,y) = 0,8
Viram? O que temos a fazer apenas desconsiderar aquelas operaes que no
influenciam na correlao, e depois ver o que sobrou! Apenas fiquemos atentos, e muito, para
verificar se o sinal das variveis x e y vai mudar ou no! Mais um exemplo.
www.pontodosconcursos.com.br 6
CURSO ONLINE - ESTATSTICA BSICA CURSO REGULAR
PROFESSOR SRGIO CARVALHO
Ou seja: mudando o sinal de apenas uma das variveis, muda tambm o sinal da
correlao!
Novo exemplo.
Novamente, alterou-se o sinal de apenas uma das variveis. J sabemos o efeito disto:
muda tambm o sinal da correlao. (O que era 0,8 virou -0,8). S isso!
Exemplo 4) Sabendo que r(x,y)=0,8, quanto ser r(-2x-3, -3y+5)?
Fazendo os cortes devidos, de acordo com as propriedades da correlao, teremos:
r(-2x-3, -3y+5)
Percebemos que, desta vez, modificaram-se os sinais das duas variveis. Com isso, o
sinal da correlao permanecer inalterado!
Assim, teremos:
r(-2x-3, -3y+5) = r(-x,-y)=0,8
Sol.: dito pelo enunciado que r(x,y)=0,8. E a questo pergunta quanto r(2x,3y).
Ora, vimos exemplos bem mais interessantes que isto! Cortando os dois produtos, o que
resta a apenas: r(2x,3y) = r(x,y) = 0,8 Resposta!
Sol.: dito pelo enunciado que r(x,y)=r. Em seguida, dito ainda que y=4-2x.
Assim, substituindo este valor de y, teremos:
r(x,y) = r(x, 4-2x)
Aplicando agora a propriedade da correlao, teremos:
r(x, 4-2x) = r(x, -x) = -1
Assim, conclumos que: r(x,y) = r = r(x,-x) = -1
Ou seja: r=-1 Reposta!
Mais uma.
www.pontodosconcursos.com.br 8
CURSO ONLINE - ESTATSTICA BSICA CURSO REGULAR
PROFESSOR SRGIO CARVALHO
r(z,x) = r(0,2-0,5x , x) = r(-x,x) = -1
O quarto tipo de questo que pode cair em prova sobre correlao a mais difcil delas.
a questo que exige a aplicao da frmula!
Ou seja, um enunciado que vai fornecer uma tabela com todos aqueles pares de
informao (das variveis x e y), e vai pedir que seja calculado o valor do coeficiente de
correlao linear. Em outras: a questo ir querer saber o valor de r(x,y).
Antes de mais nada, convm saber do seguinte: a tabela para aplicao da frmula da
correlao somente estar completa se contar com as seguintes cinco colunas:
Precisamos destas cinco colunas, porque a frmula ser preenchida exatamente com os
cinco somatrios que esto em azul na tabela acima!
Alm desses somatrios, a frmula traz tambm um tal de n. O que significa este n?
Significa nmero de pares de informaes!
Assim, conhecendo, por meio da tabela, o nmero de pares de informao (n), e os
somatrios das cinco colunas acima, pronto!, j estaremos aptos a aplicar a frmula e a fazer as
contas, e a chegar resposta da questo!
Prximo passo: memorizar a frmula. Vejamos novamente.
n. Xi.Yi Xi. Yi
r ( x, y ) =
[n. Xi 2
][
( Xi ) . n. Yi 2 ( Yi )
2 2
]
Para memorizar esta belezura, basta que voc memorize o primeiro colchete do
denominador. o seguinte:
n.Xi2-(Xi)2
somente essa parcela que voc precisar memorizar! Somente essa!
www.pontodosconcursos.com.br 9
CURSO ONLINE - ESTATSTICA BSICA CURSO REGULAR
PROFESSOR SRGIO CARVALHO
Assim, convm que voc a repita vrias e vrias vezes no papel. Olhando para ela, sem
olhar para ela. De todo jeito! At que fique definitivamente memorizada.
Depois disso, lembraremos do seguinte: o denominador est debaixo do sinal da raiz
quadrada. E dentro desta raiz, h o produto de dois colchetes: o primeiro deles aquele que a
gente j decorou. E o segundo praticamente igual ao primeiro, trocando-se apenas o X por Y.
Voc h, portanto, de concordar comigo, que o denominador j est todo memorizado.
Concorda?
Pois bem! Voltemos quele colchete que decoramos no comeo.
Agora, vamos desenvolv-lo. muito fcil fazer isso. Todos concordam que Xi2=Xi.Xi?
Sim? E todos tambm concordam que: (Xi)2=(Xi).(Xi)? Sim?
Assim, podemos dizer que:
n.Xi2-(Xi)2 = n.Xi.Xi-(Xi).(Xi)
Tudo bem at aqui?
Pois bem! Observem que o desenvolvimento acima resultou em duas parcelas, nas quais
s aparece a varivel X.
Mas para chegarmos ao numerador da frmula, modificaremos ligeiramente o resultado
deste desenvolvimento, de forma que tenhamos as duas variveis X e Y, e no apenas X.
Teremos: n.Xi.Yi-(Xi).(Yi)
Pronto! Chegamos ao numerador da frmula. Agora, sim, conhecemos a frmula inteira!
Com isso, estamos aptos, finalmente, a resolver mais este tipo de questo de correlao!
Vejamos algumas delas.
n. Xi.Yi Xi. Yi
r ( x, y ) =
[n. Xi 2
][
( Xi ) . n. Yi 2 ( Yi )
2 2
]
www.pontodosconcursos.com.br 10
CURSO ONLINE - ESTATSTICA BSICA CURSO REGULAR
PROFESSOR SRGIO CARVALHO
6 x317 21x75
r ( x, y ) =
[ ][
6 x91 (21) 2 . 6 x1111 (91) 2 ]
X = Y = 15
X2 = Y2 = 55
XY = 39
n. Xi.Yi Xi. Yi
r ( x, y ) =
[n. Xi 2
][
( Xi ) . n. Yi 2 ( Yi )
2 2
]
5 x39 15 x15
r ( x, y ) =
[5x55 (15) ][. 5x55 (15) ]
2 2
www.pontodosconcursos.com.br 11
CURSO ONLINE - ESTATSTICA BSICA CURSO REGULAR
PROFESSOR SRGIO CARVALHO
5 x39 15 x15
r ( x, y ) =
5 x55 (15) 2
Viram? O que me dizem? D para fazer estas contas, ou no? Claro que sim! Teremos:
r(x,y)=(195-225)/(275-225)
r(x,y)=-30/50 = -3/5 = -0,600 Resposta!
www.pontodosconcursos.com.br 12