Sunteți pe pagina 1din 6

Correla c ao e Regress ao Linear

I. Introdu c ao Podemos estudar diversas vari aveis ao mesmo tempo para ver como elas se interrelacionam. A correla c ao surge quando um indiv duo pergunta se h a alguma rela c ao entre, pelo menos duas vari aveis quantitativas. Uma rela c ao deve ser considerada como um conjunto de pares ordenados. Aplicaremos ent ao a correla ca o linear para vericar a rela c ao existente entre estas vari aveis, uma ser a independente (x) e a outra dependente (y ). Vamos considerar como vari avel independente o fator manipulado pelo experimentador, a tentativa de assegurar a rela c ao desse fator com um fen omeno observado. Exemplo: Candidatos que mais horas estudaram, obter ao desempenho melhor. Vari avel dependente: resultado do desempenho. Vari avel independente: N umero de horas de estudo. Outros exemplos de rela c ao entre duas vari aveis: a) o peso pode estar relacionado com a idade b) consumo das fam lias com suas rendas c) consumo de sorvete com a temperatura, etc... Assim, a varia c ao de um fen omeno pode inuir no outro, precisamos saber a dire c ao e a magnitude dessa rela c ao, expressa em conjunto de pares. Dizemos que existe correla c ao linear direta entre dois fen omenos quando, aumentando um deles o outro tem um acr escimo determinado. Existe correla c ao linear inversa, quando aumentando um deles, o outro diminui. Pela magnitude, podemos saber at e que ponto a rela c ao e forteou fraca. Medimos isto pelo coeciente de correla c ao linear r. II. Diagrama de Dispers ao comum vericar-se a exist E encia de uma rela c ao entre duas ou mais vari avel. O desejo de expressar essa rela ca o de forma matem atica leva-nos ` a teoria da regress ao e correla c ao. Consideremos diversos valores X e Y , entre os quais deseja-se estabelecer uma rela c ao formal.

Exemplo 1: Sejam os seguintes valores de X e Y : X : 2, 4, 5, 5, 6, 8, 9, 10 Y : 1, 3, 6, 6, 8, 10, 11, 14. Vamos construir o diagrama de dispers ao medindo X e Y no eixo de coordenadas retangulares.

Neste exemplo, as duas vari aveis apresentam uma tend encia de crescerem ao longo da s erie. Contudo, existem outros tipos de rela c ao, expressas a seguir:

No exemplo 1, vericamos que existe uma rela c ao linear entre as duas vari aveis, isto e, podemos representar por uma reta, cuja equa c ao e: Y = a + bX

III. Correla c ao Linear Sabe-se que o per metro e o lado de um quadrado est ao relacionados: p = 4l. Atribuindo um valor qualquer a l, determinamos exatamente o valor de p. Por outro lado, a rela c ao existente entre o peso e a estatura de um grupo de pessoas e bem menos precisa, pois podem existir pessoas de mesma estatura e peso diferente (e vice-versa). As rela c oes do tipo per metro s ao conhecidas como rela c oes funcionais, e do tipo peso-altura, como rela c oes estat sticas. Quando duas vari aveis est ao ligadas por uma rela ca o estat stica, dizemos que existe correla c ao entre elas. A cada correla c ao est a associada como imagemuma rela c ao funcional. Por isso as rela c oes funcionais s ao chamadas rela c oes perfeitas. Assim uma correla c ao e: Linear Positiva: se os pontos do diagrama tem como imagemuma reta ascendente; Linear Negativa: se os pontos do diagrama tem como imagemuma reta descendente; N ao Linear: se os pontos tem como imagemuma curva.

IV. Coeciente de Correla c ao O instrumento empregado para a medida da correla c ao linear e o coeciente de correla c ao. Este coeciente deve indicar o grau de intensidade da correla c ao entre duas variaveis, e o sentido (+ ou -). Faremos uso do coeciente de correla c ao de PEARSON, que e dado por :
n i=1 xi yi n 2 i=1 xi

n i=1 xi )(

n i=1 yi ) n 2 i=1 yi )

r=

n
n 2 yi i=1

n 2 i=1 xi )

em que n e o n umero de observa c oes. Ainda, se considerarmos: xi = xi x sx yi = yi y sy i = 1, 2, ..., n

em que: x : m edia de x1 , x2 , ..., xn ; sx : desvio padr ao de x1 , x2 , ..., xn ; y : m edia de y1 , y2 , ..., yn ; sx : desvio padr ao de y1 , y2 , ..., yn . Temos a seguinte express ao para o coeciente de correla c ao:
n

(xi yi ) r=
i=1

n1

Os valores limites de r s ao: -1 e 1 , logo: 1 r 1 Assim: a) se r = 1, h a uma correla c ao perfeita (forte) e positiva entre as vari aveis. b) se r = 1, h a uma correlacao perfeita (forte) e negativa entre as vari aveis. c) se r = 0, ou n ao h a correla c ao entre as vari aveis, ou a rela c ao que porventura exista n ao e linear.

Exemplo 2: Calcular o coeciente de correla c ao linear de Pearson entre as vari aveis X e Y , usando os dados da tabela abaixo: X 10 8 6 10 12 Y 2 4 6 8 10

Exerc cio 1: No processo de queima de massa cer amica para pavimento, corpos de prova foram avaliados por tr es vari aveis: X1 = retra c ao linear (%); X2 = resist encia mec anica (MPa) e X3 = absor c ao de agua (%). Os resultados de 10 ensaios s ao: Ensaio 1 2 3 4 5 6 7 8 9 10 X1 8,70 11,68 8,30 12,00 9,50 8,58 10,68 6,32 8,20 13,24 X2 38,42 46,93 38,05 47,04 50,90 34,10 48,23 27,74 39,20 60,24 X3 5,54 2,83 5,58 1,10 0,64 7,25 1,88 9,92 5,63 0,58

Calcule o coeciente de correla c ao de Pearson para cada par de vari aveis. Interprete os resultados. V. Infer encias sobre Dada uma amostra aleat oria simples (x1 , y1 ), (x2 , y2 ), ..., (xn , yn ) de n observa c oes do par de vari aveis aleat orias (X, Y ), o coeciente r e considerado uma estimativa do verdadeiro e desconhecido coeciente . comum o interesse em vericar as seguintes hip E oteses: H0 : = 0 (as vari aveis X e Y s ao n ao correlacionadas) H1 : = 0 (as vari aveis X e Y s ao correlacionadas) podendo, ainda, a hip otese alternativa indicar o sentido da correla c ao (teste unilateral), tal como H1 : > 0 (X e Y s ao correlacionadas positivamente) ou H1 : < 0 (X e Y s ao correlacionadas negativamente). O teste unilateral e aplicado nos casos em que esperamos o coeciente de correla c ao com determinado sinal (+ ou -). Restringindo-se ` a verica c ao de correla c ao linear e supondo X e Y com distribui c oes normais, podemos realizar o teste, calculando: r n2 t= t(n 2) 1 r2 Exemplo 3: Considerando os dados do exemplo 2, realize os testes bilaterais ao n vel de signic ancia de 5%. Exerc cio 2: Considerando os dados do exerc cio 1, realize os testes bilaterais ao n vel de signic ancia de 5%. 5

VI. Ajustamento da Reta de Regress ao Sempre que desejamos estudar determinada vari avel em fun c ao de outra, fazemos uma an alise de regress ao. A an alise de regress ao tem por objetivo descrever, atrav es de um modelo matem atico, a rela c ao entre duas vari aveis, partindo de n observa c oes sobre elas. A vari avel sobre a qual desejamos fazer uma estimativa recebe o nome de vari avel dependente e a outra recebe o nome de vari avel independente. A regress ao e o ajuste da reta aos dados obtidos. Por meio do ajuste podemos fazer previs oes que s ao v alidas na medida em que o coeciente r for signicativo, ou seja, apresente um valor pr oximo de +1 ou -1. A t ecnica do ajuste da reta pode ser realizada atrav es do M etodo dos M nimos Quadrados. Vamos obter uma fun c ao denida como: Y = a + bX em que os coecientes a e b s ao determinados pelas f ormulas: a=
n i=1 yi

b n

n i=1 xi

b=

n n n i=1 xi yi ( i=1 xi )( i=1 yi ) n n 2 n i=1 x2 i ( i=1 xi )

Exemplo 4: Determine a equa c ao da reta para os dados: X Y 5 6 8 9 7 8 10 10 6 5 7 7 9 8 3 4 8 6

Exerc cio 3: Determine as equa c oes das retas para os dados do exerc cio 1.

S-ar putea să vă placă și