Documente Academic
Documente Profesional
Documente Cultură
DO SUL
Instituto de Matemtica
Departamento de Estatstica
ESTATSTICA GERAL II
MAT02215
2
Cincias Sociais: estudo de fatores desencadeadores de comportamento violento,
tipificao de uso de drogas, causas de criminalidade.
3
1.2. Diviso da Estatstica
Os trs canteiros so expostos mesma incidncia de luz, tipo de solo, mas recebem adubos
diferentes. No final do experimento ser medida a altura das plantas.
4
1.3 Reviso de Estatstica Descritiva
x + x2 + L + xn x i
Mdia aritmtica: X = 1 = i =1
n n
Moda: a moda de um conjunto de valores, denotada por mo, definida como o valor mais
freqente no conjunto. Convm lembrar que a moda pode no ser nica, isto , um conjunto
pode ser bimodal, trimodal, etc. No caso em que todas freqncias forem iguais diremos
que no h moda. Se a moda existir ser denotada por Mo.
x [ n +1 ] , se n mpar
2
Med =
(x [n2 ] + x [n2 +1] )
, se n par
2
n 2 2
i x n ( X )
2
Varincia: S = i =1
n 1
Desvio padro: S = S 2
S
Coeficiente de variao: C.V =
100%
X
5
Exemplo 3: nmero de irmos dos alunos da turma U - disciplina Estatstica
0 1 1 6 3 1 3 1 1 0 4 5 1 1 1 0 2 2 4 1 3 1 2 1 1
1 1 5 5 6 4 1 1 0 2 1 4 3 2 2 1 0 2 1 1 2 3 0 1 0
Soluo:
x f
0 7
1 21
2 8
3 5
4 4
5 3
6 2
Total 50
95
x= = 1,9 ; Mo=1; Med=1
50
2
309 50 (1,9)
2
s = = 2,6224 ; s = 1,6194 ; CV=85%.
49
k k
x
i =1
i fi x
i =1
i fi
X = k
=
n
fi =1
i
2
k
x f i n X
i
2
S 2 = i =1
n 1
S
S = S 2 ; C.V =
100%
X
6
Exemplo 4: vendas semanais (em mil reais) de gneros alimentcios:
30 34 35 35,8 36,2 37,1 37,5 37,9 38 38,3 39 39,3 42,5 43,3 44,5
40 40,1 40,2 40,2 40,3 40,4 40,7 40,8 41 41,1 41,4 42 44,7 44,8 44,9
49,4 49 45,6 49,7 49,4 46 48 46,5 45,4 47,6 46,3 45,9 47,6 49,8 49,6
49,8 49,7 49,7 45,7 48,5 49,7 49,8 49,6 45,5 47,3 48,9 48,9 46,4 45,6 45
47 45,5 49,4 48,1 48,8 49,3 49,7 47,4 48,2 48,9 45,1 46,7 49,1 46 49,5
48,3 48,3 46,9 48,7 48,6 53,6 52,3 51,9 52 53,2 50,8 50,8 51,4 53,4 53,9
50,1 51,5 51,3 54,2 50,2 50,7 50,4 54,8 54 54 53,4 50,6 51,5 53,7 54,6
52,4 50,1 53,2 52,1 50,6 51,8 51 53,7 50,2 53,8 50,1 50,9 52 52,3 52,2
52,1 52,3 57,7 57,5 55,3 56,9 55,2 56,7 57,6 57,9 58,8 56,7 59,5 59,7 55,6
55,5 57,7 56,9 57,3 56,8 55 58 56 56,6 56,9 55,7 59,5 58,8 57,1 56,5
59,2 57,5 60,8 60,5 62,9 62,3 61,2 61,6 63,2 62,5 63,3 63,5 63,6 64,8 62,2
63,5 60,4 64,4 61 62,4 66 68
2
8776 457840 172 (51,02325)
X = = 51,02325 ; S 2 = = 58,82986 ; S = 7,67006 ,
172 171
7,670101
CV = 100 = 15,0325% .
51,02325
7
1.4 Reviso de Probabilidade
A c I B = B AI B( )
Propriedades:
(5) P( A c ) = 1 P( A)
(6) A B P( A) P( B)
(7) A B P( B A) = P( B) P( A) :
( )
Regra da adio: P AU B = P( A) + P( B ) P ( AI B) para A, B eventos quaisquer
P( AI B)
Probabilidade condicional: P( A | B) = se P( B ) > 0
P( B)
E ( X ) = xf ( x) , 2 = Var ( X ) = x 2 f ( x) (EX )2 , = 2
x x
C.V = 100%
EX
8
Modelos Probabilsticos discretos
Modelo Binomial
X = 1, se RH+
= 0, se RH-
fmp: f ( x, n, p) = C nx p x q n x , x = 0,1,2....., n
EX = np ; VarX = np(1 p)
9
Exemplo 6: suponha que 40% dos moradores de um municpio so favorveis
implantao de um novo sistema de coleta e reciclagem de lixo. Se 5 pessoas forem
entrevistadas (independentemente), qual a probabilidade de:
P( X 2) = P ( X = 0) + P( X = 1) + P ( X = 2) =
(b)
= C 50 0,40 0 0,60 5 + C 51 0,401 0,60 4 + C 52 0,40 2 0,60 3 = 0,68256
P(2 X < 5) = P ( X = 2) + P( X = 3) + P( X = 4) =
(d)
C 52 0,40 2 0,60 3 + C 53 0,40 3 0,60 2 + C 54 0,40 4 0,601 = 0,6528
10
Modelo de Poisson
e t ( t ) x
fmp: f ( x, t ) = , x = 0,1,2,.......
x!
Notao: X ~ Pois(t )
Exemplo 8: Numa central telefnica chegam 300 chamadas por hora. Qual a probabilidade
de que:
300
= = 5 o nmero esperado de chamadas em 1 minuto ( t = 1 )
60
(a) P( X = 0) = e ( )0 = e 5 = 0,00673
0!
(b) P( X = 8) = e 2
(2 )8 = e 10 10 8 = 0,1126
8! 8!
11
P( X 2) = 1 P( X < 2) = 1 P( X 1) = 1 P ( X = 0) P( X = 1) =
(c) (2,5)0 + e 2,5 (2,5)1 = 1 0,2873 = 0,7127
1 e 2 , 5
0! 1!
Notao: X ~ U [a, b]
0, x < a
0, x (a, b) x a
f ( x) = 1 ; F ( x) = ,a x b
b a , a x b b a
1, x > b
( a + b) (b a) 2
EX = , Var ( X ) =
2 12
Exemplo 9: considere um relgio circular de ponteiros. O relgio pode parar, por falta de
bateria, em qualquer quadrante. Defina X o ngulo formado pelo ponteiro maior quando
o relgio parar. Determinar:
(a) fdp (b) fda (c) probabilidade do ponteiro parar entre -90 e 0 graus
12
Soluo:
0, x < 360
1 x + 360
,360 x 0
(a) f ( x) = 360 (b) F ( x) = ,360 x 0
0, c.c. 360
1, x > 0
360 90 + 360 1
(c) P(90 X 0) = F (0) F (90) = =
360 360 4
Modelo Exponencial
Notao: X ~ Expon( )
0, x 0
Funo densidade de probabilidade: f ( x) = x ; >0
e , x > 0
0, x 0
Funo de distribuio acumulada: F ( x) = x
1 e , x > 0
1 1
Esperana e varincia da exponencial: EX = , Var ( X ) =
2
13
(a)
P(300 X 600) = F (600) F (300) = 1 e 600 (1 e 300 ) = e 0,6 e 1, 2 = 0,247617
1
(b) A media de X = = 500 . Assim,
P( X > 500) = 1 F (500) = 1 (1 e 500 ) = e 1 = 0,367879
Funo densidade: a fdp tem forma de sino e tem dois parmetros: R e > 0
1 1 x 2
f ( x, , ) = exp , < x < + ;
2 2 2
Notao: X ~ N ( , ) .
14
Tabulao da distribuio Normal padro
Propriedades de
(4) P( Z b) = 1 (b)
a X b a b b a
P ( a X b) = P = P Z =
15
Nota: Na figura acima, as reas A e B tm formas diferentes, mas tem mesmo valor.
16
Exemplo 11: Seja Z ~ N (0;1) .
Notas Conceito
0 X <5 D
5 X < 7,5 C
7,5 X < 9 B
9 X 10 A
Soluo:
17
Tabela da Normal Padro Inversa: 1 : fornece as coordenadas tais que z = 1 ( ) ,
ou seja:
Soluo:
(a) z = 1,96
18
Tambm poder utilizar a tabela da normal inversa, com a rea unilateral de 0,025, como
mostra a figura abaixo:
(b) z=1,6445.
19
2 ANLISE BIDIMENSIONAL
(
f ( x, y ) = P X = xI Y = y , ) x X e y Y
Propriedades:
(1) 0 f ( x, y ) 1 , x, y
(2) x y
f ( x, y ) = y x f ( x, y ) = 1
X nmero de meninos
1
P( H ) = P( M ) =
2
1 1 1 1
( ) ( )
f (0,0) = P X = 0I Y = 0 = P M I M I M = P( M ) P ( M ) P ( M ) = =
2 2 2 8
(
f (0,1) = P X = 0I Y = 1 = P() = 0 )
2
( ) (
f (1,0) = P X = 1I Y = 0 = P M I H I M + P M I M I H = ) ( ) 8
20
1
( )
f (1,1) = P X = 1I Y = 1 = P H I M I M = ( ) 8
1
(
f (2,0) = P X = 2I Y = 0 = P M I H I H = ) ( ) 8
2
( )
f (2,1) = P X = 2I Y = 1 = P H I H I M + P H I M I H = ( ) ( ) 8
(
f (3,0) = P X = 3I Y = 0 = P() = 0 )
1
( )
f (3,1) = P X = 3I Y = 1 = P H I H I H = ( ) 8
Y
X 0 1 2 3
0 1/8 2/8 1/8 0 1/2
1 0 1/8 2/8 1/8 1/2
1/8 3/8 3/8 1/8 1
f X ( x ) = P ( X = x ) = f ( x, y ) , x X
y
f Y ( y ) = P(Y = y ) = f ( x, y ) , y Y
x
Exemplo 2: no Exemplo 1,
x 0 1 2 3
f X (x) 1/8 3/8 3/8 1/8 1
y 0 1
f Y ( y) 1/2 1/2 1
Y binomial(n=1,p=0,5)
21
Definio 3 (Funo massa de probabilidade condicional):
f ( x | y ) = P( X = x | Y = y ) =
(
P X = xI Y = y )= f ( x, y )
, f Y ( y) > 0
P (Y = y ) f Y ( y)
f ( y | x) = P(Y = y | X = x ) =
(
P X = xI Y = y )= f ( x, y )
, f X ( x) > 0
P ( X = x) f X ( x)
Exemplo 3:
X nmero de acidentes
Y = 1, se for motocicleta
2, se for automvel
3, se for caminho ou nibus
Y
X 1 2 3 4 5
1 2/48 4/48 2/48 2/48 6/48 16/48
2 1/48 2/48 1/48 1/48 6/48 11/48
3 3/48 6/48 3/48 3/48 6/48 21/48
6/48 12/48 6/48 6/48 18/48 1
distribuies marginais
y 1 2 3
f Y ( y) 16/48 11/48 21/48 1
x 1 3 3 4 5
f X ( x) 6/48 12/48 6/48 6/48 18/48 1
distribuio condicional de ( X | Y = 1)
x 1 2 3 4 5
f ( x | y = 1) 2/16 4/16 2/16 2/16 6/16 1
22
4 / 48
Por exemplo, f (2 | y = 1) = = 4 / 16
16 / 48
( )
f ( x, y ) = P X = xI Y = y = P( X = x ) P(Y = y ) = f X ( x) f Y ( y ) , para quaisquer x, y
2
f (1,1) =
48
f (1,1) = f X (1) f Y (1)
6 16 2
f X (1) f Y (1) = =
48 48 48
4
f (2,1) =
48
f (2,1) = f X (2) f Y (1)
12 16 4
f X (2) f Y (1) = =
48 48 48
1
f (1,2) =
48
f (1,2) f X (1) f Y (2) ,
6 11
f X (1) f Y (2) =
48 48
logo X e Y no so independentes.
W = X Y
Y
X 1 2 3 4 5
1 2/46 3/46 2/46 4/46 5/46 16/60
2 1/46 4/46 3/46 2/46 4/46 14/60
3 2/46 3/46 2/46 4/46 5/46 16/46
5/46 10/46 7/46 10/46 14/46 1
23
( X ,Y ) T = X +Y W = X Y
(1,1) 2 1
(1,2) 3 2
(1,3) 4 3
(2,1) 3 2
(2,2) 4 4
(2,3) 5 6
(3,1) 4 3
(3,2) 5 6
(3,3) 6 9
(4,1) 5 4
(4,2) 6 8
(4,3) 7 12
(5,1) 6 5
(5,2) 7 10
(5,3) 8 15
t 2 3 4 5 6 7 8
f T (t ) 2/46 4/46 8/46 10/46 9/46 8/46 5/46 1
Por exemplo,
[ ]
P(T = 4) = f T (4) = P ( X = 1 Y = 3)U ( X = 3 Y = 1)U ( X = 2 Y = 2) =
2 2 4 8
f (1,3) + f (3,1) + f (2,2) = + + =
46 46 46 46
24
w
1 2 3 4 5 6 8 9 10 12 15
f W (w) 2/46 4/46 4/46 8/46 5/46 6/46 2/46 2/46 4/46 4/46 5/46 1
Por exemplo,
1 3 4
[ ]
P(W = 2) = f W (2) = P ( X = 1 Y = 2)U ( X = 2 Y = 1) = f (1,2) + f (2,1) = + =
46 46 46
Resultados:
Exemplo 6: suponha que um jogador lana uma moeda honesta quatro vezes e o outro
jogador lana outra moeda honesta cinco vezes. Qual a probabilidade de que no total dos
lanamentos dos jogadores ocorram:
Soluo:
Seja X denotando o numero de caras obtidas pelo primeiro jogador e Y pelo segundo.
Ento X binomial de parmetros n = 4 ; p = 0,5 e Y binomial de parmetros
m = 5 ; p = 0,5 . Uma que X e Y so v.as independentes, T=X+Y binomial de
parmetros n + m = 9 e p = 0,5 .
25
Exemplo 7: Em uma central telefnica, o nmero de chamadas que chegam no intervalo
(t 0 ; t1 ] Poisson de parmetro 1 , e o de chamadas no intervalo (t1 ; t 2 ] Poisson de
parmetro 2 . Sabendo-se ter havido n chamadas em (t 0 ; t 2 ] , qual a probabilidade de
que o nmero de chamadas em (t 0 ; t1 ] tenha sido x , 0 x n ?
Soluo:
P( X = x | T = n ) =
(
P [ X = x]I [T = n] ) = P([ X = x]I[Y = n x]) =
P (T = n ) P(T = n )
exp{1 } (1 ) exp{ 2 } ( 2 )
x n x
P( X = x ) P(Y = n x ) x! (n x)!
= = =
P (T = n ) exp{1 2 } (1 + 2 )
n
n!
x n x
1 2
= C
x
n
1 + 2 1 + 2
60 520
40 500
P( X = 60 | T = 580) = C 580
60
= 0,00205
540 540
26
Exemplo 8: a distribuio dos pesos das pessoas que moram em um edifcio segue uma
normal de esperana = 70 kg e varincia 2 = 16 kg para homens, e = 55 kg
e varincia 2 = 9 kg para mulheres. Se um homem e uma mulher desse edifcio
entrarem no elevador vazio, qual a probabilidade de que o peso total dessas duas pessoas:
Cov( X , Y ) = E [( X EX ) (Y EY )] = E ( XY ) E ( X ) E (Y ) ,
onde , E ( XY ) = xy f ( x, y ) , E ( X ) = x f X ( x) , E (Y ) = y f Y ( y )
x y x y
Cov( X , Y ) E ( XY ) E ( X ) E (Y )
( X ,Y ) = = ,
Var ( X ) Var (Y ) Var ( X ) Var (Y )
27
Observaes: Covarincia tem como unidade de medida o produto das unidades de X
e Y, e por isso de difcil interpretao. Por outro lado, a correlao uma medida
relativa (sem unidade), sendo mais fcil a interpretao.
Resultados:
(1) 1 ( X , Y ) 1 ;
28
(4) se Y e X forem independentes ento ( X , Y ) = 0 . Contudo, a recproca no vale,
( X , Y ) = 0 no implica Y e X independentes.
Exemplo 9:
Y
X 0 1 2 3
0 0 0 0 1/8 1/8
1 0 0 3/8 0 3/8
2 0 3/8 0 0 3/8
3 1/8 0 0 0 1/8
1/8 3/8 3/8 1/8 1
E ( X ) = E (Y ) = 1,5 ;
29
x 1 2 3 4 5 6
f X (x) 1/6 1/6 1/6 1/6 1/6 1/6 1
y 1 2 3 4 5 6
f Y ( y) 1/6 1/6 1/6 1/6 1/6 1/6 1
Y
X 1 2 3 4 5 6
1 1/36 1/36 1/36 1/36 1/36 1/36 1/6
2 1/36 1/36 1/36 1/36 1/36 1/36 1/6
3 1/36 1/36 1/36 1/36 1/36 1/36 1/6
4 1/36 1/36 1/36 1/36 1/36 1/36 1/6
5 1/36 1/36 1/36 1/36 1/36 1/36 1/6
6 1/36 1/36 1/36 1/36 1/36 1/36 1/6
1/6 1/6 1/6 1/6 1/6 1/6 1
E ( X ) = E (Y ) = 3,5 ;
441
E ( XY ) = = 12,25 = E ( X ) E (Y ) Cov( X , Y ) = 0
36
30
3 - AMOSTRAGEM E ESTIMAO DE PARMETROS
Aqui nos concentraremos na amostragem aleatria simples (aas). Uma aas pode ser
extrada de uma populao de acordo com os critrios:
1
P(uma amostra de tamanho n )=
Nn
(b) Sem reposio
1
P(uma amostra de tamanho n ) = , desconsiderando a ordenao na amostra
C Nn
1
, considerando a ordenao na amostra
ANn
31
Soluo:
N=60
n=15
1
P(uma escola qualquer ser escolhida no 1 sorteio)=
60
1
P(uma amostra qualquer)= 15
C 60
Definio 3: uma estatstica (ou estimador) uma caracterstica numrica da amostra, isto
, uma estatstica uma funo de ( X 1 , X 2 , L, X n ) .
Notao: T = f ( X 1 , X 2 ,.... X n )
32
n
X i
Exemplo 5: P = i =1
, onde X i = 1, se for RH+
n
= 0, se for RH-
Nota: uma vez que a estatstica funo de vas, ento tambm ser aleatria.
25
Exemplo 6: numa amostra de 30 pessoas, 25 tem RH+. Assim, p = = 0,83 .
30
Notaes usuais:
Amplitude H h
Proporo P p
Correlao R r
33
3.3. Propriedades dos Estimadores:
k 2
fi X i 2
( )
Exemplo 8: E S 2 = 2 , mas E V 2 ( ) 2 , onde V 2 = i =1 X .
n
2
Exemplo 9: como E ( X ) = e lim n Var X = lim n = 0 , ento X
n
consistente.
34
Exemplificao de quatro estimadores onde foram feitas 18 observaes
n
i =1
Xi
amostra. Ento, para X = , tem-se :
n
(i) E ( X ) =
2 2 N n
(ii) Var ( X ) = se for com reposio e Var ( X ) = para o caso sem
n n N 1
reposio.
(iii) X o estimador de varincia mnima dentre os estimadores lineares no-
tendenciosos.
35
N n
Observao: o quociente dito fator de correo para populao finita. Note
N 1
2
que para N suficientemente grande, Var ( X ) prxima de .
n
n
i =1
Xi (1 )
Corolrio 3.3.1: para P= , tem-se que E (P) = , Var ( P) = se
n n
(1 ) N n
for com reposio e Var ( P) = se for sem reposio.
n N 1
Exemplo 10: seja uma populao de 5 elementos (2 pases da frica e 3 asiticos) cuja v.a.
X = taxa de crescimento anual tem a seguinte distribuio de probabilidade:
X 1 3 5 7
P(X=x) 1/5 1/5 2/5 1/5 1
Para uma amostra de tamanho n=2 , com reposio, construa a distribuio amostral de
X + X2
X = 1 .
2
Soluo: X 1 , X 2 so iid (independentes e identicamente distribudas) segundo a v.a X,
isto :
P ( X 1 = x) = P ( X 2 = x) = P ( X = x )
P ( X 1 = xI X 2 = y ) = P ( X 1 = x ) P ( X 2 = y )
36
Distribuio de probabilidade conjunta de ( X 1 , X 2 )
X2 1 3 5 7
X1
1 1/25 1/25 2/25 1/25 1/5
3 1/25 1/25 2/25 1/25 1/5
5 2/25 2/25 4/25 2/25 2/5
7 1/25 1/25 2/25 1/25 1/5
1/5 1/5 2/5 1/5 1
Valores possveis de X :
Amostra
x
(1,1) 1
(1,3) (3,1) 2
(3,3) (1,5) (5,1) 3
(1,7) (7,1) (5,3) (3,5) 4
(5,5) (3,7) (7,3) 5
(7,5) (5,7) 6
(7,7) 7
Populao dos valores possveis de X : {1,2,3,4,5,6,7}
1 1 1
P( X = 1) = P ( X 1 = 1) P( X 2 = 1) = =
5 5 25
P( X = 3) = P( X 1 = 1I X 2 = 5) + P( X 1 = 5I X 2 = 1) + P ( X 1 = 3I X 2 = 3) =
2 2 1 5
= + + =
25 25 25 25
Distribuio de probabilidade de X :
x
1 2 3 4 5 6 7
1/25 2/25 5/25 6/25 6/25 4/25 1/25 1
P( X = x )
37
EX 1 = EX 2 = = 4,2
2
2
1 2 1
Var ( X ) = x P( X = x) E ( X ) = 12 + 22 + .... + 7 2 2 =
i 25 25 25
3.4.
4,16 2
= =
2 n
O conjunto de todas amostras de mesmo tamanho formam uma populao, que tem
uma distribuio de probabilidade referente estatstica T , a qual recebe o nome de
distribuio amostral da estatstica T .
Exemplo 12: Uma populao tem distribuio normal de mdia 800 e desvio padro 60.
Determine a probabilidade de uma amostra aleatria apresentar mdia amostral entre
781,4 e 818,6 quando: (a) n = 9 (b) n = 25
38
X E X
Soluo: a varivel Z = = X n tem distribuio normal padro.
Var X
781,4 800 818,6 800
P 781,4 X 818,6 = P 9 Z 9 =
(a) 60 60
(0,93) ( 0,93) = 0,8238 0,1762 = 0,6476
(b) P 781,4 X 818,6 = (1,55) ( 1,55) = 0,9394 0,0606 = 0,8788
Estimao por intervalo: a estimao por ponto no permite julgar a magnitude do erro
que estamos cometendo. Da surge a idia de construir os intervalos de confiana, que so
fundamentados na distribuio amostral do estimador.
P( I .C.) =
Teorema 3.4.2 (Teorema Central do Limite): Para uma amostra aleatria ( X 1 ,...., X n )
e um estimador Tn = f ( X 1 ,...., X n ) de mxima verossimilhana do parmetro , tal que
E (Tn ) = , tem-se:
39
Tn E (Tn ) }
n
Zn = N (0,1)
Var (Tn )
Pelo TCL,
X E X
P z tab z tab 1 P X z tab X + z tab 1 ,
n n
Var X
40
IC = X , onde = z tab
dito erro de estimao (ou erro amostral).
n
Exemplo 13: suponha que se esteja estudando a altura de pessoas numa certa populao.
Sabe-se que =15. A amostra de 100 indivduos resultou em x =170 . Construa
intervalos de confiana para a mdia populacional com:
Soluo:
15 15
(a) = 2,4675 ; I.C= 170 1,645 ;170 + 1,645 = [167,54;172,46]
100 100
15 15
(b) = 2,94 ; I.C= 170 1,96 ;170 + 1,96 = [167,06;172,94]
100 100
15 15
(c) = 3,86625 ; I.C= 170 2,575 ;170 + 2,575 = [166,14;173,85]
100 100
41
Interpretao do Intervalo de Confiana: espera-se que (1 ) 100% dos
intervalos originados de amostras de mesmo tamanho contenham o parmetro .
Observaes:
(1) No se utiliza grau de confiana igual a 100%, pois neste caso o intervalo fica a
prpria reta real! De fato, para que P( z tab Z z tab ) = 1 , ento preciso que
z tab = + .
(3) No existe um valor ideal para o grau de confiana. Nunca se deve utilizar os
extremos de 0% e 100%. Os valores mais usuais so 0,99; 0,95 e 0,90, mas no h uma
justificativa formal para us-los, so apenas valores de referncia mais encontrados em
artigos e livros.
42
(4) O desvio padro influencia diretamente na amplitude do I.C., ou seja, se for
grande, ento o I.C. ser amplo. O grau de confiana tambm responsvel pela amplitude
do I.C. Mantendo fixado, se n aumentar ento a amplitude do I.C. ir diminuir, ou
seja, ficar mais preciso.
A distribuio t-student:
43
Em inferncia estatstica esse parmetro assume valores inteiros positivos e tem a
denominao de graus de liberdade. O conceito de graus de liberdade (GL) o nmero de
valores que poderemos atribuir de maneira arbitrria. Por exemplo, suponha que temos trs
parcelas, cujos valores devem ser no negativos e somarem 14:
4 + 7 + = 14
Ento, teremos a liberdade de atribuir apenas dois valores, pois o ltimo ficar
amarrado (determinado).
A tabela da t-student tal que se voc entrar com GL e a rea, voc obter a
coordenada. Para GL maior que 120, utiliza-se a normal padro.
44
Modelo de Tabela t-student
S
IC = X t tab , onde t tab tal que P (| T | t tab ) = , T ~ t (n 1)
n
100 100
Soluo: IC = 800 2,7564 ;800 + 2,7564 = [749,68;850,31]
30 30
45
3.6.3. IC para a varincia populacional 2
46
Modelo de Tabela Qui-Quadrado
(n 1) S 2 (n 1) S 2
O intervalo de confiana para a varincia : IC = , , onde
qsup q inf
(n 1) S 2 (n 1) S 2
O intervalo de confiana para o desvio padro : IC = ,
qsup q inf
Exemplo 15: O setor de qualidade de uma indstria de parafusos deseja estimar a variao
dos comprimentos de parafusos produzidos. Obtenha intervalo de confiana de grau 95%
para . A amostra foi a seguinte: 12,2 12,4 12,1 12,0 12,7 12,4 14,0 13,7 13,9 14,1
13,9 13,7 13,5 12,2 12,5 13,6.
Soluo: x = 13,05625 s 2 = 0,634624 s = 0,796633
15 0,634624 15 0,634624
IC = ; = [0,58848;1,23295]
27,4884 6,2621
47
3.6.4. IC para a proporo populacional
P (1 P)
IC = P z tab , onde P a proporo amostral e z tab tal que
n
2(1 ( z tab ) ) = .
{1; 0; 1; 1; 1; 1; 0; 0; 1; 1; 0; 0; 0; 0; 0; 1; 0; 0; 1; 0}
1 a favor; 0 contra
9
Soluo: p = = 0,45
20
Estimao da mdia
Vimos que para a mdia populacional, I .C. = X , X + , onde
= z tab o erro de estimao absoluto. Isolando n nesta ltima equao obtemos
n
o tamanho da amostra:
2 2
populao infinita: n = ( z tab ) , z tab tal que 2(1 ( z tab ) ) =
2
n N
populao finita: m = .
N +n
48
Observaes:
(1) se for desconhecido ento utiliza-se algum valor em uma pesquisa semelhante que
j foi realizada, ou procede-se em uma pesquisa piloto (amostra inicial)
(2) O tamanho da amostra n e o erro de estimao tem relao inversa, como mostra
a figura:
Exemplo 17: deseja-se estimar a renda dos moradores do bairro da Gvea , no Rio de
Janeiro, sabendo-se que o desvio padro da renda de 300,00. Exige-se um erro absoluto
mximo de 20,00 e um grau de confiana de 95%. Qual deve ser o tamanho da amostra?
1,96 2 300 2
Soluo: n = = 864,36 865
20 2
5000 864,36
Supondo N=5000, m = = 736,96 737
5000 + 864,36
Estimao da proporo
2 (1 )
populao infinita: n = ( z tab ) , z tab tal que 2(1 ( z tab ) ) =
r2
49
n N
populao finita: m = .
N +n
Observaes:
(1) o erro de estimao para a proporo est em termos relativos, visto que uma
proporo uma medida relativa (sem unidade de medida).
(2) Se for desconhecida, pode-se utilizar alguma estimativa de uma pesquisa anterior.
Tambm pode-se assumir o maior valor possvel (1 ) = 0,25 . Desta forma,
(z tab )2 0,25
n= .
r2
1
(3) Alguns autores adotam z tab = 2 e (1 ) = 0,25 . Assim, n =
r2
Soluo:
30
p= = 0,6 ;
50
2
n=
(2,575) 0,6 0,4
= 636,54 637 ; m=
4000 636,54
= 549,15 550
2
0,05 4000 + 636,54
50
4 TESTES DE HIPTESES
4.1. Definies
Hipteses : B = C e B < C
Hipteses estatsticas
51
O quadro abaixo apresenta o que pode acontecer em um teste de hipteses:
52
4.2 - Etapas de um teste de hipteses
H0 : = 0 H1 : 0 (bilateral)
< 0 (unilateral esquerda)
> 0 (unilateral direita).
Observaes:
(3) Hipteses unilaterais levam a um teste mais rigoroso (menor regio de aceitao de
H 0 , quando comparados aos bilaterais.
53
4.3. Testes de hipteses
H 0 : = 0
X 0
estatstica do teste: z c = n
54
55
Observaes:
(1) No rejeitar a hiptese nula significa no haver evidncia suficiente para duvidar de
sua validade, portanto, conclui-se que = 0 , ou seja, qualquer diferena observada
entre a mdia amostral e o valor sob H 0 ser considerada uma ocorrncia casual, e
no representa uma real diferena. Contudo, existe a possibilidade de ocorrer o erro tipo
II, ou seja, uma diferena que no foi reconhecida.
(2) Rejeitar a hiptese nula significa haver evidncia suficiente para duvidar da
validade de H 0 . A diferena entre a mdia amostral e o valor sob H 0 grande demais
para ser explicada apenas pelo erro amostral.
(3) se for grande, a estatstica z c no ser sensvel o bastante para detectar diferena
significante entre X e 0 .
(4) aumentando a amostra, o teste ficar mais sensvel para detectar diferenas
significativas.
(5) O teste unilateral mais rigoroso que o bilateral. Na figura abaixo, o valor tabelado do
(u ) (b)
teste unilateral menor que no bilateral. Se z tab < z c < z tab , ento o teste unilateral ir
rejeitar a hiptese nula, mas o bilateral no.
56
Exemplo 3: uma linha de produo fabrica parafusos cujo dimetro tem desvio padro
= 1,22716 . Tomou-se uma amostra de tamanho 20, cujas estatsticas foram x = 3,735 e
s = 3,8756 . Com = 0,05 , teste H 0 : = 5 contra
Soluo:
3,735 5
zc = 20 = 4,61
1,22716
X < K
X 5 K = 4,54998
20 < 1,645
1,22716
Assim, a regio crtica X < 4,54998 . Portanto,
X 1 4,54998 4
1 = P X < K H 1 = P n < 20 =
1,22716
= P(Z < 2 ) = (2) = 0,9772498
Logo, = 0,02275 .
(d) Temos que encontrar um - z tab tal que z c > z tab . Note que z tab = 4,65 leva-nos
aceitao! Mas, = P( Z z tab ) = 0,000001659 , que um absurdo!
57
(b) desvio padro populacional desconhecido
H 0 : = 0
X 0
Estatstica do teste: t c = n
S
58
Exemplo 4: em relao ao Exemplo 3, vamos supor que era desconhecido. Use
= 0,05 .
3,735 5
Soluo: t c = 20 = 1,4597
3,8756
3,8756
Nota: como CV = 100% = 103,76% elevado, o teste no foi sensvel o
3,735
bastante para detectar diferena significativa!
59
4.3.2. Teste de hipteses para a proporo de uma populao
H0 : = 0
P 0
Estatstica do teste: z c = n , sendo P a proporo amostral.
(1 )
0 0
Exemplo 5: uma estao de TV afirma que 60% dos televisores estavam ligados no seu
programa especial de sbado. Uma rede concorrente deseja contestar essa afirmao, e
decide entrevistar 200 domiclios. Desses 200, 104 deram respostas afirmativas. Teste a
hipteses H 0 : = 0,6 e H 1 : < 0,6 , com : (a) = 0,01 (b) = 0,05 .
0,52 0,6
Soluo: z c = = 2,31
0,24
200
60
4.3.3. Teste de hipteses para a varincia de uma populao
H 0 : 2 = 02 ;
S 2 (n 1)
Estatstica do teste: q c =
02
onde P( X qsup ) = , P( X qinf ) = 1 , X ~ Qui Quadrado(n 1)
2 2
61
Exemplo 6: para o exemplo do dimetro dos parafusos, deseja-se testar H 0 : 2 = 0,65
contra H 1 : 2 0,65 . Use = 0,05 .
15 0,634624
qc = = 14,645 . Como 6,262 < q c < 27,488 no rejeitamos H 0
0,65
H 0 : X = Y
62
X Y
Estatstica do teste: z c = , n o tamanho da amostra para X e m para Y
2 2
X + Y
n m
Exemplo 8: Uma mquina automtica enche latas com base no peso lquido, com
variabilidade praticamente constante e independente dos ajustes da mdia, onde = 5 g.
Duas amostras retiradas em dois perodos de trabalho consecutivos, de quinze e dez
latas, respectivamente, resultaram pesos lquidos mdios de 188,9 e 184,6 g. Desconfia-se
que a regulagem da mquina quanto ao peso mdio possa ter sido modificada entre a
coleta das duas amostras. Qual a concluso ao nvel de significncia de 5%?
Soluo: H 0 : X = Y contra H 1 : X Y
188,9 184,6
zc = = 2,10656
1 1
5 +
15 10
H 0 : X = Y
(n 1) S X2 + (m 1) S Y2
Estatstica do teste: t c = ,
XY
S=
1 1 n+m2
S +
n m
63
H 1 bilateral ( X Y ): rejeita H 0 se | t c | > ttab , P(| T |> t tab ) = , T ~ t ( n + m 2)
Estatsticas A B
Mdia 68 76
Varincia 50 50,8
Amostra 12 15
14 50,8 + 11 50 76 68
s= = 7,1026 ; tc = = 2,908 ; t tab = 1,7081
25 1 1
7,1026 +
15 12
Como t c > t tab rejeitamos H 0 .
64
A amostra ser de pares (X1, Y1), (X2, Y2), ..., (Xn, Yn). A estatstica do teste
ser construda atravs da diferena D = X Y, que mede o efeito (diferena) entre os
dois tratamentos.
H0 : D = 0
D
Estatstica do teste: t c = n , onde D e S D so a mdia e o desvio padro
SD
amostrais, respectivamente.
Ao nvel de 10% possvel afirmar que a tarefa realizada na mquina X demora mais do
que na mquina Y?
5
d = 5 e s D = = 1,8708 ; t c = 5 = 5,98 , t tab = 1,533 . Como t c > t tab ,
1,8708
rejeitamos H 0 .
65
4.3.6. Teste de hipteses para a igualdade de propores de populaes
independentes
H 0 : X = Y
PX PY
Estatstica do teste: z c = , PX , PY so as propores amostrais
PX (1 PX ) PY (1 PY )
+ )
n m
0,05 0,052
zc = = 0,092
0,05 (1 0,05 ) 0,052(1 0,052)
+
200 210
Para teste unilateral esquerda, com = 0,05 , aceita-se H 0 , pois - z tab = 1,645 . Mas,
qual valor de levaria rejeio de H 0 ? Temos que encontrar um - z tab tal que
z c < z tab . Note que - z tab = 0,09 leva-nos rejeio. Mas,
66
(1) preciso um senso crtico ao se aplicar um teste de hipteses. claro que, dependendo
do nvel de significncia adotado, poderemos rejeitar ou aceitar H 0 . Num teste de
hipteses, o usurio pode estar movido por uma extrema vontade de rejeitar H 0 , sendo
assim, ele vai encontrar um valor de que atenda aos interesses dele, mesmo que o valor
seja um absurdo, por exemplo = 0,60 . Logo, devemos ser o mais imparcial possvel.
(2) A significncia prtica outro aspecto a ser considerado. Suponha que se esteja
fazendo um teste sobre o dimetro mdio, em centmetros, de eixos de tratores em uma
linha de montagem. As hipteses so: H 0 : = 10 H 1 : 10 , com = 0,05 .
Suponha que uma amostra de 2000 eixos resultou X = 10,01 e S = 0,2 . A estatstica do
10,01 10
teste resultou em t c = 2000 = 2,24 . Para = 0,05 , t tab = 1,96 , levando-nos
0,2
rejeio de H 0 . Mas, pensando nos aspectos prticos, o engenheiro responsvel pelo setor
considera que essa diferena de 0,01 cm irrelevante, no causar problemas para o trator.
Embora o teste acusou uma diferena estatisticamente significativa, essa diferena no tem
importncia prtica. Uma vez que o engenheiro afirma que essa diferena no relevante,
poderemos adotar um valor menos rigoroso para , por exemplo, =0,01, cujo valor
tabelado t tab = 2,575 , e assim no rejeitaramos H 0 .
(3) Pode acontecer o contrrio que em (2) acima. Por exemplo, suponha que se esteja
realizando um teste de hipteses sobre a receita (em milhes de reais) de um municpio:
Dispondo-se de uma amostra de tamanho 15, os resultados foram: X = 1130 e S = 720 .
1130 1030
A estatstica do teste resultou em t c = 15 = 0,54 . Para = 0,05 ,
720
t tab = 2,15 , levando-nos no rejeio de H 0 . Note que a diferena entre a mdia amostral
e o valor sob H 0 de 100 unidades monetrias, que considerada elevada, mas o teste no
foi sensvel o bastante para detectar. Isto ocorreu devido ao elevado coeficiente de variao
67
5 PROBABILIDADE E ESTATSTICA PELO COMPUTADOR
68
H diversos softwares estatsticos: SPSS, SAS, MINITAB, R, BIOESTAT e
outros. O software R um programa mais avanado, mas de domnio pblico e pode ser
obtido gratuitamente no site R-Project. Outra opo o Matlab, que possui mdulos de
Estatstica, e tambm o Scilab, similar ao Matlab. O Scilab gratuito.
O SPSS realiza testes de hipteses e intervalos de confiana para uma, duas ou mais
amostras (de populaes independentes e dependentes). A sada fornecida pelo SPSS
consta de dois mdulos:
Estatsticas descritivas: contm mdia amostral, desvio padro, erro padro da mdia,
tamanho da amostra.
69
Inferncia: contm estatstica do teste, graus de liberdade (df), significncia bilateral
(valor-p) e intervalo de confiana. Caso o usurio deseje um teste unilateral, basta dividir
o valor-p por 2 e comparar com .
Exemplo 1: teste a hiptese de que a receita de um municpio (em milhes) seja de 1229.
Receita: 1230 582 576 2093 2621 1045 1439 717 1838 1359
Para executar o teste pelo SPSS voc deve seguir os seguintes passos:
T-Test
n mdia
Desvio Erro padro da
padro mdia
RECEITA 10 1350,0000 675,8246 213,7145
675,8246
CV = 100 = 50% .
1350
70
O teste t resultou na estatstica t c =,566, cujo valor-p (sig) 0,585. Se fixarmos
= 0,05 no h evidncias para rejeitar H0: = 1229 . Note que embora a diferena entre a
mdia amostral e o valor sob H0 foi de 121, o teste no foi sensvel o bastante para
detectar esta diferena, isto porque o coeficiente de variao elevado.
Dimetro: 56,5 56,6 56,6 56,7 56,7 56,8 56,8 56,8 56,8 56,9 56,9 56,9 56,9 56,9 56,9 56,9
56,9 56,9 56,9 57 57 57 57 57 57,1 57,1 57,1 57,1 57,2 57,2 57,3
T-Test
0,1828
CV = 100 = 0,321%
56,9161
71
Exemplo 3: comparar duas marcas de pneus quanto aos quilmetros percorridos.
1 Marca : 34,00 38,00 31,00 35,00 36,00 37,00 32,00 32,00 31,00 34,00 35,00 35,00
36,00 34,00
2 Marca : 30,00 32,00 32,00 33,00 33,00 30,00 28,00 32,00 30,00 33,00 32,00 33,00
29,00 32,00 31,00
Para executar o teste pelo SPSS voc deve seguir os seguintes passos:
digitar os dados na planilha em duas colunas
Km Marca
34 1
38 1
31 1
35 1
36 1
37 1
32 1
32 1
31 1
34 1
35 1
35 1
36 1
34 1
30 2
32 2
32 2
33 2
33 2
30 2
28 2
32 2
30 2
33 2
32 2
33 2
29 2
32 2
31 2
72
O prximo passo executar os comandos:
T-Test
Peso no incio: 635,00 704,00 662,00 560,00 603,00 745,00 698,00 575,00 633,00 669,00
Peso no final: 640,00 712,00 681,00 558,00 610,00 740,00 707,00 585,00 635,00 682,00
73
Peso inicial Peso final
635 640
704 712
662 681
560 558
603 610
745 740
698 707
575 585
633 635
669 682
T-Test
74
6 PLANEJAMENTO DE EXPERIMENTOS
Definio: fator (ou tratamento) uma varivel que est sendo atribuda (ou controlada)
durante o experimento, pode ser qualitativa ou quantitativa.
75
Classificao dos delineamentos experimentais
Matriz de observaes
Tratamentos
1 2 .......................... k
y1,1 y 2,1 y k ,1
y1, 2 y 2, 2 y k ,2
y1,n1
y 2,n 2 y k ,nk
Total T1 T2 Tk
Mdia T1 y = T2 .......................... Tk
y1 = 2 yk =
n1 n2 nk
k
n = ni
i =1
k o nmero de tratamentos
O modelo matemtico
a mdia geral
76
i a mdia do i-simo tratamento
i , j o erro aleatrio
k ni
^
y i, j
Estimativa para yi , j : y i , j = y + y i , y = i =1 j =1
.
n
77
2
k ni
k ni
Soma de quadrados total: SQT= y i , j y = yi2, j C
i =1 j =1 i =1 j =1
k ni
y
i =1 j =1
i, j
2
2
k k
T
Soma de quadrados entre: SQE= ni yi y = i C
i =1 i =1 ni
n 2
i k
Soma de quadrados dentro: SQD= y i , j y j =SQT SQE
i =1 j =1
A Distribuio de Fisher-Snedecor
Notao: F (n 1; m 1)
78
Regra de deciso na anlise de varincia: a estatstica F tem distribuio de
Fisher-Snedecor, de argumentos k-1 e n-k. Para um nvel de significncia fixado, rejeita-
se Ho se F > Ftab . Equivalentemente, pode-se calcular a significncia amostral (valor-
p). Usando o valor-p, rejeita-se Ho se valor-p < .
79
Exemplo 4: produo de milho em kg/100m2 segundo a variedade.
y 1 = 23 ; y 2 = 27 ; y 3 = 26 ; y 4 = 31
535
y= = 26,75 , C = 14311,25
20
80
Variedade Produo
1,00 25,00
1,00 26,00
1,00 20,00
1,00 23,00
1,00 21,00
2,00 31,00
2,00 25,00
2,00 28,00
2,00 27,00
2,00 24,00
3,00 22,00
3,00 26,00
3,00 28,00
3,00 25,00
3,00 29,00
4,00 33,00
4,00 29,00
4,00 31,00
4,00 34,00
4,00 28,00
Oneway
Descrio da amostra
PRODU
n MdiaDesvio Erro padro Intervalo de Min Max
padro confiana de 95%
para mdia
Limite inferior Limite superior
1,00 5 23,0000 2,5495 1,1402 19,8344 26,1656 20,00 26,00
2,00 5 27,0000 2,7386 1,2247 23,5996 30,4004 24,00 31,00
3,00 5 26,0000 2,7386 1,2247 22,5996 29,4004 22,00 29,00
4,00 5 31,0000 2,5495 1,1402 27,8344 34,1656 28,00 34,00
Total 20 26,7500 3,8096 ,8519 24,9670 28,5330 20,00 34,00
81
Tabela de anlse de varincia
PRODU
Fonte de Soma de gl Quadrado F Sig.
variao quadrados mdio
Entre 163,750 3 54,583 7,798 ,002
grupos
Dentro 112,000 16 7,000
dos
grupos
Total 275,750 19
Comparaes mltiplas
Varivel dependente: PRODU
Varied (i) Varied (j) Sig
Tukey 1 2 0,119 {1;2;3} e {2;4}
3 0,312
4 0,0001 * no formou
2 3 0,931 grupos disjuntos
4 0,119
3 4 0,039 *
Scheff 1 2 0,170
3 0,389 {1;2;3} e
4 0,002 * {2;3;4}
2 3 0,948
4 0,170 no formou
3 4 0,063 * grupos disjuntos
LSD 1 2 0,029 *
3 0,092 * {1} {2;3} e {4}
4 0,000 *
2 3 0,558 formou grupos
4 0,029 * disjuntos
3 4 0,009 *
Bonferroni 1 2 0,177 * {1;2;3} {2;3;4}
3 0,552 * e {4}
4 0,001 *
2 3 1,000 * no formou
4 0,177 * grupos disjuntos
3 4 0,052 *
82
Pela tabela acima vemos que as comparaes mltiplas LSD formaram trs
grupos disjuntos: {1}; {2;3} e {4}. J as comparaes Tukey, Scheff e Bonferroni no
formaram grupos disjuntos.
83
7 TESTE DE INDEPENDNCIA
X x1 x2 xc
Y
y1 f 1,1 f 1, 2 f 1,c f 1.
yr f r ,1 f 1, 2 f r ,c f r.
f .1 f .2 f .c n
2
f f
f i. . j
r c i, j n
Estatstica do teste: q c = , onde
i =1 j =1 f i. f . j
n
Regra de deciso: rejeitamos H 0 se q c > qtab , onde qtab o valor obtido na tabela da qui-
quadrado tal que a rea superior de qtab .
84
Exemplo 1: quer-se verificar se existe alguma associao entre tipo de cooperativa (X) e
estado (Y).
Y
X Consumidor produtor escola outros
So Paulo 214 237 78 119 648
Paran 51 102 126 22 301
Rio Grande Sul 111 304 139 48 602
376 643 343 189 1551
Soluo:
(i, j ) f i, j f. j f i. ei , j = ( f i . f . j ) / n ( f i , j ei , j )^ 2 / ei , j
1,1 214 648 376 157,0909 20,61637205
1,2 237 648 643 268,6422 3,726990087
1,3 78 648 343 143,3037 29,75897145
1,4 119 648 189 78,96325 20,29984074
2,1 51 301 376 72,9697 6,614630525
2,2 102 301 643 124,7859 4,16071915
2,3 126 301 343 66,56544 53,06757739
2,4 22 301 189 36,67892 5,874508243
3,1 111 602 376 145,9394 8,36485075
3,2 304 602 643 249,5719 11,87000373
3,3 139 602 343 133,1309 0,258741848
3,4 48 602 189 73,35783 8,765522313
Total 1551 xxxxx xxxx 1551 173,3787283
85
2 2
648 376 602 189
214 48
1551 1551
qc = +L+ = 173,3787283
648 376 602 189
1551 1551
X Y freq
1,00 1,00 214,00
1,00 2,00 51,00
1,00 3,00 111,00
2,00 1,00 237,00
2,00 2,00 102,00
2,00 3,00 304,00
3,00 1,00 78,00
3,00 2,00 126,00
3,00 3,00 139,00
4,00 1,00 119,00
4,00 2,00 22,00
4,00 3,00 48,00
Cruzamento Y * X
Frequencias
X Total
1,00 2,00 3,00 4,00
86
Teste qui-quadrado
valor GL Sig
Qui-quadrado 173,379 6 8,63E-35
de Pearson
Qui-Quadrado em tabelas 2 2
Y
X x1 x2
y1 a b a+b
y2 c d c+d
a+c b+d n
Qui-quadrado de Yates:
2
n
n ad bc
2
qc =
(a + b) (a + c) (b + d ) (c + d )
Exemplo 2: quer-se verificar se existe alguma associao entre Vendedor (X) e resultado
da visita (Y).
Vendedor
Visita Bem
sucedida
Mal
sucedida
A 20 300 320
B 80 600 680
100 900 1000
2
1000
1000 20 600 80 300
2
qc = = 6,75296 e p=0,009359, que significativo.
100 900 320 680
87
8 CORRELAO E REGRESSO LINEAR
O diagrama de disperso nos fornece uma idia do tipo de relacionamento entre duas
variveis quantitativas X e Y. Uma forma de quantificar a relao entre duas variveis
quantitativas atravs do coeficiente de correlao linear de Pearson.
Exemplo 1:
Alongamento da mola, em cm (Y): 0,5 1,0 2,0 2,5 4,0 5,0 5,3 6,2 6,8 7,2
R=
XYi i i nXY
2 2
X i2 n X Yi 2 n Y
i i
88
Exemplo 2: para o exemplo anterior,
Planilha do Excel
O Excel tambm tem o comando que calcula diretamente a correlao linear: Corr( )
Resultados:
(1) 1 R 1
89
(3) se Y e X tiverem uma relao linear perfeita inversamente proporcional ( Y = a bX )
ento R = 1
(5)
90
Teste de hipteses para o coeficiente de correlao
H0 : = 0 contra H1 : 0
R n2
Estatstica do teste : t c =
1 R2
0,992 10 2
Exemplo 3: para o exemplo anterior, t c = = 22,2263 e p = 1,7748 10 8 ,
2
1 (0,992)
que altamente significante.
91
O mtodo que usaremos para estimar os parmetros do modelo o dos Mnimos
Quadrados. Neste mtodo, minimiza-se a soma dos quadrados das distncias d i (ver
figura). Os estimadores de 0 e 1 so, respectivamente:
n
X Y
i =1
i i nXY
b1 = 2
, b0 = Y b1 X .
n
i =1
X i
2
n X
2
n
i =1
Yi
2
n Y
Observao: da relao b1 = R segue que b1 e R tm o mesmo
2
n
X i =1
i
2
n X
sinal.
^
O modelo ajustado ficou Y = 0,326667 + 0,795758 X . Para x=7,5 kg, o valor estimado
para y ser 5,6415 cm.
92
8.3. Modelos no lineares
x
Modelo Hiperblico: Y = , x
x
exp{ x + }
Modelo Logstico: Y = , xR
1 + exp{ x + }
Carga Alongam
1 0,5
2 1,0
3 2,0
4 2,5
5 4,0
6 5,0
7 5,3
8 6,2
9 6,8
10 7,2
93
Resumo do Modelo
Modelo R R ao
quadrado
0,992 0,984
Preditor: Carga
Dependente: Alongamento
Modelo Coeficientes Erro padro Estatstica t signif
C = constante 0,287 223 -1,283 0,238
Carga 0,790 0,038 21,942 0,000
^
Para = 0,05 o modelo ajustado fica sendo y = 0,790 x , uma vez que a constante no
significativa.
9 REFERNCIAS BIBLIOGRFICAS
94