Sunteți pe pagina 1din 150

Estatstica Bsica

Slide #1

ESTATSTICA BSICA
Estatstica

Cincia que cuida de:


Organizao;
Descrio;
Anlise;
Interpretao;

de dados

Estatstica
Descritiva
Estatstica
Indutiva

Grficos;
Distr.
Frequncias;
Estatsticas
Tirar concluses
sobre
POPULAES,
com base nos
resultados
observados em
AMOSTRAS

Slide #2

I. ESTATSTICA DESCRITIVA
Estatstica Descritiva a parte da
Estatstica que descreve as amostras,
ou seja resume sua informao atravs de
tabelas, grficos e valores (estatsticas)
que informam aspectos da amostra, como
mnimo, mximo, centro, variao, etc.

Slide #3

I. ESTATSTICA DESCRITIVA
I. 1. Tipos de Variveis
Ao se fazer uma observao deve-se
anotar o que se v atravs de uma
notao
que
distinga
resultados
diferentes, diferena esta de interesse
para estudo.

Slide #4

I. ESTATSTICA DESCRITIVA
Os resultados podem ser:
- Atributos, classificveis
Ex.:

certo, errado
gosta, indiferente, no gosta
de SP, BA, RJ, ...
danificado, perfeito
jovem, meia idade, terceira idade
satisfeito, insatisfeito
treinado, no treinado

Slide #5

I. ESTATSTICA DESCRITIVA
- Caractersticas mensurveis
Ex.: tempo de espera
idade
tempo de atendimento
temperatura ambiente
peso
altura
salrio
custo

Slide #6

I. ESTATSTICA DESCRITIVA
Atributos so contados, obtendo-se
frequncias, das alternativas, na amostra.
Ex.:

-Entre 50 tarefas amostradas, teve-se


10 mal feitas
-De 30 pessoas entrevistadas, 5 eram

aptas
-Em 10 documentos observou-se 25
erros
-De 5 clientes teve-se 8 reclamaes
Slide #7
-De 20 chamadas, 12 foram da Capital,

I. ESTATSTICA DESCRITIVA

Contagens so
variveis discretas,
valores inteiros.

Slide #8

I. ESTATSTICA DESCRITIVA
Caractersticas
mensurveis
so
medidas, de acordo com uma escala, e as
variveis so contnuas fisicamente, embora
sejam arredondadas na leitura.
Ex:

tempo em minutos
temperatura em C
peso em Kg
altura em m
custo em R$

Slide #9

I. ESTATSTICA DESCRITIVA
Quando os valores so medidas, pode-se
faz-lo com certo nmero de casas decimais,
funo da preciso necessria para boa
anlise.
Ex:

temperatura lida em
dcimos de C 25,7 C

custo lido em centavos R$ 7,38


Slide #10

I. ESTATSTICA DESCRITIVA
Usam-se, tambm, as expresses:
- Varivel qualitativa:
nveis (nomes) de um atributo.
Ex: 1 grau, 2 grau, 3 grau (de
instruo)
De SP, BA, RJ, ...
Slide #11

I. ESTATSTICA DESCRITIVA
- Varivel quantitativa:
- discreta: nveis de contagem de
ocorrncias de um atributo.
Ex: nmero de erros em cada
documento de uma amostra.
- contnua: nveis de medio de uma
caracterstica mensurvel.
tarefa

Ex: tempos de execuo de cada


de uma amostraSlide
de#12

I. ESTATSTICA DESCRITIVA
I. 2. Tcnicas Grficas
A representao grfica da amostra
permite visualizao da distribuio dos
valores, vendo-se pontos de maior
concentrao,
faixa
de
ocorrncia,
assimetria, forma, etc.
Diz-se que:
um grfico diz mais que

Slide #13

I. ESTATSTICA DESCRITIVA
I. 2. Tcnicas Grficas
O grfico uma tcnica poderosa
para percepo da informao da
amostra.
A amostra uma parte de um todo
maior, o universo ou populao.
A amostra coletada ao acaso da
populao e o grfico da amostra deve
Slide #14

I. ESTATSTICA DESCRITIVA
Diagrama de Torta (Pie) ou Pizza ou
Setores Circulares
Grfico para visualizar distribuio de
variveis qualitativas.
Instru Freq
o
.

Bsica

30

60

Mdia

15

30

10

50

100

Superior
Total

Bsica
Superior
Mdia
Slide #15

I. ESTATSTICA DESCRITIVA
Desenvolvimento no Minitab
Carregar: INSTRUCAO.MTW
Graph > Pie Chart
Chart Table
Categories in: Instruo
Frequencies in: Freq.
Instruo

Title: Diagrama de Pizza para


OK

Slide #16

I. ESTATSTICA DESCRITIVA
O resultado obtido ser este:

Slide #17

I. ESTATSTICA DESCRITIVA
Diagrama de Barras (Bar Chart)
Usado para variveis qualitativas e
quantitativas discretas.
Erro
s
x

Docum
s.
f

%
p

11

22

16

32

13

26

14

50

10
0

Slide #18

I. ESTATSTICA DESCRITIVA
Desenvolvimento no Minitab
Carregar: ERROS.MTW
Graph > Chart
Y: %p
X: x
Annotation
Title: Diagrama de Barras para

Erros

OK
OK

Slide #19

I. ESTATSTICA DESCRITIVA
O resultado obtido ser este:

Slide #20

I. ESTATSTICA DESCRITIVA
Grfico de Pontos (Dotplot)
Usado para variveis discretas ou
contnuas.
Cada valor amostrado colocado
como um ponto (esfera) na posio do
valor e sobre outros pontos iguais
anteriores.
Slide #21

I. ESTATSTICA DESCRITIVA
Desenvolvimento no Minitab
Carregar: 20TEMPOSATEND.MTW
Graph > Dotplot
Variables: Arred meio min
Minutos

Title: Dotplot para Tempos em Meios


Arredondados
OK

Slide #22

I. ESTATSTICA DESCRITIVA
Ex: Tempos de atendimento arredondados
para meio minuto.
3,0 1,5 2,0 2,5 1,5 0,5 2,0 2,5 3,0 1,5
3,0 1,0 2,5 0,0 1,0 2,0 0,5 1,0 3,0 1,5

Slide #23

I. ESTATSTICA DESCRITIVA
Histograma
Usado para variveis contnuas.
Mesmo propsito do dotplot, porm
juntando valores em classes (intervalos) e
desenhando
barras
(retngulos)
contguas, devido varivel ser contnua.

Slide #24

I. ESTATSTICA DESCRITIVA
Ex: Tempos de atendimento
arredondados para meio minuto.
3,0 1,5 2,0 2,5 1,5 0,5 2,0 2,5 3,0 1,5
3,0 1,0 2,5 0,0 1,0 2,0 0,5 1,0 3,0 1,5

Slide #25

I. ESTATSTICA DESCRITIVA

Intervalo

Conta
g.

Freq
.

0
<0,75

|||

0,75
<1,75

||||| ||

||||| |
1,75
<2,75
pontos de corte
||||
2,75
<3,75

6
4

Slide #26

I. ESTATSTICA DESCRITIVA
Desenvolvimento no Minitab
Carregar: 20TEMPOSATEND.MTW
Graph > Histogram
Graph 1: x : Arred meio min
Annotation
Title: Histograma de Meios Minutos
Arredondados
OK
(Continua no
prximo
slide!) Slide #27

I. ESTATSTICA DESCRITIVA
Desenvolvimento no Minitab (continuao)
Options
Type of Intervals
Cut Point
Definition of Intervals
Midpoint / cutpoint

positions:

0 0,75 1,75 2,75 3,75


OK
OK

Slide #28

I. ESTATSTICA DESCRITIVA
O resultado obtido ser este:

Slide #29

I. ESTATSTICA DESCRITIVA
As classes tm amplitude de 1
minuto, exceto a primeira porque x no
pode ser <0. Como os dados foram
obtidos arredondados de meio em meio
minuto, ento 1,0 , por exemplo,
corresponde a algum valor real 0,75 e
<1,25.

Slide #30

I. ESTATSTICA DESCRITIVA
Histograma
Se tomarmos os tempos de meio em meio
minuto completo (truncado em vez de
arredondado), teremos que 1,0 corresponder a
algum valor 1,00 e <1,50. Os mesmos tempos
de atendimento, truncados de 0,5 em 0,5 , so:
2,5 1,5 1,5 2,5 1,0 0,0 1,5 2,0 2,5 1,5
2,5 1,0 2,0 0,0 1,0 1,5 0,5 1,0 2,5 1,5

Slide #31

I. ESTATSTICA DESCRITIVA
Interval Freq
o
.
0 <1

1 <2

10

2 <3

3 <4

pontos de corte

Neste caso temos classes de igual tamanho


e limites inteiros
Slide #32

I. ESTATSTICA DESCRITIVA
Desenvolvimento no Minitab
Carregar: 20TEMPOSATEND.MTW
Graph > Histogram
Graph 1: x : Trunc meio min
Annotation
Title: Histograma de Meios Minutos
Truncados
OK
(Continua no
prximo
slide!) Slide #33

I. ESTATSTICA DESCRITIVA
Desenvolvimento no Minitab (continuao)
Options
Type of Intervals
Cut Point
Definition of Intervals
Midpoint / cutpoint

positions:

0 1 2 3 4
OK
OK

Slide #34

I. ESTATSTICA DESCRITIVA
O resultado obtido ser este:

Slide #35

I. ESTATSTICA DESCRITIVA
Boxplot
Usado para variveis contnuas, mas
com valores de estatsticas da amostra
colocados no grfico, o que o torna ao
mesmo tempo uma boa ferramenta de
visualizao e um resumo estatstico.
Slide #36

I. ESTATSTICA DESCRITIVA
Desenvolvimento no Minitab
Carregar: 20TEMPOSATEND.MTW
Graph > Boxplot
Graph 1: y : Arred meio min
Item Display
For each
1
IQ Range Box
Graph
2
Outlier Symbol
Graph
3
Mean Symbol
Graph
Annotation
Title: Boxplot para Meios Minutos
Arredondados
Slide #37
OK

I. ESTATSTICA DESCRITIVA
Ex: Tempos de atendimento arredondados para
meio minuto e ordenados x(i):

0,0 0,5 0,5 1,0 1,0 1,0 1,5 1,5 1,5 1,5 2,0 2,0 2,0 2,5 2,5 2,5 3,0 3,0 3,0 3,0
Min

Q2=1,75

Q1=1,0

Q3=2,5

Q2= Mediana =X

Min = x(1)
Max =
x(20)

x 35,5

x Mdia

1,775
20

20

Max

21

2
Q1= 1 Quartil =
X 21

4
Q3= 3 Quartil =
X 21
3
4

Slide #38

I. ESTATSTICA DESCRITIVA
I. 3. Medidas de Posio ou Centro
So estatsticas, calculadas usando
os valores da varivel amostrada, que
indicam o centro da amostra.
Podem ser calculadas apenas para
variveis quantitativas (discretas ou
contnuas).
Slide #39

I. ESTATSTICA DESCRITIVA
H
usados:

medidores

de

centro

- mdia da amostra:
massa da
amostra
da

mais

centro

de

- mediana da amostra: deixa metade


amostra de cada lado

- moda da amostra:
frequente
na amostra.

valor

mais
Slide #40

I. ESTATSTICA DESCRITIVA
Mdia da Amostra x
x a mdia aritmtica simples dos valores
amostrados

x1 x2 ......... xn
x
n
com n = tamanho da amostra

Slide #41

I. ESTATSTICA DESCRITIVA
Mdia da Amostra x
Ex: 3,0 1,5 2,0 2,5 1,5
n=5
x1 + x2 + ...... + x5 = 10,5

10,5
x
2,1
5
Slide #42

I. ESTATSTICA DESCRITIVA
Desenvolvimento no Minitab
Carregar: 5TEMPOS.MTW
Stat > Basic Statistics > Display Descriptive
Statistics
Variables: Tempo
Graphs
Graphical Summary
OK
OK
Ver Session e Descriptive Statistics Graph para
Slide #43
relatrio das estatsticas.

I. ESTATSTICA DESCRITIVA
O resultado obtido ser este:
Descriptive Statistics: Tempo
Variable

Mean

Median

TrMean

StDev

SE Mean

Tempo

2,100

2,000

2,100

0,652

0,292

Minimum

Maximum

Q1

Q3

1,500

3,000

1,500

2,750

Variable
Tempo

Vemos que Mean=2,100


As outras estatsticas sero vistas adiante
Slide #44

I. ESTATSTICA DESCRITIVA
Descriptive Statistics
Variable: Tempo
Anderson-Darling Normality Test
A-Squared:
P-Value:

1,50

1,75

2,00

2,25

2,50

2,75

3,00

Mean
StDev
Variance
Skewness
Kurtosis
N
Minimum
1st Quartile
Median
3rd Quartile
Maximum

95% Confidence Interval for Mu

0,289
0,454
2,10000
0,65192
0,425
0,541387
-1,48789
5
1,50000
1,50000
2,00000
2,75000
3,00000

95% Confidence Interval for Mu


1,29053
1,5

2,0

2,5

3,0

95% Confidence Interval for Sigma


0,39059

95% Confidence Interval for Median

2,90947
1,87333

95% Confidence Interval for Median


1,50000

3,00000

Slide #45

I. ESTATSTICA DESCRITIVA
Mdia da Amostra
Ex:

Erro
s
x

No.
Docs.
f

x.f

11

16

16

13

26

21

12

50

75

Tem-se 11 documentos com 0 erros, 16


documentos com 1 erro em cada, ... , com um
total de 50 documentos amostrados e 75 erros
Slide #46

I. ESTATSTICA DESCRITIVA

n=50
x1 + x2 + ...... + x50 = 11x0+16x1+...+3x4=75
x= 75= 1,5 erros
50

Slide #47

I. ESTATSTICA DESCRITIVA
Mdia da Amostra
Ex:

Classe
de
Tempo

Centr Freq x.f


o
.
X
f

01

0,5

1,5

12

1,5

10

15,
0

23

2,5

17,
5

x1 + x2 + ...... + x20 = 20 34,


0
3x0,5+10x1,5+7x2,5=34,0
34,0
20
x=
= 1,7 min

n=20

Slide #48

I. ESTATSTICA DESCRITIVA
~

Mediana da Amostra x
~

x o valor ordenado que fica no centro dos


valores.
~
Amostra ordenada:
x x n 1 x(1) x(2) ...... x(n)

Mediana:
2
Ex: 3,0 1,5 2,0 2,5 1,5
Ordenada: 1,5n1,5
1 2,0
5 2,5
1 3,0

n5
~

Slide #49

I. ESTATSTICA DESCRITIVA
~

Mediana da Amostra x para n par


Ex: 3,0 1,5 2,0 2,5 1,5 0,5
Ordenada: 0,5 1,5 1,5 | 2,0 2,5 3,0

n6
~

n 1 7
3,5
2
2

X a mdia de x(3) com x(4):

x(3) x( 4 ) 1,5 2,0


~
x

1,75
2
2
Slide #50

I. ESTATSTICA DESCRITIVA
Moda da Amostra mo
mo o pico do grfico de barras (varivel
discreta) ou do histograma (varivel contnua) ou
do dotplot (qualquer varivel quantitativa). o
valor x de maior frequncia.
Ex: 3,0 1,5 2,0 2,5 1,5

Slide #51

I. ESTATSTICA DESCRITIVA
Desenvolvimento no Minitab
Carregar: 5TEMPOS.MTW
Graph > Dotplot
Variables: Tempo
Title: Dotplot para Tempo
OK

Nesta amostra a moda


mo=1,5

Slide #52

I. ESTATSTICA DESCRITIVA
Moda da Amostra mo
No til esta medida de centro para
amostras pequenas porque no se tem no
grfico pontos suficientes para se saber qual o
valor realmente mais provvel de ocorrer, que
o objetivo de se calcular a moda.

Slide #53

I. ESTATSTICA DESCRITIVA
Exerccio: Obter mediana e moda para nmero
de erros em documentos.
Erro
s
x

Docs
.
f

Freq.
Ac.
F

11

11

16

27

13

40

47

50

50

n 50
n 1 51
25,5


2
2
x 25 x 26 1 1
~
x

1
2
2
max f 16 para x 1
mo 1
Slide #54

I. ESTATSTICA DESCRITIVA
Como

amostra

tem

distribuio

assimtrica, alongada para a direita, a mdia


x=1,5 maior que

a moda mo=1.

Mdia, mediana e moda do informaes


diferentes

para

distribuies

assimtricas.

renda mdia (renda per capita) pode ser de R$


2.000 quando o salrio mais frequente (moda)
o salrio mnimo de R$ 240.

A mediana fica

entre a mdia e a moda.


Slide #55

I. ESTATSTICA DESCRITIVA
I. 4. Medidas de Disperso
Disperso ou variao quanto os
valores

so

distantes

entre

si

ou

espalhados. Se a variao pequena, os


valores so prximos, concentrados.
Relacionada com a preciso de um
processo.

Slide #56

I. ESTATSTICA DESCRITIVA
I. 4. Medidas de Disperso
Para avaliar a disperso tambm tem-se 3
medidores principais:
- amplitude da amostra: mximo menos
mnimo
-

varincia

da

amostra:

mdia

dos

quadrados das distncias dos pontos em relao


ao centro x
Slide #57
- desvio padro da amostra: raiz quadrada

I. ESTATSTICA DESCRITIVA
Amplitude da Amostra R(range)
Ex: 3,0 1,5 2,0 2,5 1,5
max = 3,0
min = 1,5

R = 3,0 1,5 = 1,5

Medida simples mas muito til pela facilidade


de calcular e interpretar.
a mais usada para verificar a estabilidade da
variao ao longo do tempo, no chamado Grfico de
Controle R.
Slide #58

I. ESTATSTICA DESCRITIVA
Varincia da Amostra s2 e Desvio Padro
s
Valores x: 3,0 1,5 2,0 2,5 1,5 mdia
x=2,1
Desvios (x - x): 0,9
Quadrados (x 0,8
-x)2: 1

-0,6 -0,1 0,4

-0,6

0,3
6

0,3
6

0,0
1

0,1
6

2
2
2

...

x
21,70
n
Soma doss 2quadrados:
1

Varincia:

n 1
s 0,425 0,65 min

Desvio padro:

1,70
0,425 min 2
4

(Ver slide 45)

Slide #59

I. ESTATSTICA DESCRITIVA
Varincia da Amostra s2 e Desvio
Padro s
A mdia dos quadrados obtida dividindo-se a
soma por (n-1) porque prova-se matematicamente
que deste modo obtm-se melhor estimativa da
varincia da populao.
O desvio padro tem a mesma unidade de medida
do x e uma espcie de mdia do desvio em
relao ao centro x.

Slide #60

I. ESTATSTICA DESCRITIVA
Exerccio: Obter amplitude, varincia
e desvio padro para nmero de erros
em documentos
f.x (x-x) (x-x)2

Amplitude: R = 4 0
f.(x-x)2 = 4

Erro
s
x

Docs
.
f

11

-1,5

2,25

16

16

-0,5

0,25

4,00

13

26

0,5

0,25

3,25

21

1,5

2,25

15,75

12

2,5

6,25

50

75

18,75 Desvio padro:


66,50
Slide

24,75 Mdia:

75
1,5
50

s2
Varincia:

66,50
1,36
50 1
s 1,36 1,16

#61

I. ESTATSTICA DESCRITIVA
I. 5. Medidas de Assimetria e
Achatamento
(Curtose)

Simtrica

Assimtrica Positiva

Assimtrica Negativa

Slide #62

I. ESTATSTICA DESCRITIVA
I. 5. Medidas de Assimetria e
Achatamento (Curtose)

Mesocrtica

Leptocrtica
Curtose Positiva
Pontuda

Platicrtica
Curtose Negativa
Achatada

Slide #63

I. ESTATSTICA DESCRITIVA
Assimetria (Skewness) e Achatamento
(Curtose)

(x x)
n

a
3
(n 1)(n 2)
s
n(n 1)
c
(n 1)(n 2)(n 3)

4
(
x

x
)

s4

(n 1) 2
3
(n 2)(n 3)
Slide #64

I. ESTATSTICA DESCRITIVA
Assimetria (Skewness) e Achatamento
(Curtose)
x=2,1

3,0

1,5

2,0

2,5

1,5

(x-x)

0,9

-0,6

-0,1

0,4

-0,6

(xx)2

0,81

0,36

0,01

0,16

0,36

(xx)3

0,729

(xx)4

0,656 0,129 0,000 0,025 0,129 Soma=0,9410


1
6
1
6
6

n=5

Soma=1,70

0,064
Soma=0,36
0,216 0,001
0,216

Slide #65

I. ESTATSTICA DESCRITIVA
Assimtrica (Skewness) e Achatamento
(Curtose)
1,70
2
s
0,425
4
5
0,36
a
0,54 0 alongada para a direita
3/ 2
4 3 (0,425)

5 6 0,9410
42
c
3
1,49 0 achatada
2
4 3 2 (0,425)
3 2
(Ver slide 45)

Slide #66

II. MODELOS DE DISTRIBUIO


Distribuio Normal
Podemos represent-la por uma curva contnua, em
forma de sino, chamada Curva Normal ou Curva de
Gauss.
A Distribuio Normal a mais usada para anlise de
dados contnuos, por ser a que mais se aproxima da
maioria das variveis reais.
Abaixo da Curva, temos uma rea unitria,
correspondente a 100% de probabilidade.
Curva Normal

0,7 -1,2

1,7 - 2,2

2,7 - 3,2

3,7 - 4,2

4,7 - 5,2

5,7 - 6,2

Slide #67

6,7 - 7,2

II. MODELOS DE DISTRIBUIO


Uma distribuio Normal fica
perfeitamente caracterizada pelo
conhecimento dos parmetros e

que so sua mdia e seu desvio


padro

Mdia =
Desvio Padro =
Slide #68

II. MODELOS DE DISTRIBUIO


II. 1. Distribuio Normal.
Essa importante distribuio definida pela
probabilidade abaixo, deduzida matematicamente:

com

1
f x
. e
2
x

funo

densidade

1 x
-

de

Slide #69

II. MODELOS DE DISTRIBUIO


O aspecto caracterstico do seu
grfico mostrado abaixo, onde - e
+ so os pontos de inflexo da
curva.
DISTRIBUIO NORMAL
f x

Ponto de
Inflexo

+3

Slide #70

II. MODELOS DE DISTRIBUIO


II. 2. Distribuio Normal padronizada.
a distribuio Normal com
mdia 0 e desvio padro 1.
Distinguiremos a varivel Normal
padronizada denotando-a pela letra z.
A distribuio da varivel z apresentada
na tabela normal em anexo.
Slide #71

II. MODELOS DE DISTRIBUIO


Distribuio Normal

A Curva Normal fica plenamente definida com


dois parmetros:
Mdia ( )
Desvio padro ( )

Desvio padro ()

Mdia ()

Slide #72

II. MODELOS DE DISTRIBUIO


DISTRIBUIO NORMAL PADRONIZADA
=0
=1

Slide #73

II. MODELOS DE DISTRIBUIO


A rea hachurada corresponde a
P(Z > z0), para a qual obtemos a rea
calculando o valor padronizado
corresponde a um x0, ou seja

x0
z0
P z z0

Slide #74

II. MODELOS DE DISTRIBUIO


Algumas propriedades da
Distribuio Normal
Mdia

Varincia

Desvio Padro

Coeficiente de
Assimetria

=0

Coeficiente de Curtose

=0
Slide #75

II. MODELOS DE DISTRIBUIO


J

podemos

fazer

anlises

estatsticas do conjunto de dados e,


consequentemente, da populao que
estes representam porque temos um
modelo matemtico de suporte
Slide #76

II. MODELOS DE DISTRIBUIO


Distribuio Normal

Comparao de Curvas Normais:


Mesmo Desvio padro (), diferentes Mdias ( e
2)

Neste caso
( 1) < ( 2)

-8

-6

-4

-2

Mdia (1)

Mdia (2)

Slide #77

II. MODELOS DE DISTRIBUIO


Distribuio Normal

Comparao de Curvas Normais:


Mesma Mdia (), diferentes Desvios padro ( e
)

Desvio padro ()

Neste caso

( 1) < ( 2)
Desvio padro ()

-8

-6

-4

-2

Mdia ()

Slide #78

II. MODELOS DE DISTRIBUIO


Distribuio Normal

Comparao de Curvas Normais:


Diferentes Mdias () e Desvios padro ()

Desvio padro ()

Neste caso

( 1) < ( 2)

Desvio padro ()

( 1) > ( 2)
-8

-6

-4

-2

Mdia (1)

Mdia (2)

Slide #79

II. MODELOS DE DISTRIBUIO


Distribuio
Normal

reas/probabilidades
importantes

68,3%
95,4%
99,7%
99,994%
99,99994%
99,9999998%

Slide #80

II. MODELOS DE DISTRIBUIO


Distribuio Normal
reas/probabilidades
importantes
Comparao com
especificaes bilaterais
(Processo Centrado)

LIE

-1 -1 -1 -1 -1 -1 -9 -8
5

LSE

-7 -6 -5 -4 -3 -2

3Probabilidade
2 1 0

Abaixo LIE = 15,85%

-1

1 68,3%

Tolerncia = LSE - LIE

10

11 12 13 14 15

Probabilidade
Acima LSE = 15,85%

Slide #81

II. MODELOS DE DISTRIBUIO


Distribuio Normal
reas/probabilidades
importantes
Comparao com
especificaes bilaterais
(Processo Centrado)

LIE

-15 -14 -13 -12 -11 -10 -9

-8

-7

Probabilidade
Abaixo LIE = 2,3%

-6

LSE

-5

-4

-3

-2

-1

2 95,4%

Tolerncia = LSE - LIE

10

11

12 13

14

Probabilidade
Acima LSE = 2,3%

Slide #82

15

II. MODELOS DE DISTRIBUIO


Distribuio Normal
reas/probabilidades
importantes
Comparao com
especificaes bilaterais
(Processo Centrado)

LIE

-1 -1 -1 -1 -1 -1 -9 -8
5

LSE

-7 -6 -5 -4 -3 -2

Probabilidade
Abaixo LIE = 1.500 ppm

-1

3 99,7%
Tolerncia = LSE - LIE

10

11 12 13 14 15

Probabilidade
Acima LSE = 1.500 ppm

Slide #83

II. MODELOS DE DISTRIBUIO


Distribuio Normal
reas/probabilidades
importantes
Comparao com
especificaes bilaterais
(Processo Centrado)

LIE

-1 -1 -1 -1 -1 -1 -9 -8
5

LSE

-7 -6 -5 -4 -3 -2

Probabilidade
Abaixo LIE = 30 ppm

-1

4 99,994%
Tolerncia = LSE - LIE

10

11 12 13 14 15

Probabilidade
Acima LSE = 30 ppm

Slide #84

II. MODELOS DE DISTRIBUIO


Distribuio Normal
reas/probabilidades
importantes
Comparao com
especificaes bilaterais
(Processo Centrado)

LIE

-1 -1 -1 -1 -1 -1 -9 -8
5

LSE

-7 -6 -5 -4 -3 -2

Probabilidade
Abaixo LIE = 300 ppb

-1

5 99,99994%
Tolerncia = LSE - LIE

10

11 12 13 14 15

Probabilidade
Acima LSE = 300 ppb

Slide #85

II. MODELOS DE DISTRIBUIO


Distribuio Normal
reas/probabilidades
importantes
Comparao com
especificaes bilaterais
(Processo Centrado)

LIE

-1 -1 -1 -1 -1 -1 -9 -8
5

LSE

-7 -6 -5 -4 -3 -2

Probabilidade
Abaixo LIE = 1 ppb

-1

10

11 12 13 14 15

6 99,9999998
%

Probabilidade
Acima LSE = 1 ppb

Tolerncia = LSE - LIE

Slide #86

II. MODELOS DE DISTRIBUIO


Distribuio Normal
reas/probabilidades
importantes
Comparao com
especificaes bilaterais
(Processo Centrado)

Evoluo
de +/- 1
para +/- 6

LIE

-1 -1 -1 -1 -1 -1 -9 -8
5

LSE

-7 -6 -5 -4 -3 -2

-1

10

11 12 13 14 15

Probabilidade
Abaixo LIE

Tolerncia = LSE - LIE

Probabilidade
Acima LSE

Slide #87

II. MODELOS DE DISTRIBUIO


Distribuio Normal - Exemplo

Tomemos os dados da planilha Tempo de Ciclo


coluna C1.
Mdia = 18,851 min
Desvio Padro = 0,212 min
Especificao = 19,0 +/- 0,5 min

Qual a probabilidade de termos valores fora da


especificao para este caso?

Slide #88

II. MODELOS DE DISTRIBUIO


Desenvolvimento no Minitab
Carregar: TEMPO DE CICLO.MTW
Stat > Basic Statistics > Display Descriptive
Statistics
Variables: TempoCiclo
OK
Session do Minitab:
Descriptive Statistics: TempoCiclo
Variable

Mean

Median

TrMean

StDev

SE Mean

TempoCic

100

18,851

18,840

18,850

0,212

0,021

Variable

Minimum

Maximum

Q1

Q3

TempoCic

18,330

19,320

18,713

18,978

Slide #89

II. MODELOS DE DISTRIBUIO


Distribuio Normal - Exemplo
LSE

LIE

Probabilidade de
termos valores
abaixo da
especificao

17,5

18

Probabilidade de
termos valores
acima da
especificao

18,5

19

19,5

20

20,5

Mdia = 18,851

Slide #90

II. MODELOS DE DISTRIBUIO


Distribuio Normal Exemplo
Calc>Probability Distributions>Normal
Cumulative probability
Mean: 18,851
Standard Deviation: 0,212
Input Constant: 18,5
OK
Cumulative Distribution Function
Normal with mean = 18,8510 and standard deviation = 0,21200
x
18,5000

P( X <= x )
0,0489

Slide #91

II. MODELOS DE DISTRIBUIO


Distribuio Normal Exemplo
Calc>Probability Distributions>Normal

Cumulative probability
Mean: 18,851

Standard Deviation: 0,212

Input Constant: 19,5


OK
Cumulative Distribution Function
Normal with mean = 18,8510 and standard deviation = 0,21200
x
19,5000

P( X <= x )
0,9989

Neste caso, interessa-nos a rea (probabilidade) acima de


LSE:
x
19,5000

P (X > x)
(1 0,9989) = 0,0011 (0,11%) Slide

#92

II. MODELOS DE DISTRIBUIO


Desenvolvimento no Minitab
Carregar: TEMPO DE CICLO.MTW
Stat > Quality Tools > Capability Analysis
(Normal)
Single column: TempoCiclo
Subgroup size: 1
Lower spec: 18,5
Upper Spec: 19,5
Estimate
(desmarcar)

(Continua
no
Use unbiasing
constants
prximo Slide #93

II. MODELOS DE DISTRIBUIO


Desenvolvimento no Minitab
Options
Perform Analysis
Within subgroup analysis
(desmarcar)

Overall analysis (deixar


marcado)
Percents (em vez de Parts per
million)
Benchmark zs (em vez de
Capability
stats)
Title: Capacidade para Tempos de
Slide #94
Ciclo

II. MODELOS DE DISTRIBUIO


Distribuio Normal
Resumindo, neste
Exemplo
caso temos:

P(x < xinf) = 0,0489

(4,89%)
P(x > xsup) = 0,0011

(0,11%)
P(total) =
5,00%
4,89%

17,5

18

0,11%

18,5

19

19,5

20

Slide #95

20,5

II. MODELOS DE DISTRIBUIO


Distribuio Normal - Exerccio

Calcular a probabilidade de termos valores fora


da especificao para o exemplo discutido,
porm vamos considerar que o tempo mdio
conseguiu ser ajustado para 19,0 min,
mantendo a mesma variao
(desvio padro = 0,212).
Discuta conceitualmente qual sua expectativa
em relao ao resultado. Haver diminuio,
aumento ou manteremos a probabilidade de
termos valores fora da especificao?
Use o Minitab para os clculos.
Obs: faa um desenho representando a
Slide #96
situao!

II. MODELOS DE DISTRIBUIO


Distribuio Normal
As probabilidades que
calculamos somente podem
ser estimadas se temos
razovel segurana de que a
distribuio Normal, pois os
resultados derivam direto da
funo da Normal;
A avaliao de Normalidade
pode ser feita com a anlise
do formato do Histograma
e/ou atravs de um teste de
Normalidade.

17,5

18

18,5

19

19,5

20

Slide #97

20,5

II. MODELOS DE DISTRIBUIO


Distribuio Normal

Para fazer esta anlise, conveniente usar um


software estatstico (no nosso caso o Minitab).

Desenvolvimento no Minitab
Carregar: TEMPO DE CICLO.MTW
Stat > Basic Statistics > Normality Test
Variable: TempoCiclo
de

Title: Teste de Normalidade para Tempo


Ciclo
OK
Slide #98

II. MODELOS DE DISTRIBUIO


Distribuio Normal - Exemplo de Teste de Normalidade
Teste de Normalidade para Tempo de Ciclo
(Minitab)
,999
,99

Probability

,95
,80
,50
,20
,05
,01
,001
18,3

18,8

TempoCiclo
Average: 18,8508
StDev: 0,211744
N: 100

Para valores de P-Value > 0,05


assume-se que os dados vm
19,3 de uma distribuio Normal
Anderson-Darling Normality Test
A-Squared: 0,335
P-Value: 0,504

Slide #99

II. MODELOS DE DISTRIBUIO


Desenvolvimento no Minitab
Carregar: TEMPO DE CICLO.MTW
Graph > Boxplot
Graph 1: y : TempoCiclo
Annotation
Title: Boxplot para tempo de Ciclo
OK
OK
Slide #100

II. MODELOS DE DISTRIBUIO


Desenvolvimento no Minitab

Ciclo

Graph > Histogram


Graph 1: x : TempoCiclo
Annotation
Title: Histograma para Tempo de

positions:

OK
Options
Type of Intervals
MidPoint
Definition of Intervals
Midpoint / cutpoint
18,40 18,55 18,70 18,85
Slide #101

II. MODELOS DE DISTRIBUIO


Distribuio Normal - Exemplo de Teste de Normalidade
(Minitab)

Slide #102

II. MODELOS DE DISTRIBUIO


II. 3. Distribuio binomial
Seja um experimento dentro das
seguintes condies:
a) so realizadas n provas independentes
b) cada prova s pode levar a sucesso ou
fracasso (duas alternativas, contando-se
ocorrncias do que se definir como
sucesso)
Slide #103

II. MODELOS DE DISTRIBUIO


c) a probabilidade p de
sucesso em cada prova
constante; assim, a probabilidade
de fracasso dada por
1p=q
Slide #104

II. MODELOS DE DISTRIBUIO


Como as provas so independentes, a
probabilidade de ocorrncia de k sucessos
P(X=k) = pk.qn-k
Porm, o evento k sucessos em n provas
pode acontecer em vrias ordens distintas;

Slide #105

II. MODELOS DE DISTRIBUIO


assim, temos a distribuio BINOMIAL:

n k nk
P X k p .q
; k 0,1,...., n
k
n
n!
onde
k ! n k !
k
Slide #106

II. MODELOS DE DISTRIBUIO


Exemplo: Sendo de 5% a
Tempo de Ciclo que
especificao 19,0 0,5
probabilidade de em 100
mais de 10 fora.

proporo de
cai fora da
,
calcular a
tempos ter-se

Calc > Probability Distributions > Binomial


Cumulative probability
Number of trials: 100
Probability of success: 0,05
Input constant:10
OK

Slide #107

II. MODELOS DE DISTRIBUIO


Binomial with n = 100 and p = 0,0500000
x
10,00

P( X <= x )
0,9885

Logo: P(x>10) = 1-0,9885=0,0115 ou 1,15%

Slide #108

II. MODELOS DE DISTRIBUIO


Algumas propriedades da
Distribuio BINOMIAL:
Mdia
Varincia
Desvio
Padro

= np
2 = npq
= npq

Slide #109

II. MODELOS DE DISTRIBUIO


II. 4. Distribuio de Poisson
No caso da distribuio Binomial, a varivel de
interesse era o nmero de sucessos em um intervalo
discreto (n provas).
Outra varivel de interesse o nmero de
ocorrncias em um intervalo contnuo, que pode ser
um intervalo de tempo, de superfcie, de distncia,
etc.

Slide #110

II. MODELOS DE DISTRIBUIO


A distribuio de Poisson
definida por:

e .
P X k
, k 0,1,2,......
k!
k

onde e=2,71828 e a mdia de


ocorrncias
Slide #111

II. MODELOS DE DISTRIBUIO


Exemplo: Se o fluxo de chamadas
telefnicas de 20ch/h de acordo com um
Processo
de
Poisson,
calcular
a
probabilidade de haver mais de 50
chamadas em um certo perodo de 2h.
Soluo: Como se tem 20 ch/h, em 2h temse em mdia 40 ch.
Calc > Probability Distributions > Poisson
Cumulative probability
Mean: 40
Input constant: 50

Slide #112

II. MODELOS DE DISTRIBUIO


Poisson with mu = 40,0000
x
50,00

P( X <= x )
0,9474

Logo: P(x>50) = 1-0,9474=0,0526 ou 5,26%

Slide #113

II. MODELOS DE DISTRIBUIO


Algumas propriedades da
Distribuio de Poisson.
Mdia
Varincia
Desvio
Padro

=
=

Slide #114

III. DISTRIBUIO AMOSTRAL


III. 1. Distribuio das Mdias
Determinemos
as
principais
caractersticas da distribuio amostral
X
da estatstica , mdia de uma amostra
n
de n elementos.

x
i 1

onde: x

x1 x2 ... xn

n
2

2 x
n

x
n
Slide #115

III. DISTRIBUIO AMOSTRAL


As mdias amostrais tm distribuio
Normal quando a Populao Normal
Distribuio Amostral de X

Distribuio da
Populao Normal X
-1
5

-1
4

-1
3

-1
2

-1
1

-1
0

-9

-8

-7

-6

-5

-4

-3

-2

-1

10 11 12 13 14 15

Slide #116

III. DISTRIBUIO AMOSTRAL


Distribuio Amostral de X

Distribuio de
Populao No Normal

X se aproxima da Normal mesmo quando a


Normal no bom modelo para X
A aproximao to melhor quanto maior
for a amostra
Slide #117

III. DISTRIBUIO AMOSTRAL


III. 2. Distribuio do Desvio Padro
Amostral e Varincia Amostral
A Varincia Amostral calculada por
n

s
2
x

x x
i 1

n 1

Obs: Se a Normal bom modelo para X, ento pode-se


usar distribuio Qui-quadrado para s2, o que feito no
Slide #118
Minitab.

III. DISTRIBUIO AMOSTRAL


O Desvio Padro Amostral calculado
por

sx

xi x

i 1

n 1

Obs: O Minitab faz clculos para estimar o da Normal


usando o s da amostra e valores derivados da Quiquadrado
Slide #119

III. DISTRIBUIO AMOSTRAL


III. 3. Distribuio z e t
Suponhamos que a partir de uma
amostra de n valores, retirados de uma
populao Normal de mdia e desvio
padro , calculssemos a estatstica z
(varivel Normal padronizada, pois X
Normal):
x

/ n

Slide #120

III. DISTRIBUIO AMOSTRAL


III. 3. Distribuio z e t
Entretanto, se usarmos s
obteremos
uma estatstica t:

x
t
s/ n

chamada
t deusa-se
Student.
Obs: No Minitab
z quando se tem o e t
quando s se
tem o s, para estimar o da
Slide #121
Normal.

IV. ESTIMATIVA E INTERVALO DE


CONFIANA
IV. 1. Introduo

Agora, estamos considerando


problemas de Estatstica Indutiva, que so
divididos em dois grupos:
os problemas de estimao e
os problemas de testes de
hipteses.

Slide #122

IV. ESTIMATIVA E INTERVALO DE


CONFIANA
Para

ter-se

noo

do

erro

de

estimao, construimos um intervalo, em


torno

de

uma

estimativa

de

um

parmetro da distribuio, de modo a que


esse intervalo tenha uma probabilidade
conhecida de conter o verdadeiro valor do
parmetro.

Slide #123

IV. ESTIMATIVA E INTERVALO DE


CONFIANA
O intervalo, que, com probabilidade
conhecida, dever conter o valor real do
parmetro,
confiana

chamaremos
para

esse

intervalo

parmetro,

de
e

probabilidade o nvel de confiana do


intervalo
Slide #124

IV. ESTIMATIVA E INTERVALO DE


CONFIANA
IV. 2. Intervalo de Confiana para a mdia
de populao Normal quando
conhecido.
Pode-se deduzir a seguinte

expresso:
P x z .
xz

Logo a expresso dentro dos


Slide #125
parnteses o IC de com confiana (1-

IV. ESTIMATIVA E INTERVALO DE


CONFIANA

IV. 3. Intervalo de Confiana para a mdia


de populao Normal quando
desconhecido.

Tambm, pode-se deduzir que:

s
s
P x t( n 1);
x t( n 1);
1
2 n
2 n

A expresso dentro dos parnteses


o IC de de populao Normal quando
Slide #126

IV. ESTIMATIVA E INTERVALO DE


CONFIANA

Obter o IC da mdia do Tempo de Ciclo com


95% de confiana.
Stat > Basic Statistics> 1-Sample t
Variables: TempoCiclo
branco

Test mean:

(deixar em
para IC s)

OK
One-Sample T: TempoCiclo
Variable
TempoCiclo

Mean

StDev

SE Mean

100

18,8508

0,2117

0,0212

Intervalo em Session: 18,8088 <


<18,8928

95,0% CI
( 18,8088; 18,8928)

Slide #127

V. TESTES DE HIPTESES
IV. 1. Introduo
A mdia da amostra x o melhor
estimador da mdia populacional .
Se desejamos testar uma hiptese
referente ao verdadeiro valor da mdia
da populao, a varivel de teste mais
adequada ser x.

Slide #128

V. TESTES DE HIPTESES
Por exemplo, pode-se testar as
seguintes hipteses sobre uma mdia
populacional:
H0:0
H1:0
alternativa

H0= hiptese nula


H1= hiptese

Slide #129
As hipteses so complementares;

V. TESTES DE HIPTESES

x
n

Xi

Xs

Regio crtica do teste bilateral

Rejeita-se H0 e conclui-se H1 se x xi ou x
Slide #130
xs

V. TESTES DE HIPTESES
Se x, a varivel de teste, assumir um
valor muito diferente de 0, para menos
ou para mais, rejeitamos H0.
Valores crticos:

xi 0 z a .
2
n

xs 0 z a .
2
n

Obs: Se for desconhecido, usa-se o desvio


padro s da amostra e o t de Student em
vez#131
do
Slide
z.

V. TESTES DE HIPTESES
Testar a hiptese H0:=19, contra H1:19,
para a mdia do Tempo de Ciclo, com
5% de significncia.
Stat > Basic Statistics > 1-Sample t
Variables: TempoCiclo
Test Mean: 19
Graphs
Histogram of data
OK

(Continua no
prximo Slide #132

V. TESTES DE HIPTESES
Options
Confidence level:95,0
(manter)
Alternative: not equal
(manter)
OK
OK

Slide #133

V. TESTES DE HIPTESES
One-Sample T: TempoCiclo
Test of mu = 19 vs mu not = 19
Variable
TempoCiclo

Variable
TempoCiclo

Mean

StDev

SE Mean

100

18,8508

0,2117

0,0212

95,0% CI
( 18,8088; 18,8928)

-7,05

0,000

Em Session: T=-7,05 P=0,000


Como P<0,05 , a hiptese H0 rejeitada, podendo-se
dizer que 19.

Slide #134

V. TESTES DE HIPTESES
Histogram of TempoCiclo
(with Ho and 95% t-confidence interval for the mean)

Frequency

20

10

[
18,3

18,4

18,5

18,6

18,7

18,8

_
X

]
18,9

Ho
19,0

19,1

19,2

19,3

TempoCiclo

O grfico mostra o IC e que H0 est fora


dele.

Slide #135

VI. CORRELAO E REGRESSO


VI. 1. Introduo
Vamos
problemas

examinar
de

Estatstica,

importantes
envolvendo

duas ou mais variveis quantitativas.


Consideremos

inicialmente

duas

variveis de interesse: Altura e Peso de


pessoas.

Slide #136

VI. CORRELAO E REGRESSO


Seja uma amostra de 10 pessoas
adultas, do sexo masculino, e sejam a
altura (m) e o peso (kg) as variveis que
nos interessa investigar
Designemos

estas

variveis,

respectiva-mente, X e Y, X para varivel


independente
dependente

para

varivel
Slide #137

VI. CORRELAO E REGRESSO


Para cada elemento da amostra,
iremos obter um par ordenado (x,y)

Teremos

ento,

n=10

pares

de

valores das duas variveis, que podero


ser

plotados

em

um

diagrama

de

disperso (scatterplot)
Slide #138

VI. CORRELAO E REGRESSO


Valores da altura e do peso.
Pesso
a

Altura (m)

Peso
(kg)

1,74

73

1,61

66

1,70

64

1,80

94

1,82

79

1,64

72

1,56

62

1,68

64

1,76

90

Slide #139

VI. CORRELAO E REGRESSO


Carregar PESOALTURA.MTW
Graph > Plot
Graph 1: Peso (kg)

Altura (m)

Annotation
Title: Diagrama de Disperso
Peso x Altura

de
OK

Slide #140

VI. CORRELAO E REGRESSO


Plot de Peso X Altura
95
90

Peso(kg)

85
80
75
70
65
60
1,6

1,7

1,8

Altura(m)

Slide #141

VI. CORRELAO E REGRESSO


A vantagem de se construir o
diagrama de disperso est em que
sua observao mostra
como

as

duas

variveis

se

correlacionam,
ou seja,
qual a tendncia de variao conjunta
Slide #142

VI. CORRELAO E REGRESSO


VI. 2. Correlao Linear
Observando
o
diagrama
de
disperso, para maiores valores de x h
uma tendncia de obtermos maiores
valores de y
Quando isto ocorre, dizemos que
h correlao (linear) positiva
Slide #143

VI. CORRELAO E REGRESSO


Correlao Calculada no Minitab
Stat > Basic Statistics > Correlation
Variables: Altura(m) Peso(kg)
OK
Correlations: Altura(m); Peso(kg)
Pearson correlation of Altura(m) and Peso(kg) = 0,771
P-Value = 0,009

A correlao calculada positiva porque


aumentando a altura h tendncia de aumentar
o peso.
Correlaes acima de 0,7 so consideradas
altas. O P-value 0,009<0,05 mostra que
Slideela
#144

VI. CORRELAO E REGRESSO


Existe correlao positiva

No existe correlao

Pode haver correlao positiva

Existe correlao negativa

Pode haver correlao negativa

Slide #145

VI. CORRELAO E REGRESSO


VI. 3. Regresso Linear

Regresso a funo que


relaciona a varivel explicada
(dependente) com as variveis
explicativas (independentes).
Slide #146

VI. CORRELAO E REGRESSO


Stat > Regression > Fitted Line Plot
Response (y): Peso(kg)
Predictor (x): Altura(m)
Type of Regression Model
Linear
Options
Title: Regresso Linear de
Peso x Altura
OK
OK

Slide #147

VI. CORRELAO E REGRESSO


Regression Analysis: Peso(kg) versus Altura(m)
The regression equation is
Peso(kg) = -101,909 + 103,405 Altura(m)
S = 7,60070

R-Sq = 59,5 %

R-Sq(adj) = 54,4 %

Analysis of Variance

Source

DF

SS

MS

Regression

678,34

678,335

11,7419

0,009

Error

462,16

57,771

Total

1140,50

Slide #148

VI. CORRELAO E REGRESSO


Em Session consta que P=0,009 para
Regression, ou seja a Regresso
significativa a 5%, embora explicando
apenas 59,5% (Rsq) da variao dos pesos.
O P-value o mesmo da correlao,
com r=0,771 e R2=0,7712 = 0,595.

R2 o coeficiente de explicao.
Slide #149

VI. CORRELAO E REGRESSO


Regresso Linear de Peso X Altura
Peso(kg) = -101,909 + 103,405 Altura(m)
S = 7,60070

R-Sq = 59,5 %

R-Sq(adj) = 54,4 %

Peso(kg)

90

80

70

60
1,6

1,7

1,8

Altura(m)

Slide #150